Примеры решения задач по статистике

Вариант3.
1.        Какая шкала называетсяшкалой интервалов? Приведите примеры.
Измерение– это приписывание числовых форм объектам или событиям в соответствии сопределенными правилами (Стивене С… i960, с60) С.Стивенсом предложенаклассификация из 4 типов шкал измерения:
1.        номинативная, илиноминальная, или шкала наименований;
2.        порядковая, илиординальная, шкала;
3.        интервальная, илишкала равных интервалов;
4.        шкала равныхотношений.
Интервальнаяшкала – это шкала,классифицирующая по принципу «больше на определенное количество единиц — меньше на определенное количество единиц». Каждое из возможных значенийпризнака стоит от другого на равном расстоянии.
Можнопредположить, что если мы измеряем время решения задачи в секундах, то это ужеявно шкала интервалов. Однако на самом деле это не так, посколькупсихологически различие в 20 секунд между испытуемым А и Б может быть отнюдь неравно различию в 20 секунд между испытуемыми Б и Г, если испытуемый А решилзадачу за 2 секунды, Б — за 22, В — за 222, а Г — за 242.
Аналогичнымобразом, каждая секунда после истечения полутора минут в опыте с измерениеммышечного волевого усилия на динамометре с подвижной стрелкой, по«цене», может быть, равна 10 или даже более секундам в первыеполминуты опыта. «Одна секунда за год идет» — так сформулировал этооднажды один испытуемый.
Попыткиизмерять психологические явления в физических единицах — волю в способности всантиметрах, а ощущение собственной недостаточности — в миллиметрах и т. п.,конечно, понятны, ведь все-таки это измерения в единицах «объективно»существующего времени и пространства. Однако ни один опытный исследователь приэтом не обольщает себя мыслью, что он совершает измерения по психологическойинтервальной шкале. Эти измерения принадлежат по-прежнему к шкале порядка,нравится нам это или нет (Стивенс С., I960, с.56; Паповян С.С., 1983, с.63;Михеев В.И., 1986, с.28).
Мыможем с определенной долей уверенности утверждать лишь, что испытуемый А решилзадачу быстрее Б, Б быстрее В, а В быстрее Г.
Аналогичнымобразом, значения, полученные испытуемыми в баллах по любой нестандартизованнойметодике, оказываются измеренными лишь по шкале порядка. На самом делеравноинтервальными можно считать лишь шкалы в единицах стандартного отклоненияи процентные шкалы, и то лишь при условии, что распределение значений встандартизующей выборке было нормальным (Бурлачу Л.Ф., Морозов С.М., 1989.с.163, с.101).
Принциппостроения большинства интервальных шкал построен на известном правиле«трех сигм»: примерно 97,7-97,8% всех значений признака принормальном его распределении укладываются в диапазоне М±Зσ[1].Можно построить шкалу в единицах долей стандартного отклонения, которая будетохватывать весь возможный диапазон изменения признака, если крайний слева икрайний справа интервалы оставить открытыми.
Р.Б. Кеттеллпредложил, например, шкалу стеков — «стандартной десятки*. Среднееарифметическое значение в „сырых“ баллах принимается за точкуотсчета. Вправо и влево отмеряются интервалы, равные 1/2 стандартногоотклонения. На рис. 1.1 представлена схема вычисления стандартных оценок иперевода „сырых“ баллов в стены по шкале N 16-факторного личностногоопросника Р.Б. Кеттелла.

/>
\
Рис.1.1. Схема вычисления стандартных оценок (стенов) по фактору N 16-факторного личностного опросника Р.Б.Кеттелла; внизу указаны интервалы в единицах ½ стандартного отклонения
Впринципе, шкалу стенов можно построить по любым данным, измеренным по крайнеймере в порядковой шкале, при объеме выборки п>200 и нормальном распределениипризнака.
2.        Простаяслучайная выборкасостоит из подмножества заданной совокупности (популяции), позволяющего делатьболее или менее точные выводы относительно совокупности в целом.
3.        СРЕДНЕЕАРИФМЕТИЧЕСКОЕ — один из показателей центра распределения для количественных переменных;обозначается x. Представляет собой значение переменной, полученной врезультате деления суммы всех ее значений на объем выборки:
x = ∑ni=1xi/ n,
где xi — значение переменной X с номером i;
n — объем выборки.
Например, для выборки из9 значений — 27, 29, 30, 30, 32, 37, 46, 50, 52 — С.А. будет равно:
x = (27 + 29 + 30 + 32 +37 + 46 + 50 + 52) / 9 = 37.
Если переменная принимаетдискретное значение и ее значения повторяются, С.А. может быть вычислено поформуле:
x = ∑ki=1xifi / ∑ki=1fi,
где xi — значение переменной Х с номером i;
fi — частота, соответствующая значению xi;
k — количество значений переменной;
∑ki=1fi= n — объем выборки.
Для приведенной нижетаблицы:
x = (1 × 15 + 2× 30 + 3 × 40 + 4 × 25 + 5 × 10) / 120 = 2,9 (балла).
значения (xi) 1 2 3 4 5 ∑
частоты (fi) 15 30 40 25 10 120
4.        Объяснить, чтотакое уровень статистической значимости.
Уровеньзначимости – это вероятность того, что мы сочли различия существенными, а онина самом деле случайны.
Когдамы указываем, что различия достоверны на 5%-ом уровне значимости, или при p≤0,05. то мы имеем виду, чтовероятность того, что они все-таки недостоверны, составляет 0,05. Когда мыуказываем, что различия достоверны на 1%-ом уровне значимости, или при p≤0,01, то мы имеем в виду, чтовероятность того, что они все-таки недостоверны, составляет 0,01.
 Еслиперевести все это на более формализованный язык, то уровень значимости — этовероятность отклонения нулевой гипотезы, в то время как она верна.
В статистике величинуназывают статисти́чески зна́чимой, если мала вероятность чистослучайного возникновения её или ещё более крайних величин. Здесь под крайностьюпонимается степень отклонения от нуль-гипотезы. Разница называется «статистическизначимой», если имеются данные, появление которых было бы маловероятно, еслипредположить, что эта разница отсутствует; это выражение не означает, чтоданная разница должна быть велика, важна, или значима в общем смысле этогослова.
Уровень значимости обыкновеннообозначают греческой буквой α (альфа). Популярными уровнями значимостиявляются 5%, 1%, и 0.1%. Если тест выдаёт p-величину меньше α-уровня, тонуль-гипотеза отклоняется. Такие результаты неформально называют «статистическизначимыми». Например, если кто-то говорит что «шансы того, что случившеесяявляется совпадением, равны одному из тысячи», то имеется в виду 0.1 %уровень значимости.
5.        Какинтерпретировать моду, медиану и среднее?
Мода — точка, вкоторой плотность распределения имеет локальный максимум. Распределение можетиметь несколько мод.
МЕДИАНА — один изпоказателей центра распределения для порядковых и количественных переменных;обозначается Ме. Представляет собой значение переменной, которое делитвыборку пополам таким образом, чтобы для 50% объектов из выборки значенияпеременной не превосходили Ме, а для других 50% объектов — были неменьше, чем Ме.
Математи́ческоеожида́ние — понятие среднего значения случайной величины в теории вероятностей.Все рассмотренные характеристики: мода, медиана, средняя арифметическая,среднее взвешенное ѕ являются средними. Они характеризуют центральные тенденцииодномерного распределения.
6.        Квантильнаяшкала – это шкала,условием для построения которой является возможность ранжирования испытуемых повеличине у.
Квантильные ранги имеютпрямоугольное распределение, то есть в каждом интервале квантильнои шкалысодержится одинаковая доля обследованных лиц. Стандартизация тестовых оценокпутем их перевода в квантильную шкалу стирает различия в особенностяхраспределения психодиагностических показателей, так как сводит любоераспределение к прямоугольному. Поэтому с позиции теории измерений квантильныешкалы относятся к шкалам порядка: они дают информацию, у кого из испытуемыхсильнее выражено тестируемое свойство, но ничего не позволяют сказать о том,насколько или во сколько раз сильнее.
7.        Есликоэффициент корреляции по модулю оказывается близким к единице, то исследуемые величины линейнозависимы.
8.        Решитьзадачу, используя критерий Фридмана.
Шести респондентампредъявлялся тест Равенна. Фиксируется время решения каждого задания.Экспериментатор предполагает, что будут найдены статистически значимые различиямежду временем решения первых трёх заданий. Результаты замеров представлены втаблице.
№ п/п
Время решения 1-ого задания теста, сек.
Время решения второго задания теста, в сек.
Время решения третьего задания теста в сек. 1 8 3 5 2 4 15 12 3 6 23 15 4 3 6 6 5 7 12 3 6 15 24 12 Суммы 43 83 53 Средние 7,2 13,8 8,8
Решение
Критерийχ2rФридмана
Назначениекритерия
Критерийχ2r применяетсядля сопоставления показателей, измеренных в трех или более условиях на одной итой же выборке испытуемых.
Критерийпозволяет установить, что величины показателей от условия к условию изменяются,но при этом не указывает на направленность изменений.
Гипотезы
H0: Между показателями, полученными(измеренными) в разных условиях, существуют лишь случайные различия.
H1: Между показателями, полученными вразных условиях, существуют неслучайные различия.
Проранжируемзначения, полученные по трем тестам каждым испытуемым.
Суммарангов по каждому испытуемому должна составлять 6. Расчетная общая сумма ранговв критерии определяется по формуле:
/>
где n — количество испытуемых
 с — количество условий измерения (замеров).
Вданном случае,
6*3*(3+1)/2= 36
Показателивремени решения тестов 1, 2, 3 и их ранги (n=6)
№ п/п
Тест 1
Тест 2
Тест 3
Время решения 1-ого задания теста, сек.
Ранг
Время решения 2-ого задания теста, в сек.
Ранг
Время решения 3-его задания теста в сек.
Ранг 1 8 3 3 1 5 2 2 4 1 15 3 12 2 3 6 1 23 3 15 2 4 3 1 6 3 6 2 5 7 2 12 3 3 1 6 15 2 24 3 12 1 Суммы 43 10 83 16 53 10 Средние 7,2 13,8 8,8
Общаясумма рангов составляет: 10+16+10=36, что совпадает с расчетной величиной.
 
Сформулируемгипотезы.
Н0:Различия во времени, которое испытуемые проводят над решением трех различных тестов,являются случайными.
H1: Различия во времени, котороеиспытуемые проводят над решением трех различных тестов, не являются случайными.
Теперьнам нужно определить эмпирическое значение χ2r, по формуле:
/>
где с- количество условий;
 n — Количество испытуемых;
 T2j — суммы рангов по каждому из условий.
Определимχ2rдля данного случая:
χ2r= ((12/6*3*(3+1))*(100 +256 + 100)) –3*6*(3+1) = 4
Посколькув данном примере рассматриваются три задачи, то есть 3 условия, с=3. Количествоиспытуемых n=6. Это позволяет нам воспользоватьсяспециальной таблицей χ2r, а именно табл. VII-AПриложения I. Эмпирическое значение χ2r=4 при с=3, n=6 точно соответствует уровню значимости р=0,184.
Ответ: Н0отклоняется. ПринимаетсяН1. Различия во времени, которое испытуемые проводят над решениемтрех различных тестов, неслучайны (р=0,184).
9.        Решитьзадачу, используя критерий Розенбаума.
Экспериментатор измерил,используя тест Векслера, показатели интеллекта у двух групп респондентов изгородской и сельской местности. Его интересует вопрос – будут ли обнаруженыстатистические значимые различия в показателях интеллекта. В городской группебыло 11 человек, в сельской – 12.город 96 100 104 104 120 120 120 120 126 130 134 село 76 82 82 84 88 96 100 102 Ё04 110 118 120
 
Решение
Таблица1.
Индивидуальныезначения вербального интеллекта в выборках городских (n1=11) и сельских (n2=12)респондентовГород Показатель вербального интеллекта Село Показатель вербального интеллекта 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 96 100 104 104 120 120 120 120 126 130 134 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 76 82 82 84 88 96 100 102 104 110 118 120
Упорядочимзначения в обеих выборках, а затем сформулируем гипотезы:
H: горожанене превосходят сельчан по уровню вербального интеллекта.
H1: горожанепревосходят сельчан по уровню вербального интеллекта.

Таблица2
Упорядоченныепо убыванию вербального интеллекта ряды индивидуальных значений в двух выборках1 ряд – горожане 2 ряд – сельчане
1
2
3
134
130
126
S1
4
5
6
7
8
9
10
11 .
120
120
120
120
104
104
100
96
1
2
3
4
5
6
7
120
118
110
104
102
100
96
8
9
10
11
12
88
84
82
82
76
S2
Каквидно из табл. 2, мы правильно обозначили ряды: первый тот, что»выше” — ряд горожан, а второй, тот, что «ниже” — ряд сельчан. Потабл. 2. определяем количество значений первого ряда, которые большемаксимального значения второго ряда: S1=3. Теперьопределяем количество значений второго ряда, которые меньше минимальногозначения первого ряда: S2=5. Вычисляем по формуле:
Qэмп =S1+S2=3 + 5 =8
Потабл.1 Приложения 1 определяем критические значения Q для n1=11, n2=12;
Правило отклонения Н0в принятия Н1
Если эмпирическое значение критерия равняется критическому значению,cответствующему р≤0,05 или превышает его, то Н0отклоняется, но мы еще не можем определенно принять Н1.
Если эмпирическое значение критерия равняется критическому значению, соответствующему р≤0,01 или превышает его, то Н0отклоняется и принимаетсяH1.
 
/>
Рис1. ось значимости для критерии QРазенбаума
Эмпирическоезначение критерия попадает в область между Q0,05 и Q0,01. Это зона»неопределенности”: мы уже можем отклонить гипотезу о недостоверностиразличий (Н0), но еще не можем принять гипотезы об их достоверности(H1).
Ответ: мы уже можем отклонить гипотезу онедостоверности различий интеллекта между городскими и сельскими жителями(Н0),но еще не можем принять гипотезы об их достоверности (H1).
10.     Какрассчитать коэффициент корреляции Спримена, если мы имеем одинаковые ранги?
Посколькув обоих сопоставляемых ранговых рядах присутствуют группы одинаковых рангов,перед подсчетом коэффициента ранговой корреляции необходимо внести поправки наодинаковые ранги Та и Тb:
Та=∑(а3-а)/12
Тb=∑(b3-b)/12
где a — объем каждой группы одинаковыхрангов в ранговом ряду А,
 b — объем каждой группы одинаковыхрангов в ранговом ряду В.
Дляподсчета эмпирического значения гs используем формулу:
rs=1-6/>
Прибольших количествах одинаковых рангов изменения rs могут оказаться гораздо болеесущественными. Наличие одинаковых рангов означает меньшую степеньднфферентдкрованностк упорядоченных переменных и, следовательно, меньшуювозможность оценить степень связи между ними.