Министерство Образования РФ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ УПРАВЛЕНИЯ ИНСИТУТ УПРАВЛЕНИЯ В ЭНЕРГЕТИКЕ Кафедра: менеджмент в Международном Топливно-Энергетическом Бизнесе Дисциплина: «Статистика» Семестровое задание Выполнил студент Очной формы обучения Специальности менеджмент организации Специализации
МТЭБ 2 курса группы МТЭБ Ромашин А.Е. (подпись) Руководитель Токарева И.С. (подпись) (инициалы и фамилия) Москва 1. Пользуясь таблицей случайных чисел, выписать данные для 30 предприятий по факторному и результативному признаку согласно варианту. Выполнить проверку на однородность и нормальность распределения по факторному признаку. Исключить резко выделяющиеся предприятия из массы первичной информации.
Данные по 30 предприятиям: № предприятия Уровень механизации труда, % (x) Процент выполнения норм выработки, % (y) 1 77,4 103,3 2 76,0 102,1 3 78,9 102,2 4 79,4 102,9 5 80,0 102,7 6 82,0 101,7 7 85,0 101,6 9 84,0 101,4 10 84,6 101,5 11 77,8 101,9 12 73,0 103,8 14 75,5 101,6 15 76,7 102,5 16 77,8 102,6 19 74,4 104,5 20 74,3 104,9 21 74,5 104,8 22 76,0 104,7 25 85,0 102,0 26 72,9 102,1 27 70,0 105,0 28 73,2 105,2 29 70,3 106,4 33 76,0 104,0 34 75,0 106,0 35 75,6 105,0 37 73,0 106,2 38 76,4 106,3 39 78,2 106,4 46 72,0 105,0 Уровень механизации труда, % (x)–факторный признак, Процент выполнения норм выработки, % – результативный признак Проверка первичной информации на однородность производится с помощью коэффициента вариации.
На практике считается, что если этот коэффициент менее 40%, то совокупность однородная. Составим таблицу для вычисления средней арифметической и среднего квадратического отклонения: № предприятия x 27 70,0 46,65 29 70,3 42,64 46 72,0 23,33 26 72,9 15,44 12 73,0 14,67 37 73,0 14,67 28 73,2 13,18 20 74,3 6,40 19 74,4 5,90 21 74,5 5,43 34 75,0 3,35 14 75,5 1,77 35 75,6 1,51 2 76,0 0,69 22 76,0 0,69 33 76,0 0,69 38 76,4 0,18 15 76,7 0,02 1 77,4 0,32 11 77,8 0,94 16 77,8 0,94 39 78,2 1,88 3 78,9 4,28 4 79,4 6,60 5 80,0 10,05 6 82,0 26,73 9 84,0 51,41 10 84,6 60,37 7 85,0 66,75 25 85,0 66,75 Сумма 2304,9 494,24 Рассчитаем коэффициент вариации: – средняя арифметическая, – среднее квадратическое отклонение, =4,06/76,83*100%=5,28 %. < 40%, исходный массив данных по факторному признаку можно считать однородным. Исключение из массива первичной информации всех резко выделяющихся единиц по уровню факторного признака производится по правилу "трех сигм": исключаются все единицы, у которых уровень признака-фактора не попадает в интервал: , где Интервал для значения факторного признака (Уровень механизации труда): 76,83-3*4,06 xi  76,83+3*4,06 или 64,65  xi  89,00
Для первичных данных этот интервал: 64,65 – 89,00. В интервал попадают значения факторного признака всех предприятий, т.е. исключать предприятия не требуется. 2. Получив однородный массив, выполнить группировку, характеризующую зависимость результативного признака от факторного. Построить ряд распределения с равными интервалами по х, рассчитав величину интервала и число групп по формуле Стерджесса. Определить показатели центра распределения, показатели вариации,
асимметрии и эксцесса. Сформулировать выводы. При построении интервального вариационного ряда число групп определяется по формуле Стерджесса: m = 1+3,322*lgn n – общее число единиц совокупности, в n=30 (по условию задания) m= 1+ 3,322*lg30= 5 Величина интервала i определяется по формуле: – размах колебания (варьирования) признака. Уровень механизации труда, % (x) Число предприятий, частота интервала, f Накопленные частоты
Середина интервала, % % 70-73 6 6 71,5 429 73-76 10 16 74,5 745 76-79 7 23 77,5 542,5 79-82 3 26 80,5 241,5 82-85 4 30 83,334 Итого 30 2292 Для характеристики среднего значения признака в вариационном ряду применяются: средняя арифметическая, медиана, мода. Средняя арифметическая для интервального ряда распределения средняя арифметическая определяется по формуле: где – середина соответствующего интервала значения признака. Мода – наиболее часто встречающееся значение признака. В интервальном ряду определяется модальный интервал (имеет наибольшую частоту). Значение моды определяется по формуле: – нижняя граница модального интервала, – частота модального интервала, – частота интервала, предшествующего модальному, – частота интервала, следующего за модальным. Модальный интервал – второй (73-76), т.к. он имеет наибольшую частоту (10). Mo=74.714% Медиана соответствует варианту, стоящему в середине ранжированного ряда.
Положение медианы определяется ее номером: n – число единиц совокупности. Медианным является первый интервал, в котором сумма накопленных частостей превысит половину общего числа наблюдений, т.е. 15. Численное значение медианы определяется по формуле: – нижняя граница медианного интервала, – накопленная частота интервала, предшествующего медианному, – величина интервала, – частота медианного интервала. Медианный интервал – второй (73-76), т.к. это первый интервал, в котором величина
накопленных частот больше 15. Для характеристики размера вариаций признака используются а) абсолютные показатели: 1) размах колебаний – максимальное и минимальное значение признака. R = 85-70=15 %. 2) среднее линейное отклонение: 1) среднее квадратическое отклонение и дисперсия: и Составим таблицу для расчета этих показателей: Уровень механизации труда, % Число предприятий, Середина интервала, % 70-73 6 71,5 31,98 5,33 28,4 73-76 10 74,5 23,30 2,33 5,43 76-79 7 77,5 4,69 0,67 0,45 79-82 3 80,5 11,01 3,67 13,47 82-85 4 83,5 26,68 6,67 44,49
Итого 30 97,66 92,24 d=3.255%  2 = 3,195 % б) относительные показатели, наиболее часто из которых используется коэффициент вариации: если он не превышает 40%, то совокупность считается однородной. % Симметричным является распределение, в котором частоты двух любых вариантов, равноотстоящих по обе стороны от центра распределения, равны между собой. Рассчитаем относительный показатель асимметрии: Он принимает положительное значение, это говорит о правосторонней асимметрии. Т.е. на графике распределения правая ветвь относительно максимальной ординаты вытянута больше, чем левая. Средняя квадратическая ошибка показателя As: Асимметрия несущественна, т.к. выполняется неравенство: <3 Рассчитаем показатель эксцесса (островершинности распределения): Составим таблицу для расчета показателя эксцесса:
Уровень механизации труда, % Число предприятий, Середина интервала, % 70-73 6 71,5 3690,00 73-76 10 74,5 294,73 76-79 7 77,5 1,41 79-82 3 80,5 544,23 82-85 4 83,5 7917,05 Итого 30 12447.43 Т.к. величина эксцесса отрицательна, то распределение плосковершинное. Рассчитаем среднеквадратическую ошибку эксцесса: >3, следовательно эксцессу свойствен распределению признака в генеральной совокупности. Вывод: произведя группировку 30-и предприятий по признаку удельному весу технико-обоснованных норм, мы получили 5 групп предприятий.
Среднее значение уровня механизации труда по этим предприятиям составляет 76,83 %, а индивидуальные значения изменяются от 70 до 85,0. Наиболее часто встречающееся значение уровня механизации труда (мода) – 74,714 %. Варианту, стоящему в середине ранжированного ряда соответствует значение 75,85 % (медиана). Размах вариации составляет 15,0. В среднем каждое значение признака отклоняется от среднего значения по группе на 3,25 (по среднему линейному отклонению), на 3,195 по среднему квадратическому отклонению.
Совокупность данных можно считать однородной, т.к. коэффициент вариации принимает значение меньше 5%. Распределение предприятий по факторному признаку имеет правостороннюю асимметрию, и она существенна. Распределение предприятий по удельному весу технико-обоснованных норм является островершинным, т.к. показатель эксцесса принимает положительное значение. 3. Используя ранее выполненную группировку, проверить правило сложения дисперсий и сделать выводы о степени влияния факторного признака на величину результативного. Общая дисперсия характеризует вариацию результативного признака (процента выполнения норм выработки) под влиянием всех факторов, формирующих уровень признака у единиц совокупности данных. Она определяется по формуле: № предприятия x y 9 84,0 101,4 5,18 10 84,6 101,5 4,74 14 75,5 101,6 4,31 7 85,0 101,6 4,31 6 82,0 101,7 3,91 11 77,8 101,9 3,16 25 85,0 102,0 2,81 26 72,9 102,1 2,49 2 76,0 102,1 2,49 3 78,9 102,2 2,18 15 76,7 102,5 1,39 16 77,8 102,6 1,16 5 80,0 102,7 0,95 4 79,4 102,9 0,60 1 77,4 103,3 0,14 12 73,0 103,8 0,02 33 76,0 104,0 0,10 19 74,4 104,5 0,68 22 76,0 104,7 1,05 21 74,5 104,8 1,26 20 74,3 104,9 1,50 27 70,0 105,0 1,75 46 72,0 105,0 1,75 35 75,6 105,0 1,75 28 73,2 105,2 2,32 34 75,0 106,0 5,40 37 73,0 106,2 6,37 38 76,4 106,3 6,88 29 70,3 106,4 7,41 39 78,2 106,4 7,41 Итого 2304,9 3110,3 85,47 Вариация величины процента выполнения норм выработки под влиянием всех факторов,
ее формирующих составляет 2,849. Межгрупповая дисперсия отражает систематическую вариацию результативного признака (процента выполнения норм выработки), т.е. те различия, которые возникают под влиянием фактора, положенного в основу группировки (Уровень механизации труда). Она определяется по формуле: Сгруппируем предприятия по величине уровня механизации труда (группировка произведена в пункте 2): Уровень механизации труда, %
Число предприятий, Значения процента выполнения норм выработки, % % Процент выполнения норм выработки, % 70-73 6 105,0 106,4 105,0 102,1 103,8 106,2 628,5 104,75 6,91 73-76 10 105,2 104,9 104,5 104,8 106,0 101,6 105,0 102,1 104,7 104,0 1042,8 104,28 3,64 76-79 7 106,3 102,5 103,3 101,9 102,6 106,4 102,2 725,2 103,6 0,04 79-82 3 102,9 102,7 101,7 307,3 102,4 4,89 82-85 4 101,4 101,5 101,6 102,0 406,5 101,6 17,26 Итого 30 – 3110,3 32,73 Вариация величины процента выполнения норма выработки под влиянием уровня механизации труда рабочих на этих предприятиях составляет 1,091. Средняя внутригрупповая дисперсия характеризует случайную вариацию результативного признака, возникающих под влиянием других, неучтенных факторов и не зависит от признака-фактора, положенного в основу группировки. Она определяется по формуле: Уровень механизации труда, % Значения процента выполнения норм выработки, % Процент выполнения норм выработки, % Внутригрупповая дисперсия, 70-73 105,0 106,4 105,0 102,1 103,8 106,2 104,75 2,1458 73-76 105,2 104,9 104,5 104,8 106,0 101,6 105,0 102,1 104,7 104,0 104,28 1,7216 76-79 106,3 102,5 103,3 101,9 102,6 106,4 102,2 103,6 3,1829 79-82 102,9 102,7 101,7 102,4 0,2756 82-85 101,4 101,5 101,6 102,0 101,6 0,0519 Итого 30 – – Правило сложения дисперсий: 2,85=1,091+0,036 – выполняется
Рассчитаем показатель: *100% =1,091/2,85 *100%=38,3% Вывод: Правило сложения дисперсий выполняется. Изменение уровня механизации труда на 38,3% объясняет изменение значения процента выполнения норм выработки на предприятиях, а другие 61,7% вариации объясняются неучтенными факторами. 4. Выявить факт наличия связи между x и y. Определить степень тесноты связи с помощью линейного коэффициента корреляции.
Анализ выполнить в следующей последовательности: • установить факт наличия корреляционной зависимости с помощью групповой таблицы и ее направление; дать графическое изображение связи; На основании рабочей таблицы из пункта 3 составим групповую таблицу: Зависимость процента выполнения норм выработки предприятия от уровня механизации труда работников: Уровень механизации труда, %. Среднее значение уровня механизации труда, %
Процент выполнения норм выработки, % 70-73 71,5 104,75 73-76 74,5 104,28 76-79 77,5 103,6 79-82 80,5 102,4 82-85 83,5 101,6 По данным групповой таблицы видим, что с ростом среднего значения уровня механизации труда в группе, значение процента выполнения норм выработки по группе в целом возрастает. График связи. • измерить степень тесноты связи с помощью линейного коэффициента корреляции и корреляционного отношения; проверить возможность использования линейной функции в качестве формы уравнения; Измерим степень тесноты связи между удельным весом технико-обоснованных норм и средней выработкой предприятия с помощью линейного коэффициента корреляции. Формула для расчета линейного коэффициента корреляции: x – уровень механизации труда; y – процент выполнения норм выработки; n =30 – число единиц совокупности; Линейный коэффициент корреляции принимает значения от -1 до +1, чем ближе он по модулю к 1, тем теснее считается связь. Таблица для расчета линейного коэффициента корреляции: № предприятия 27 70,0 105,0 4900,00 11025,00 7350,00 29 70,3 106,4 4942,09 11320,96 7479,92 46 72,0 105,0 5184,00 11025,00 7560,00 26 72,9 102,1 5314,41 10424,41 7443,09 12 73,0 103,8 5329,00 10774,44 7577,40 37 73,0 106,2 5329,00 11278,44 7752,60 28 73,2 105,2 5358,24 11067,04 7700,64 20 74,3 104,9 5520,49 11004,01 7794,07 19 74,4 104,5 5535,36 10920,25 7774,80 21 74,5 104,8 5550,25 10983,04 7807,60 34 75,0 106,0 5625,00 11236,00 7950,00 14 75,5 101,6 5700,25 10322,56 7670,80 35 75,6 105,0 5715,36 11025,00 7938,00 2 76,0 102,1 5776,00 10424,41 7759,60 33 76,0 104,0 5776,00 10816,00 7904,00 22 76,0 104,7 5776,00 10962,09 7957,20 38 76,4 106,3 5836,96 11299,69 8121,32 15 76,7 102,5 5882,89 10506,25 7861,75 1 77,4 103,3 5990,76 10670,89 7995,42 11 77,8 101,9 6052,84 10383,61 7927,82 16 77,8 102,6 6052,84 10526,76 7982,28 39 78,2 106,4 6115,24 11320,96 8320,48 3 78,9 102,2 6225,21 10444,84 8063,58 4 79,4 102,9 6304,36 10588,41 8170,26 5 80,0 102,7 6400,00 10547,29 8216,00 6 82,0 101,7 6724,00 10342,89 8339,40 9 84,0 101,4 7056,00 10281,96 8517,60 10 84,6 101,5 7157,16 10302,25 8586,90 7 85,0 101,6 7225,00 10322,56 8636,00 25 85,0 102,0 7225,00 10404,00 8670,00
Итог 2304,9 3110,3 177579,71 322551,01 238828,53 Т.к. r<0, то связь между факторным и результативным признаком обратная, т.е. с ростом уровня механизации труда рабочих растет Процент выполнения норм выработки на 1-го человека, т.к. коэффициент >0,5, то эта связь достаточно тесная. Такое значение корреляционного отношения говорит о том, что изменение результативного признака во многом объясняется вариацией факторного признака. О возможности применения линейной модели для описания зависимости процента выполнения норм выработки от уровня механизации труда можно говорить, если выполняется следующее неравенство |0,383 – 0,437|= 0,054<0,1 Следовательно гипотеза о линейной модели связи принимается. • рассчитать параметры уравнения регрессии; оценить его достоверность, используя среднюю квадратическую ошибку. Дать оценку результатов исследования в целом. Для определения параметров a и b уравнения прямолинейной
корреляционной связи надо решить систему уравнений: Модель связи: В качестве меры достоверности уравнения корреляционной зависимости используется процентное отношение средней квадратической ошибки уравнения (S e) к среднему уровню результативного признака: S e  *100 %, y где -ошибка уравнения регрессии 1 – число параметров в уравнении регрессии. Если это отношение не превышает 10-15%, то можно считать, что уравнение регрессии достаточно
хорошо отображает изучаемую связь. Составим таблицу для расчета этого отношения: № предприятия 27 70,0 105,0 105,32 0,10 29 70,3 106,4 105,25 1,33 46 72,0 105,0 104,83 0,03 26 72,9 102,1 104,61 6,31 12 73,0 103,8 104,59 0,62 37 73,0 106,2 104,59 2,60 28 73,2 105,2 104,54 0,44 20 74,3 104,9 104,27 0,40 19 74,4 104,5 104,25 0,06 21 74,5 104,8 104,22 0,33 34 75,0 106,0 104,10 3,61 14 75,5 101,6 103,98 5,65 35 75,6 105,0 103,95 1,09 2 76,0 102,1 103,86 3,08 33 76,0 104,0 103,86 0,02 22 76,0 104,7 103,86 0,71 38 76,4 106,3 103,76 6,46 15 76,7 102,5 103,69 1,40 1 77,4 103,3 103,51 0,05 11 77,8 101,9 103,42 2,30 16 77,8 102,6 103,42 0,67 39 78,2 106,4 103,32 9,49 3 78,9 102,2 103,15 0,90 4 79,4 102,9 103,03 0,02 5 80,0 102,7 102,88 0,03 6 82,0 101,7 102,39 0,48 9 84,0 101,4 101,90 0,25 10 84,6 101,5 101,76 0,07 7 85,0 101,6 101,66 0,00 25 85,0 102,0 101,66 0,12 Итого 2304,9 3110,3 3109,60 48,64 Полученное отношение значительно меньше 15%, таким образом, можно сделать вывод, что полученное уравнение очень хорошо отображает связь между признаком-фактором и результативным признаком. Вывод: В ходе изучения парной зависимости процента выполнения норм выработки от уровня механизации труда рабочих на предприятии. В ходе анализа было установлено, что зависимость между признаками обратная, т.е. с возрастанием уровня механизации труда процент выполнения норм выработки в целом снижается. Была принята линейная модель связи y = 122,4-0,244*x. Уравнение регрессии очень хорошо отображает зависимость результативного признака от факторного, т.к. отношение ошибки уравнения S e к среднему уровню результативного признака составляет всего 1,25%. 5. Учитывая, что массив исходных данных является 5- процентной выборочной совокупностью из общего числа
данных определить среднюю величину результативного признака с вероятностью 0,95. Доверительный интервал для генеральной средней (средней величины результативного признака общего числа данных) определяются по формуле: Величина y называется предельной ошибкой выборки и определяется по формуле: y t*y, где y – величина средней квадратической стандартной ошибки t – коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой
гарантируется величина предельной ошибки. При вероятности 0, 954 t= 2 (по таблице Удвоенная нормированная функция Лапласа). Выборка предприятий – случайная и бесповторная. При случайной бесповторной выборке величина средней квадратической ошибки рассчитывается по формуле: 2 =2,85 – выборочная дисперсия для результативного признака (рассчитана в пункте 3 задания), n/N = 0,05, т.к. выборка составляет 5% от генеральной совокупности (n- число единиц в выборке,
N- число единиц в генеральной совокупности). y 2,85/30* (1-0,05) = 0,3 y  2*0,3= 0,6 . Доверительный интервал для генеральной средней: _ _ 103,67– 0,6 < y < 103,67+0,6 или 103,07 < y < 104,27 % Вывод: значение процента выполнения норм выработки для генеральной совокупности предприятий (числом 30/0,05=600предприятий) со степенью надежности (доверительной вероятности), равной 0,954 будет находиться в интервале от 103,07 до 104,27 % Использованная литература и программы: 1. Практикум по общей теории статистики – М.Р. Ефимова, О.И.Ганченко 2. Конспект лекций по статистике – ГУУ – 2004 год 3. Программа математических расчетов Mathcad 2001 professional (график функций на странице 10) 4. Пакетная программа Excel Microsoft Office – упорядочивание данных в каждой таблице 5.
Персональный компьютер 6. Умение все данные собрать воедино.