–PAGE_BREAK–Таблица 2.3
Таблица для построения интервального ряда распределения
На основе групповых итоговых строк «ВСЕГО» табл. 2.3 формируется итоговая таблица 2.4, представляющая интервальный ряд распределения организаций по размеру выпуска продукции.
Таблица 2.4
Распределение организаций по размеру выпуска продукции
Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 — 6 таблицы 2.5. Это частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj, получаемые путем последовательного суммирования частот всех предшествующих (j
-1) интервалов, и накопленные частости, рассчитываемые по формуле
Таблица 2.5
Структура организаций по размеру выпуска продукции
Вывод.Анализ интервального ряда распределения изучаемой совокупности организаций показывает, что распределение организаций по размеру выпуска продукции не является равномерным: преобладают организации с размером выпускаемой продукции от 40,320 млн. руб. до 55,280 млн. руб. (это 10 организаций, доля которых составляет 33,3 %); 40 % организаций имеют размер выпуска продукции менее 40,320 млн. руб., 60% – более 40,320 млн. руб. Доля организаций с наибольшим размером выпуска продукции (от 66,240 млн. руб. до 79,200 млн. руб.) составляет всего 10 % (3 организации). Доля организаций с наименьшим размером выпуска продукции (от 14,400 млн. руб. до 27,300 млн. руб.) составляет 13,3% (4 организации).
2. Построение графиков полученного ряда распределение. Графическое определение моды и медианы.
Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.
В интервальном вариационном ряду модой Мо приближенно считается центральное значение модального интервала (имеющего наибольшую частоту).
Моду можно определить графическим методом по гистограмме (рис. 1). Гистограмма – столбиковая диаграмма. Она позволяет визуально оценить симметричность распределения, его близость к нормальному.
Рис. 1
Конкретное значение моды для интервального ряда рассчитывается по формуле:
, где
хМo– нижняя граница модального интервала (интервала, в который входит значение моды),
h– величина модального интервала,
fMo– частота модального интервала,
fMo-1– частота интервала, предшествующего модальному,
fMo+1 –частота интервала, следующего за модальным.
Согласно таблицы 2.4 модальным интервалом построенного ряда является интервал 40,320 – 55,280 млн. руб., так как его частота максимальна (f
3= 10).
Вывод.Для рассматриваемой совокупности организаций наиболее распространенный размер выпуска продукции характеризуется средней величиной 44 032 тыс. руб.
Медиана Ме– это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Медиану можно определить графическим методом по кумулятивной кривой (рис. 2). Кумулята строится по накопленным частотам (табл. 2.5, графа 5). Она начинается с нижней границы 1-ого интервала (14,400 млн. руб.) Накопленная частота откладывается в верхней границе интервала.
Рис. 2
Конкретное значение медианы для интервального ряда рассчитывается по формуле:
, где
хМе – нижняя граница интервала в который входит медиана,
h– величина интервала, в который входит медиана;
– сумма всех частот ряда (объем выборочной совокупности);
fМе– частота медианного интервала;
SMе-1– сумма частот, накопившихся до начала медианного интервала.
Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из таблицы 2.5 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины).
Медианным интервалом является интервал 40,320 – 55,280 млн. руб., так как именно в этом интервале накопленная частота S3 = 22 впервые превышает величину, равную половине численности единиц совокупности (0,5*30 = 15).
Вывод.В рассматриваемой совокупности организаций половина организаций имеют размер выпуска продукции не более 44 208 тыс. руб., а другая половина – не менее 44 208 тыс. руб.
3. Расчет характеристик интервального ряда распределения
Для расчета характеристик ряда распределения , σ, Vσна основе таблицы 2.5 строится вспомогательная таблица 2.6 (– середина j-го интервала).
Расчет средней арифметической взвешенной:
Таблица 2.6
Расчетная таблица для нахождения характеристик ряда распределения
Среднее квадратическое отклонение характеризует абсолютный размер колеблемости признака около средней.
Расчет среднего квадратического отклонения:
Расчет дисперсии:
Коэффициент вариации является мерой относительной колеблемости признака около средней и характеризует степень однородности признака в изучаемой совокупности.
Расчет коэффициента вариации:
Вывод.Анализ полученных значений показателей и σ говорит о том, что средний выпуск продукции организаций составляет 44 640 тыс. руб., отклонение от среднего размера выпуска продукции в ту или иную сторону составляет в среднем 14 966 тыс. руб. (или 33,6%), наиболее характерные значения среднего выпуска продукции организаций находятся в пределах от 29 644 тыс. руб. до 59,636 тыс. руб. (диапазон ).
Значение коэффициента вариации превышает 33,3%, следовательно, вариация среднего выпуска продукции организаций в исследуемой совокупности весьма значительна и совокупность по данному признаку качественно неоднородна и ее следует разгруппировать.
= 44 640 тыс. руб., Мо = 44 023 тыс. руб., Ме = 44 208 тыс руб.
Расхождение между значениями , Мо и Ме незначительно, что все же говорит об однородности совокупности организаций.
> Me> Mo
,т.е. ассиметрия правосторонняя, вершина распределения сдвинута немного влево (в совокупности чаще встречаются более низкие значения выпуска продукции).
4.Вычисление средней арифметической по исходным данным
Для расчета применяется формула средней арифметической простой:
,
Причина расхождения средних величин, рассчитанных по формулам средней арифметической простой и взвешенной, заключается в том, что по формуле средней арифметической простой средняя определяется по фактическим значениям исследуемого признака для всех 30-ти организаций, а по формуле средней арифметической взвешенной средняя вычисляется для интервального ряда, когда в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным (за исключением случая равномерного распределения значений признака внутри каждой группы).
Задание 2
Выявление наличия корреляционной связи между признаками, установление направления связи и измерение ее тесноты.
По исходным данным (табл. 2.1.):
1. Установите наличие и характер связи между признаками – среднегодовая стоимость основных производственных фондов и выпуск продукции, образовав пять групп с равными интервалами по обоим признакам, методами:
а) аналитической группировки,
б) корреляционной таблицы.
2. Измерьте тесноту корреляционной связи между названными признаками с использованием коэффициента детерминации и эмпирического корреляционного отношения.
Сделайте выводы.
Выполнение Задания 2
Целью выполнения Задания 2является выявление наличия корреляционной связи между факторным и результативным признаками, установление направления связи и оценка ее тесноты.
Факторным является признак Среднегодовая стоимость основных производственных фондов X, результативным –признак Выпуск продукцииY.
1. Установление наличия и характера связи между признаками Среднегодовая стоимость ОПФи Выпуск продукции методом
а) аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х (среднегодовая стоимость ОПФ) и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y (выпуск продукции). Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками Xи Y имеет место корреляционная связь.
Построим ряда с равными интервалами для признака Среднегодовая стоимость ОПФ величина интервала hопределяется по формуле:
, где
При i= 8,985 млн. руб.границы интервалов ряда распределения организаций по среднегодовой стоимости основных производственных фондовимеют следующий вид (табл. 2.7):
Таблица 2.7
Границы групп распределения организаций по
среднегодовой стоимости ОПФ
Для построения интервального ряда необходимо подсчитать число организаций, входящих в каждую группу (частоты групп).
Процесс группировки организаций по среднегодовой стоимости основных производственных фондов представлен во вспомогательной таблице 2.8.
продолжение
–PAGE_BREAK–Таблица 2.8
Таблица для построения интервального ряда распределения и аналитической группировки
Используя разработочную таблицу 2.8., строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – Среднегодовая стоимость ОПФи результативным признаком Y–Выпуск продукции.
Групповые средние значения получаем из таблицы 2.8. (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 2.9.
Таблица 2.9.
Зависимость объема выпуска продукции от среднегодовой стоимости ОПФ
Номер группы
Группы организаций по среднегодовой стоимости ОПФ, млн. руб.
Количество организаций,
fj
Выпуск продукции, млн. руб.
Y
всего
в среднем на одну организацию,
1
2
3
4
5=4:3
1
16,000 — 24,985
3
56,0
18,67
2
24,985 — 33,969
4
117,3
29,33
3
33,969 — 42,954
12
490,9
40,91
4
42,954 — 51,938
7
382,5
54,64
5
51,938 — 60,923
4
283,8
70,96
Итого
30
1330,54
Вывод. Анализ данных таблицы 2.9 показывает, что с увеличением среднегодовой стоимости ОПФ от группы к группе систематически возрастает и выпуск продукции по каждой группе организаций, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
б) Применение метода корреляционной таблицы.
Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку Х, а графы – группировке единиц по результативному признаку Y. На пересечении j-ой строки и k-ой графы указывается число единиц совокупности, входящих в j-ый интервал по факторному признаку и в k-ый интервал по результативному признаку. Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему. Расположение частот по диагонали от правого верхнего угла к левому нижнему говорит об обратной связи.
Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y. Величина интервала и границы интервалов для факторного признака Х – Среднегодовой стоимости ОПФ известны из табл. 2.9. Результативного признака Y – Выпуск продукции из таблицы 2.4.
Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 2.10).
Таблица 2.10
Корреляционная таблица зависимости выпуска продукции организаций от среднегодовой стоимости ОПФ
Вывод. Анализ данных табл. 2.10 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между среднегодовой стоимостью ОПФ и объемом выпускаемой продукции.
2. Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .
Эмпирический коэффициент детерминации оценивает, насколько вариация результативного признака Y (выпуск продукции) объясняется вариацией фактора Х (среднегодовая стоимость основных производственных фондов). Остальная часть вариации Y объясняется вариацией прочих факторов. Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, где
– общая дисперсия признака Y;
– межгрупповая (факторная) дисперсия признакаY.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =, а при наличии функциональной связи между ними – равенство = 1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Yфакторов (систематических и случайных). Этот показатель вычисляется по формуле:
, где
yi– индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n– число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности. Была вычислена в задании 1, п. 4.
Для расчета общей дисперсии применяется таблица 2.11. продолжение
–PAGE_BREAK–
Таблица 2.11
Таблица для расчета общей дисперсии
№
организации
Выпуск продукции, млн. руб.
1
2
3
4
5
1
36,450
-7,90
62,43
1329
2
23,400
-20,95
438,96
548
3
56,540
12,19
148,56
3197
4
59,752
15,40
237,18
3570
5
41,415
-2,94
8,62
1715
6
26,860
-17,49
305,95
721
7
79,200
34,85
1214,43
6273
8
54,720
10,37
107,51
2994
9
40,424
-3,93
15,42
1634
10
30,210
-14,14
199,98
913
11
42,418
-1,93
3,74
1799
12
64,575
20,22
409,00
4170
13
51,612
7,26
52,72
2664
14
35,420
-8,93
79,77
1255
15
14,400
-29,95
897,08
207
16
36,936
-7,42
54,99
1364
17
53,392
9,04
81,73
2851
18
41,000
-3,35
11,23
1681
19
55,680
11,33
128,34
3100
20
18,200
-26,15
683,89
331
21
31,800
-12,55
157,54
1011
22
39,204
-5,15
26,50
1537
23
57,128
12,78
163,24
3264
24
28,440
-15,91
253,17
809
25
43,344
-1,01
1,01
1879
26
70,720
26,37
695,31
5001
27
41,832
-2,52
6,35
1750
28
69,345
24,99
624,68
4809
29
35,903
-8,45
71,37
1289
30
50,220
5,87
34,44
2522
Итого:
1330,540
7175,14
66186,36
Общая дисперсия характеризует изменчивость выпуска продукции всей совокупности предприятий Yпод влиянием всех определивших данную вариацию факторов.
Расчет общей дисперсии:
Общая дисперсия может быть также рассчитана по формуле
, где
— средняя из квадратов значений выпуска продукции;
– квадрат средней величины значений выпуска продукции.
Тогда
Межгрупповая дисперсия характеризует возникшую под влиянием факторного признака Х колеблемость в величине исследуемого признака Y(системную вариацию). Воздействие фактора Х на результативный признак Yпроявляется в отклонении групповых средних от общей средней. Показатель вычисляется по формуле:
, где
– групповые средние; — общая средняя;
– число единиц в j-ой группе; k– число групп.
Для расчета межгрупповой дисперсии строим вспомогательную таблицу 2.12. При этом используются групповые средние значения из табл. 2.9 (графа 5).
Таблица 2.12
Вспомогательная таблица для расчета межгрупповой дисперсии
Расчет межгрупповой дисперсии :
Межгрупповая дисперсия характеризует возникшую под влиянием среднегодовой стоимости ОПФ различия в величине выпуска продукции.
Расчет эмпирического коэффициента детерминации :
Вывод.92,0 % вариации выпуска продукции организаций происходит под влиянием среднегодовой стоимости ОПФ, а 8% – под влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле:
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 2.13):
Таблица 2.13
Шкала Чэддока
Вывод. Согласно шкале Чэддока связь между выпуском продукции Yи среднегодовой стоимостью ОПФ Х является весьма тесной.
Задание 3
Применение выборочного метода в финансово – экономических задачах
По результатам выполнения задания 1 с вероятностью 0,683 определите:
1. Ошибку выборки среднего выпуска продукции и границы, в которых будет находиться средний выпуск продукции в генеральной совокупности.
2. Ошибку выборки доли предприятий с выпуском продукции 66,24 млн. руб. и более и границы, в которых будет находиться генеральная доля.
Выполнение Задания 3
Целью выполнения данного Заданияявляется определение для генеральной совокупности организаций границ, в которых будут находиться средний выпуск продукции и доля организаций с выпуском продукции 66,24 млн. руб. и более.
Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок – среднюю и предельную .
Средняя ошибка выборки — это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т.е. от своего математического ожидания M[].
Для бесповторной выборки средняя ошибка выборочной средней определяется по формуле:
. где
– общая дисперсия выборочных значений признаков,
N– число единиц в генеральной совокупности,
n– число единиц в выборочной совокупности.
Предельная ошибка выборкиопределяет границы, в пределах которых будет находиться генеральная средняя:
, где
– выборочная средняя; – генеральная средняя.
Предельная ошибка выборки рассчитывается по формуле:
, где
t– коэффициент доверия, зависящий от вероятностиР, с которой можно гарантировать определенные размеры предельной ошибки
Значения tвычислены заранее для различных доверительных вероятностей Р и протабулированы (таблицы функции Лапласа). При доверительной вероятности Р = 0,683 коэффициент доверия t= 1,0.
По условию выборочная совокупность насчитывает 30 организаций, выборка 20% механическая, следовательно, генеральная совокупность включает 150 организаций. Выборочная средняя , среднее квадратической отклонение определены в задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 2.14:
продолжение
–PAGE_BREAK–