Введение с статистику

Толстова Мария Общеэкономический факультет, 1 курс вечернее отделение, 911 гр. Введение Стояла задача провести статистический анализ и сравнить положение двух фирм на рынке. Для этого было произведено статистическое наблюдение. Статистическое наблюдение – это начальная стадия экономико-статистического исследования, которая представляет собой научно-организованную работу по получению первичных данных о явлениях и процессах общественной
жизни с помощью оценки и регистрации признаков изучаемой совокупности. Для этого взяли данные (цены акций на торгах и объем торгов) двух фирм и занесли их в таблицу. Сводка статистических данных – вторая стадия статистического исследования; систематизация единичных фактов, позволяющая перейти к обобщающим показателям, относящаяся ко всей изучаемой совокупности, осуществить анализ и прогнозирование изучаемых явлений и процессов.
Статистическая таблица – это способ рационального изложения и обобщения данных о социально-экономических явлениях при помощи цифр, расположенных в определенном порядке. Таблица имеет подлежащее – характеризует объект исследования, в нем дается перечень единиц совокупности либо групп исследуемого объекта по каким-либо существенным признакам, и сказуемое – система показателей, которая характеризует объект исследования. Группировка – распределение единиц изучаемого объекта на
однородные типичные группы по существенным для них признакам. Интервал – значение варьирующего признака, лежащий в определенных границах. Может быть закрытым и открытым. Ряд распределения – это упорядоченное распределение единиц совокупности по определенному варьирующему признаку. Вариационный ряд распределения – ряд по количественному признаку. Интервальный ряд распределения – отражает непрерывную вариацию признака. Формула Стерджесса: i = R/n R = xmax – xmin n = 1+3,322lgN i – размер интервала R – размах вариации x – варьирующий признак n – количество групп N – количество наблюдений И с помощью этой формулы был посчитан размер интервала и сделан интервальный ряд распределения. Далее статистические данные представили графическим методом. Графиками в статистике называют условные изображения числовых величин и их соотношение в виде различных
графических образов, точек, линий, плоских фигур и т.д. Линейные диаграммы широко применяются для характеристики изменения явлений во времени, пространстве или для характеристики связи между явлениями. Для изображения интервальных рядов используется гистограмма распределения – столбиковая диаграмма, ширина которой равна интервалу в интервальном ряду. Соединяя середины вершин столбиков гистограммы, получим полигон распределения.
В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята). Для ее построения, значения варьирующего признака откладывается на оси абсцисс, а на оси ординат помещаются накопленные итоги частот. Если отложить наоборот, то график будет называться огива. Средний показатель – средняя величина – обобщенная количественная характеристика признаков статистической совокупности в конкретных условиях места и времени.
Из средних величин наиболее часто встречаются: – средняя арифметическая простая:&#61 472; i&am p;#61472;n (расчет по несгруппированным данным) – средняя арифметическая взвешенная:  = i fi / fi i – отдельные значения признака, варианты fi – веса каждого варианта Рассчитываем по вариационному ряду и по интервальному ряду распределения среднюю взвешенную величину. Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом отдельном случае. Размах вариации – это разность между максимальным и минимальным значениями признака. Дисперсия – это средняя величина квадратов отклонений от среднего.
Среднее квадратическое отклонение – обобщающая характеристика размеров вариации признаков совокупности, выражается в тех же единицах, что и сам признак. &amp ;#61501;&#61 480;i&#61485 ;&am p;#61490;&#6 1472;n Для сравнения вариации в разных совокупностях рассчитывается относительный показатель вариации, именуемый коэффициентом вариации, представляющий собой процентное
отношение среднего квадратического отклонения к средней арифметической: V = &amp ;#61536;&#61 482;  Совокупность считается однородной, если коэффициент вариации не превышает 33%. Наряду с рассмотренными в качестве характеристик вариационного ряда распределения, рассчитываются структурные средние. Мода [Мо] – значение изучаемого признака, повторяющееся с наибольшей частотой.
Медиана [Me] – значение признака, приходящееся на середину ранжированной, т.е. упорядоченной совокупности. fMo – fMo-1 Mo = x0 + i (fMo – fMo-1) + (fMo – fMo+1) x0 – нижняя граница модального интервала i – величина интервала fМо – частота (встречаемость) модального интервала fМо-1 – частота, предшествующая модальному интервалу fMo+1 – частота последующего модального интервала ½fi – SMe-1 Me = x0 + i fMe x0 – нижняя граница медианного интервала i – величина интервала SMe-1 – накопленная частота интервала, предшествующая медианному 1/2fi – половина суммы все накопленных частот fMe – частота медианного интервала Одной из целей изучения статистических вариационных рядов является выявление закономерности распределения и определение ее характера. Закономерности распределения выражают свойства явления, а так же общие условия, влияющие на формирование вариации признака. При сравнительном изучении симметрии нескольких распределений
с разными единицами измерения вычисляют относительный показатель асимметрии. As = &amp ;#61487;&#61 491; &amp ;#61472;&#61 472;As = (x – Mo) / &amp ;#61472;&#61 472; &amp ;#61472;&
#61472;&#61 472;As = xi -x)3 /  Асимметрия характеризует «скошенность» распределения. Когда длинная часть распределения лежит справа от центра, тогда  будет положительным, так как взвешенная сумма кубов больших положительных отклонений превысит сумму кубов отрицательных отклонений, в противном случае – отрицательным. Эксцесс характеризует «крутость», т.е. островершинность
или плосковершинность распределения. Для нормального закона Es = 0. Более островершинные – положительный эксцесс, Более плосковершинный – отрицательный эксцесс. Это количество вариант, лежащих в интервале равном ½ среднеквадратического отклонения в ту или иную сторону от величины средней в общем количестве вариант данного ряда. Предположили, что имеющиеся две фирмы связаны. При исследовании социально-экономических явлений часто приходится иметь дело со взаимосвязанными показателями. Регрессия – односторонняя статистическая зависимость. Функциональная связь – это вид причинной зависимости, при которой определенному значению факторного признака соответствует одно или несколько точно заданных значений результативного признака. Стохастическая связь – это вид причинной зависимости, проявляющейся не в каждом отдельном случае, а
в общем, в среднем, при большом числе наблюдений. Корреляция – взаимное влияние статистических факторов – стохастическая зависимость между случайными величинами не имеющую строгого функционального характера, при котором изменение одной из случайных величин приводит к изменению другой. Корреляционный анализ имеет своей задачей количественное определение тесноты связей между двумя признаками при парной связи и между несколькими факторами при многофакторной связи.
Коэффициент корреляции представляет количественную характеристику тесноты связи между признаками. Дает возможность определить полезность факторных признаков, в случае если строится уравнение регрессии. Регрессионный анализ заключается в определении аналитического выражения связи, в которой изменение одной величины, называемой зависимой или результативным признаком, обусловлена влиянием одной или нескольких независимых величин или факторов; а множество всех прочих факторов, также оказываемые влияние на зависимую
величину, принимаются за постоянные и средние значения. Корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты, направление связи и установление аналитического выражения формы связи. Рядом динамики называется временная последовательность значений статистических показателей. Основной тенденцией изменения ряда динамики называется тренд – долговременная компонента ряда динамики, она характеризует основную тенденцию его развития. Наиболее эффективным способом выявления основной тенденции развития является аналитическое выравнивание. Методы анализа основных тенденций: 1. Сглаживание или механическое выравнивание 2. Выравнивание с применением кривой, проведенной между конкретным уравнением таким образом, чтобы она отображала тенденцию, присущую ряду. Рассчитываем и строим линии тренда для двух фирм.
Метод скользящей средней. При выявлении тенденции развития этим методом по-особому укрупняются интервалы времени: вместо каждого уровня данного ряда берутся средние из уровней рядом стоящих лет. Полученная средняя охватывает группу из некоторого числа уровней: трех, пяти, семи и т. д в середине которой находится взятый. Вместо каждого такого уровня берется средняя, в которой сглаживаются случайные отклонения. Эта средняя будет скользящей, поскольку период осреднения все время меняется: из него вычитается
один член и прибавляется следующий. В данных, полученных методом скользящих средних, устраняется часть колебаний уровней динамического ряда и их величины становятся более плавными по сравнению с фактическими уровнями. При применении метода скользящей средней большое значение имеет выбор периода или интервала скольжения. Он должен соответствовать периоду колебаний в данном динамическом ряду. Заключение Было произведено статистическое исследование двух фирм, создан интервальный ряд распределения,
данные представили в виде графиков (гистограмма, полигон, кумулята, огива). Эти графики получились похожими. Подсчитан средний показатель, т.е. средняя взвешенная величина и среднее квадратическое отклонение. Для цен закрытия совокупность получилась однородной, а для объемов торгов неоднородной. Произвели расчеты моды и медианы, а также нашли относительный показатель асимметрии и проверили эксцесс с помощью «правила трех сигм». После предположения о взаимосвязи двух фирм, посчитали коэффициент регрессии и корреляции, как и должно быть, они получились одинаковых знаков. Построили линию тренда по старым и новым ценам. Построили скользящее среднее. Совпадение получилось качественным, а не количественным.