Область прогноза для однофакторной и двухфакторной модели. Точечный прогноз на основании линейной прогрессии

Министерство образования и науки Украины
Донбасская государственная машиностроительная академия
 
 
 
 
 
 
 
 
 
 
 
 
Контрольная работа
по дисциплине: «Эконометрика»
Выполнил:
студентгр. ПВ 09-1з
ИзмайловА.О.
Проверила:
ГетьманИ.
Краматорск 2010

1. Теоретическийвопрос
Область прогноза дляоднофакторной и двухфакторной модели. Точечный прогноз на основании линейнойпрогрессии.
Область прогнозовнаходится так: среди выборочных х находят xmin и xmax.Отрезок прямой, заключенный между ними называется областью прогнозов./> />  

Прогнозируемыйдоверительный интервал для любого х такой />.
Совокупностьдоверительных интервалов для всех х из области прогнозов образует доверительнуюобласть, которая представляет область заключения между двумя гиперболами. Наиболееузкое место в точке />./> />  
 
 
 

Прогноз для произвольногох дает интервал, в который с вероятностью g попадает неизвестное />. Т.е. прогноз при заданном х составит от /> до /> с гарантией />.

Максимальная ошибкапрогноза.
Выборочные значения yiравны />, где /> коэффициенты регрессии для всейгенеральной совокупности, /> -случайная величина, значение которой мы определить не можем, так как не знаем />.
Для неизвестныхкоэффициентов /> могут бытьнайдены доверительные интервалы, в которые с надежностью g попадают />: />,/>.
Геометрический смыслкоэффициента /> – ординатапересечения прямой регрессии с осью 0Y, коэффициента /> – угловой коэффициент прямой регрессии. Вследствиеэтого возникает следующая ситуация:
/>
Истинная прямая регрессииможет с вероятностью gзанимать любое положение в доверительной области.
Наиболее максимальноеотклонение от расчетного значения — /> или />. Найдем ошибку прогноза для каждого из значений:
/>, />.

Т.е. максимальная ошибкапрогноза в процентах составляет: />, т.е. чем больше полуширина доверительногоинтервала, тем больше ошибка. Ширина доверительного интервала возрастает сростом коэффициента доверия и уменьшается с ростом объема выборки со скоростью />. Т.е. увеличив объем выборки в 4раза, в 2 раза сузим доверительный интервал, т.е. в 2 раза уменьшим ошибкупрогноза. С уменьшением коэффициента доверия уменьшается ошибка прогноза, норастет вероятность того, что истинное значение не попадет в доверительныйинтервал.Прогноз на основании линейноймодели для двуфакторной модели.
Целью регрессионногоанализа является получение прогноза с доверительным интервалом. Прогнозделается по уравнению регрессии
/>(1)
Точка прогноза /> из p-мерного пространствас координатами /> выбираетсяиз области прогноза. Если, например, модель двухфакторная />, то область прогноза определяетсяпрямоугольником, представленным на рис. 1./> />  

Рис. 1

Т.е. область прогноза определяется системой неравенств:
/>
Чтобы получить формулудля вычисления полуширины d доверительного интервала, нужно перейти к матричной форме записиуравнения регрессии.Матричная запись многофакторнойрегрессии
Данные для построенияуравнения регрессии, сведем в таблицу:
Таблица1№ набл Y
X1
X2 …
Xp 1
y1
x11
x12
x1p 2
y2
x21
x22
x2p … n
yn
xn1
xn2
xnp
/>(2)
Подставляя в уравнение (2)значения из каждой строки таблицы, получим n уравнений.
/>(2)

ei – случайныеотклонения (остатки), наличие которых объясняется тем, что выборочные точки неложатся в точности на плоскость (1), а случайным образом разбросаны вокруг нее.
/>
Чтобы записать систему(2) в матричном виде, вводим матрицу X, составленную из множителей прикоэффициентах b1, b2, …, bp.
Матрица />. Размерность матрицы n?p+1.
Еще вводятся матрицы:
Вектор столбец />, />, />,размерностью n?1.
Тогда в матричной формеуравнение регрессии записывается так:
/>.
Полуширина доверительногоинтервала рассчитывается по формуле:
/>,
где /> – среднее квадратическое отклонениеостатков;
/> – критическая точка распределения Стьюдента,соответствующая уровню доверия g=(0.95, 0.99, 0.999) и степени свободы k=n-p-1.
вектор /> точка из области прогноза.
2. Задача
Найдите коэффициентэластичности для указанной модели в заданной точке x. Сделать экономическийвывод.
/> 
X=1
1.               Найдемпроизводную функции />,/>
2.               Найдемэластичность. />, тогда/>
3.                Коэффициентэластичности для точки прогноза:
X=1
/>
Коэффициент эластичности показывает,что при изменении фактора X =1 на 1% показатель Y уменьшится на 0,5%.
3. Задача
Для представленных данныхвыполнить следующее задание:
1. Провестиэконометрический анализ линейной зависимости показателя от первого фактора.Сделать прогноз для любой точки из области прогноза, построить доверительнуюобласть. Найти коэффициент эластичности в точке прогноза.
2. Провестиэконометрический анализ нелинейной зависимости показателя от второго фактора,воспользовавшись подсказкой. Сделать прогноз для любой точки из областипрогноза, построить доверительную область. Найти коэффициент эластичности вточке прогноза.
3.Провести эконометрический анализ линейной зависимости показателя от двухфакторов. Сделать точечный прогноз для любой точки из области прогноза. Найтичастичные коэффициенты эластичности в точке прогноза.
Производительность труда,фондоотдача и уровень рентабельности по плодоовощным консервным заводам областиза год характеризуются следующими данными:№ района Фактор Уровень убыточности продукции животноводства % /> Удельный вес пашни в сельскохозяйственных угодьях % Удельный вес лугов и пастбищ % /> /> /> 1 80 20 20
  2 87,2 12,8 37,5
  3 90,8 9,2 43,4
  4 94,7 11,3 45,6
  5 81,4 18,6 23,4
  6 79,2 10,8 25
  7 71,3 28,7 17,2
  8 86,2 13,8 33,3
  9 71,4 28,6 15
  10 77,7 22,9 18,7
  11 75,4 14 24,8
  12 77,9 13 34,5
  13 87,2 12,8 33,1
  14 68,1 25 19,2
  15 86,2 13,8 31,8
 

Нелинейную зависимость принять/>
Обозначим вес пашни в с/х% – Х, уровень убыточности (%) – У. Построим линейную зависимость показателя отфактора. Найдем основные числовые характеристики. Объем выборки n=15 – суммарноеколичество наблюдений. Минимальное значение Х=68,1, максимальное значение Х=94,7,значит, удельный вес пашни меняется от 68,1 до 94,7 %. Минимальное значение У=15,максимальное значение У=46,5, уровень убыточности животноводства от 15 до 46,5%.Среднее значение />. Среднеезначение пашни составляет 80,1%, среднее значение уровня убыточности составляет28,2%. Дисперсия />= 58,83,/>= 92,965.Среднеквадратическое отклонение /> 7,67, значит среднее отклонение пашни от среднегозначения, составляет 7,67%., />9,64,значит среднее отклонение уровня убыточности от среднего значения, составляет 9,64%.Определим, связаны ли Х и У между собой, и, если да, то определить формулусвязи. По таблице строим корреляционное поле (диаграмму рассеивания) – нанесемточки /> на график. Точка скоординатами />=(80; 27,08)называется центром рассеяния. По виду корреляционного поля можно предположить,что зависимость между y и x линейная. Для определения тесноты линейной связинайдем коэффициент корреляции: />=0,88 Так как /> то линейная связь между Х и У достаточная. Пытаемсяописать связь между х и у зависимостью/>. Параметры b0, b1 находим поМНК. /> Так как b1>0,то зависимость между х и y прямая: с ростом пашни уровень убыточностиживотноводства возрастает. Проверим значимость коэффициентов bi.Значимость коэффициента b может быть проверена с помощью критерия Стьюдента:
/> -4,608. Значимость /> равна 0,000490101, т.е практически 0%. Коэффициент b0статистически не значим.
/>6,744. Значимость /> равна 1,375·10-5, т.е 0%, что меньше,чем 5%. Коэффициент b1 статистически значим. Получили модельзависимости уровня пашни от убыточности животноводства />
После того, как былапостроена модель, необходимо проверить ее на адекватность.
Дляанализа общего качества оцененной линейной регрессии найдем коэффициентдетерминации: />=0,777.Разброс данных объясняется линейной моделью на 77,7% и на 22,3% – случайнымиошибками. Качество модели плохое.
Проверимс помощью критерия Фишера.
Дляпроверки найдем величины: />1012,166 и />1012,166. Вычисляем k1=1,k2=13. Находим наблюдаемое значение критерия Фишера />45.48. Значимось этого значения a=1,37610-5,т.е. процент ошибки равен 0%, что меньше, чем 5%. Модель /> считается адекватной с гарантией более 95%.
Найдем прогноз наосновании линейной регрессии. Выберем произвольную точку из области прогноза />, х=80
Рассчитываем прогнозныезначения по модели для всех точек выборки и для точки прогноза: />
Найдем полуширинудоверительного интервала в каждой точке выборки xпр: />
sе – средне квадратичное отклонение выборочных точек отлинии регрессии
/> 4,72
ty = критическаяточка распределения Стьюдента для надежности g=0,9 и k2=13.
n =15.
/>
или />
xпр – точка из области прогнозов.
Прогнозируемыйдоверительный интервал для любого х такой />, где d(х=80)=10,53, т.е. доверительный интервал для хпр=80составит от 16,55 до 37,61 с гарантией 90%.
Совокупностьдоверительных интервалов для всех х из области прогнозов образует доверительнуюобласть.
Т.е. при пашни 80 % уровеньубытка животноводства составит от 16% до 37,5%.
Найдем эластичность.
Для линейной модели />
/>
Коэффициент эластичности показывает,что при изменении х=80 на 1% показатель y увеличивается на 3,29%.Обозначим пашни в с/х – Х, уровеньубыточности – У. Построим нелинейную зависимость показателя от фактора вида />. Найдем основные числовыехарактеристики. Объем выборки n=15 – суммарное количество наблюдений.
Минимальное значение Х=9.2, максимальноезначение Х=28.7, значит, площадь пашен изменяется от 9.2 до 28.7%. Минимальноезначение У=15, максимальное значение У=45.6, уровень убыточности животноводстваизменяется от 15 до 45.6%. Среднее значение />. Среднее значение пашни составляет 17.02%, среднеезначение уровня убыточности животноводства составляет 28.17%.
Дисперсия />=42.45, />=92.965.
Среднеквадратическоеотклонение />6.52, значитсреднее отклонение объема пашни от среднего значения, составляет 6.52%, />9.64, значит среднее отклонение уровняубыточности животноводства от среднего значения, составляет 9.64%.
Определим, связаны ли Х иУ между собой, и, если да, то определить формулу связи. По таблице строим корреляционноеполе (диаграмму рассеивания) – нанесем точки /> на график.
Точка с координатами />=(17.02; 28.17) называетсяцентром рассеяния.
По виду корреляционногополя можно предположить, что зависимость между y и x нелинейная.
Пытаемся описать связьмежду х и у зависимостью/>. Перейдем к линейной модели. Делаем линеаризующуюподстановку: />, />. Получили новые данные U и V.Для этих данных строим линейную модель: />
Проверим тесноту линейнойсвязи u и v. Найдем коэффициент корреляции: />0,864. Между u и v сильная линейная связь.
Параметры b0, b1находим по МНК. />
Проверим значимостькоэффициентов bi. Значимость коэффициента b может бытьпроверена с помощью критерия Стьюдента:
/>=0.845. Значимость /> равна 0,413, т.е практически 41%. Коэффициент b0статистически не значим.
/>6.19 Значимость /> равна 0,000032, т.е практически 0%. Коэффициент b1статистически значим.
Получили линейную модель />
После того, как былапостроена модель, необходимо проверить ее на адекватность.
Дляанализа общего качества оцененной линейной регрессии найдем коэффициентдетерминации: />=0,747.Разброс данных объясняется линейной моделью на 75% и на 25% – случайнымиошибками. Качество модели хорошее.
Проверимс помощью критерия Фишера.
Дляпроверки находим величины: /> 972.42 и />25.32. Вычисляем k1=1,k2=13. Находим наблюдаемое значение критерия Фишера />38.41. Значимось этого значения a=0,000032, т.е.процент ошибки практически равен 0%. Модель/> считается адекватной с гарантией более 99%.
Так как линейная модельадекватна, то и соответствующая нелинейная модель тоже адекватна.
Находим параметрыисходной нелинейной модели: а=b1=370.76; b= b0=3.53.
Вид нелинейной функции: />.
Т.е. зависимость уровня убыточностиот площади пашен имеет вид: />.
Найдем прогноз наосновании модели. Выберем произвольную точку из области прогноза [9.2; 28.7],х=15
Рассчитываем прогнозныезначения по модели для всех точек выборки и для точки прогноза: />28.25
Найдем полуширинудоверительного интервала в каждой точке выборки. Для этого найдем полуширинудля линейной модели:
/>
sе – средне квадратичное отклонение выборочных точек отлинии регрессии />5.03
/>
uпр – точка из области прогнозов.Прогнозируемый доверительный интервал для любого u такой />
Для нелинейной моделинайдем доверительный интервал, воспользовавшись обратной заменой: /> Совокупность доверительныхинтервалов для всех х из области прогнозов образует доверительную область.
Прогноз для х=15 составитот 17.03 до 39.48 с гарантией 90%.
Т.е. при площади пашен 15уровень убыточности животноводства составит от 17.03% до 39.48%.
Найдем эластичность.
Коэффициент эластичностидля точки прогноза:
/>,
/>
/>
Коэффициент эластичностидля точки прогноза:
/>
Коэффициент эластичности показывает,что при изменении площади паши 15 % на 1% уровень убыточности животноводстваувеличивается на 13.12%.
Обозначим удельный вес пашни – Х1 %, удельныйвес лугов и пастбищ — Х2 %, уровень убыточности продукции животноводства — У %.Построим линейную зависимость показателя от факторов. Найдем основные числовыехарактеристики. Объем выборки n=15 – суммарное количество наблюдений.Минимальное значение Х1=68.1, максимальное значение Х1=94.7, значит, удельныйвес пашни изменяется от 68.1 до 94.7%. Минимальное значение Х2=9.2, максимальноезначение Х2=28.7, значит, вес лугов и пастбищ изменяется от 9.2 до 28.7%.Минимальное значение У=15, максимальное значение У=45.6, уровень убыточностиживотноводства изменяется от 15 до 45.6%. Среднее значение />.
Среднее значение весапашни составляет 80.98 %, среднее значение веса лугов и пастбищ составляет 17.02,среднее значение уровня убыточности животноводства составляет 28.17%.
Дисперсия />=58,83, />=42,45 />=92.96%.
Среднеквадратическоеотклонение />7.67, значитсреднее отклонение веса пашни от среднего значения, составляет 7.67%.,среднеквадратическое отклонение />6.52, значит среднее отклонение удельного веса лугови пастбищ от среднего значения, составляет 6.52%,/>9.65, значит среднее отклонение уровня убыточногоживотноводства от среднего значения, составляет 9.65%.
Прежде чем строитьмодель, проверим факторы на коллинеарность. По исходным данным строимкорреляционную матрицу. Коэффициент корреляции между X1 и X2равен 0,89. Так как />, значитX1 и X2 – неколлинеарные
Определим, связаны ли Х1,Х2 и У между собой.
Для определения теснотылинейной связи найдем коэффициент корреляции: r=0,892. Так как /> то линейная связь между Х1, Х2 иУ достаточная.
Пытаемся описать связьмежду х и у зависимостью/>.
Параметры b0, b1,b2 находим по МНК. />.
Проверим значимостькоэффициентов bi.
Значимость коэффициента bможет быть проверена с помощью критерия Стьюдента:
/> -0,867. Значимость /> равна 0.402, т.е приблизительно 40%. Так как это значениенамного больше 5%, то коэффициент b0 статистически не значим.
/> 3.04. Значимость /> равна 0.0102, т.е 1%. Так как это значение меньше5%, то коэффициент b1 статистически значим.
/>-2.107. Значимость /> равна 0.056, т.е 5%. Так как это значение больше5%, то коэффициент b2 статистически не значим.
Проверим адекватность.
Дляанализа общего качества оцененной линейной регрессии найдем коэффициентдетерминации: />=0,8377. Разброс данных объясняется линейноймоделью на 84% и на 16% – случайными ошибками. Качество модели хорошее.
Проверимс помощью критерия Фишера.
Дляпроверки найдем величины: />545.17 и />17.6. Вычисляем k1=2,k2=12. Находим наблюдаемое значение критерия Фишера />30.98 Значимость этого значения a=0.000018, т.е.процент ошибки равен 0,00018%. Так как это значение меньше 5%, то модель /> считаетсяадекватной с гарантией более 99%.
Получили модельзависимости уровня удельного веса пашни от удельного веса лугов и пастбищ иубыточности скотоводства />
Найдем прогноз наосновании линейной регрессии. Выберем произвольную точку из области прогноза:/>х1=80, х2=30. Рассчитываемпрогнозные значения по модели для всех точек выборки и для точки прогноза: />
Т.е. при удельном весе пашен 80% и веселугов и пастбищ 30% уровень убыточности животноводства составит 19.86%.
Найдем эластичность покаждому фактору.
Для линейной модели
/>,

/>.
Коэффициент эластичности показывает,что увеличении пашен с 80 % на 1% и при уровне лугов 30 %, уровень убыточности увеличитсяс 19.86 грн на 2.89%.
Для линейной модели
/>,
/>.
Коэффициент эластичности показывает,что увеличении пашен с 80 % на 1% и при уровне лугов 30 %, уровень убыточности уменьшитьсяс 19.86 грн на 0.89%.
Для уменьшения убыточностиживотноводства целесообразней увеличивать вес лугов и пастбищ при неизменномвесе пашен.

Использованнаялитература
1. Экономико-математические методы иприкладные модели: Учебное пособие для вузов / В.В. Федосеев, А.Н. Гармаш и др.- М.: ЮНИТИ, 1999. — 391 с.
2. Орлова И.В.Экономико-математические методы и модели. Выполнение расчетов в среде EXCEL.Практикум: Учебное пособие для вузов. — М.: Финстатинформ, 2000.- 136 с.
3. Компьютерные технологииэкономико-математического моделирования: Учебное пособие для вузов / Д.М.Дайитбегов, И.В. Орлова. — М.: ЮНИТИ, 2001.
4. Эконометрика: Учебник / Под ред.И.И. Елисеевой. — М.: Финансы и статистика, 2001.
5. Практикум по эконометрике: Учебноепособие / Под ред. И.И. Елисеевой — М.: Финансы и статистика, 2001.