Коэффициент детерминации. Значимость уравнения регрессии

Федеральноеагентство по образованию
Всероссийскийзаочный финансово-экономический институт
Кафедраэкономико-математических методов и моделей
КОНТРОЛЬНАЯРАБОТА
подисциплине «Эконометрика»
Вариант № 3
Исполнитель: Глушакова Т.И.
Специальность: Финансы и кредит
Курс: 3
Группа: 6
№ зачетной книжки: 07ффд41853
Руководитель:Денисов В.П.
 
г. Омск 2009г.

Задачи
По предприятиям легкойпромышленности региона получена информация, характеризующая зависимость объемавыпуска продукции (Y, млн. руб.) отобъема капиталовложений (X,млн. руб.). Требуется:
1. Найти параметрыуравнения линейной регрессии, дать экономическую интерпретацию коэффициентарегрессии.
/> – уравнение линейной регрессии,где />-параметры уравнения.
/>, где />,/> — средние значения признаков.
/>, где n – число наблюдений.
Представим вычисления втаблице 1:
Таблица 1. Промежуточныерасчеты.t xi yi yi * xi xi*xi 1 38 69 2622 1444 2 28 52 1456 784 3 27 46 1242 729 4 37 63 2331 1369 5 46 73 3358 2116 6 27 48 1296 729 7 41 67 2747 1681 8 39 62 2418 1521 9 28 47 1316 784 10 44 67 2948 1936 средн. знач. 35,5 59,4
/> 2108,7
/> 1260,25
/> 21734
/> 13093 n 10
/> 1,319
/> 12,573
Таким образом, уравнениелинейной регрессии имеет вид:
/>
Коэффициент регрессииравен 1,319>0, значит связь между объемом капиталовложений и выпускомпродукции прямая, увеличение объема капиталовложений на 1 млн. руб. ведет к увеличениюобъема выпуска продукции в среднем на 1,319 млн. руб. Это свидетельствует обэффективности работы предприятий.
2. Вычислить остатки;найти остаточную сумму квадратов; оценить дисперсию остатков />; построить графикостатков.
Вычислим прогнозноезначение Y по формуле:
/>
Остатки вычисляются поформуле:
/>.
Представим промежуточныевычисления в таблице 2.

Таблица 2. Вычислениеостатков.
/>
/>
/>
/> 69 62,695 6,305 39,75303 52 49,505 2,495 6,225025 46 48,186 -2,186 4,778596 63 61,376 1,624 2,637376 73 73,247 -0,247 0,061009 48 48,186 -0,186 0,034596 67 66,652 0,348 0,121104 62 64,014 -2,014 4,056196 47 49,505 -2,505 6,275025 67 70,609 -3,609 13,02488
Дисперсия остатковвычисляется по формуле:
/>
/>/>
/>.
Построим график остатковс помощью MS Excel.
/>
Рис. 1. График остатков.

3. Проверить выполнениепредпосылок МНК
Проверим независимостьостатков с помощью критерия Дарбина-Уотсона.
Вычислим коэффициентДарбина-Уотсона по формуле:
/>.
Данные для расчетавозьмем из таблицы 2.
dw = 0,803
Сравним полученноезначение коэффициента Дарбина-Уотсона с табличными значениями границ /> и /> для уровнязначимости 0,05 при k=1 и n=10. />=0,88, />=1,32, dw , значит, остатки содержат автокорреляцию. Наличиеавтокорреляции нарушает одну из предпосылок нормальной линейной моделирегрессии.
Проверим наличиегетероскедастичности. Т.к. у нас малый объем выборки (n=10) используем метод Голдфельда-Квандта.
— упорядочим значения n наблюдений по мере возрастанияпеременной x и разделим на две группы с малыми ибольшими значениями фактора xсоответственно.
— рассчитаем остаточнуюсумму квадратов для каждой группы.
Вычисления представим втаблицах 3 и 4.
Таблица 3. Промежуточныевычисления для 1-го уравнения регрессии.t xi yi yi * xi xi*xi
/>
/>
/> 1 27 46 1242 729 47 -1 1 2 27 48 1296 729 47 1 1 3 28 47 1316 784 49,5 -2,5 6,25 4 28 52 1456 784 49,5 2,5 6,25 средн. знач. 27,5 48,25
/> 1326,875
/> 756,25
/> 5310,00
/> 3026,00 n 4
/> 2,5
/> — 20,5
/> 14,5
Таблица 4. Промежуточныевычисления для 2-го уравнения регрессии.t xi yi yi * xi xi*xi
/>
/>
/> 1 37 63 2331 1369 63,789 -0,789 0,623 2 38 69 2622 1444 64,582 4,418 19,519 3 39 62 2418 1521 65,375 -3,375 11,391 4 41 67 2747 1681 66,961 0,039 0,002 5 44 67 2948 1936 69,340 -2,340 5,476 6 46 73 3358 2116 70,926 2,074 4,301 средн. знач. 40,833 66,833
/> 2729,028
/> 1667,361
/> 16424
/> 10067 n 6
/> 0,793
/> 34,448
/> 41,310

/> = />=/>2,849
где /> – остаточная суммаквадратов 1-ой регрессии, /> – остаточная сумма квадратов 2-ойрегрессии.
Полученное значениесравним с табличным значением Fраспределения для уровня значимости />, со степенями свободы /> и /> (/> — числонаблюдений в первой группе, m –число оцениваемых параметров в уравнении регрессии).
/>, />, m=1.
Если /> > />, то имеет местогетероскедастичность.
/>= 5,41
/>,
значит,гетероскедастичность отсутствует и предпосылка о том, что дисперсия остаточныхвеличин постоянна для всех наблюдений выполняется.
4. Осуществить проверкузначимости параметров уравнения регрессии с помощью t-критерия Стьюдента />.
Расчетные значения t-критерия можно вычислить поформулам:
/>, />
/>, />
/>,
/>
/>
/>
/>=35,5
Промежуточные расчетыпредставим в таблице:
Таблица 5. Промежуточныевычисления для расчета t- критерияxi
/> 38 6,25 28 56,25 27 72,25 37 2,25 46 110,25 27 72,25 41 30,25 39 12,25 28 56,25 44 72,25
/>=490,50
/>
/>
/>
/>
/> для уровня значимости 0,05 ичисла степеней свободы n-2=8
Так как /> и /> можно сделать вывод,что оба коэффициента регрессии значимые.
5. Вычислить коэффициентдетерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера />, найти среднююотносительную ошибку аппроксимации. Сделать вывод о качестве модели.
Коэффициент детерминацииопределяется по формуле:
/>
Из расчетов нам известно,что
/>; />.
Рассчитаем />:
Таблица 6. Промежуточныевычисления для расчета коэффициента детерминации.
/>
/>
/> 69 9,6 92,16 52 -7,4 54,76 46 -13,4 179,56 63 3,6 12,96 73 13,6 184,96 48 -11,4 129,96 67 7,6 57,76 62 2,6 6,76 47 -12,4 153,76 67 7,6 57,76
/>/>=930,4
/>=0,917.
Т.к. значениекоэффициента детерминации близко к единице, качество модели считается высоким.
Теперь проверимзначимость уравнения регрессии. Рассчитаем значение F-критерия Фишера /> по формуле:
/>
/>
/>
Уравнение регрессии свероятностью 0,95 в целом статистически значимое, т.к. />>/>.
Средняя относительнаяошибка аппроксимации находится по формуле:
/>

Таблица 7. Промежуточныевычисления для расчета средней относительной ошибки аппроксимации.yi
/>
/> 69 6,305 0,091377 52 2,495 0,047981 46 -2,186 0,047522 63 1,624 0,025778 73 -0,247 0,003384 48 -0,186 0,003875 67 0,348 0,005194 62 -2,014 0,032484 47 -2,505 0,053298 67 -3,609 0,053866
/> />,
значит модель имеетхорошее качество.
Рассчитаем коэффициентэластичности по формуле:
/>
/>
6. осуществитьпрогнозирование среднего значения показателя Y при уровне значимости />, если прогнозное значение фактораX составит 80% от его максимальногозначения.
/>
Рассчитаем стандартнуюошибку прогноза

/>,
где/>
/>=930,4; />
/>
/>
/>, />для уровня значимости 0,1 и числастепеней свободы n-2=8
/>
Доверительный интервалпрогноза:
/>
/>
Таким образом, />=61,112, будетнаходиться между верхней границей, равной 82,176 и нижней границей, равной 40,048.
7. Представить графически фактические имодельные значения Y точки прогноза.
Воспользуемся данными изтаблицы 2 для построения графиков с помощью MS Excel.

/>
Рис. 2. Фактические имодельные значения Y точки прогноза.
8. Составить уравнениянелинейной регрессии: гиперболической, степенной, показательной. Привестиграфики построенных уравнений регрессии.
Построение степенноймодели.
Уравнение степенноймодели имеет вид:
/>
Для построения этоймодели необходимо произвести линеаризацию переменных. Для этого произведемлогарифмирование обеих частей уравнения:
/>
Обозначим />.
Тогда уравнение приметвид /> –линейное уравнение регрессии. Рассчитаем его параметры, используя данныетаблицы 1:

Таблица 8. Расчетпараметров уравнения степенной модели регрессии.t xi X
/>/> Y YX X*X
/>
/>
/>
/> 1 38 1,5798 69 1,839 2,905 2,496 62,347 6,653 9,642 44,26 2 28 1,447 52 1,716 2,483 2,094 50,478 1,522 2,926 2,315 3 27 1,431 46 1,663 2,379 2,048 49,225 -3,225 7,010 10,399 4 37 1,568 63 1,799 2,821 2,459 61,208 1,792 2,845 3,212 5 46 1,663 73 1,863 3,098 2,765 71,153 1,847 2,530 3,411 6 27 1,431 48 1,681 2,406 2,049 49,225 -1,225 2,552 1,5 7 41 1,613 67 1,826 2,945 2,601 65,771 1,289 1,924 1,66 8 39 1,591 62 1,793 2,853 2,531 63,477 -1,477 2,382 2,182 9 28 1,447 47 1,672 2,419 2,094 50,478 -3,478 7,4 12,099 10 44 1,644 67 1,826 3,001 2,701 68,999 -1,999 2,984 3,997
/>
/>
/>
Уравнение регрессии будетиметь вид:
/>
Перейдем к исходнымпеременным x и y, выполнив потенцирование данного уравнения:
/>
/>
Вычислим коэффициентдетерминации />:

/>=930,4; />
/>(1)
Вычислим среднюю ошибкуаппроксимации А:
/>%
/>(2)
Коэффициент эластичностирассчитывается по формуле:
/> (3)
/>
/>
Рис. 3. График степенногоуравнения регрессии.

Построениепоказательной функции.
Уравнение показательнойкривой:/>
Для построения этоймодели необходимо произвести линеаризацию переменных. Для этого осуществимлогарифмирование обеих частей уравнения:
/>
Обозначим />
Получим линейноеуравнение регрессии:
/>
Рассчитаем его параметры,используя данные таблиц 1 и 8.
/>
Промежуточные расчетыпредставим в таблице 9.
Таблица 9. Промежуточныерасчеты для показательной функции.t xi Y
/>
y/>
/>
/>
/>
/> 1 38 1,839 69,882 69 62,632 6,368 10,167 40,552 2 28 1,716 48,048 52 49,893 2,107 4,223 4,44 3 27 1,663 44,901 46 48,771 -2,771 5,682 7,68 4 37 1,799 66,563 63 61,224 1,776 2,901 3,155 5 46 1,863 85,698 73 75,128 -2,128 2,832 4,528 6 27 1,681 45,387 48 48,771 -0,771 1,581 0,595 7 41 1,826 74,866 67 67,054 -0,054 0,08 0,003 8 39 1,793 69,927 62 64,072 -2,072 3,235 4,295 9 28 1,672 46,816 47 49,893 -2,893 5,798 8,369 10 44 1,826 80,344 67 71,788 -4,788 6,669 22,921
/>=63,2432
/>
Уравнение будет иметьвид:
/>
Перейдем к исходнымпеременным x и y, выполнив потенцирование данного уравнения:
/>
Рассчитаем коэффициентдетерминации по формуле (1).
/>=930,4; />
/>
Вычислим среднюю ошибкуаппроксимации А по формуле (2):
/>
А=0,1*43,170=4,317%
Коэффициент эластичностирассчитаем по формуле (3):
/>%
Построим график функции спомощью MS Excel.
/>
Рис. 4. Графикпоказательного уравнения регрессии.
Построениегиперболической функции.
Уравнение гиперболическойфункции />
Произведем линеаризациюмодели путем замены Х=1/х.
В результате получимлинейное уравнение: />
Рассчитаем параметрыуравнения, промежуточные вычисления представим в таблице 10.
Таблица 10. Расчетпараметров для гиперболической модели.t xi yi X=1/xi y*X
/>
/>
/>
/>
/> 1 38 69 0,02632 1,81579 0,00069 63,5648 5,4352 7,877 29,5409 2 28 52 0,03571 1,85714 0,00128 50,578 1,422 2,7346 2,0221 3 27 46 0,03704 1,7037 0,00137 48,7502 -2,7502 5,9787 7,5637 4 37 63 0,02703 1,7027 0,00073 62,5821 0,4179 0,6634 0,1747 5 46 73 0,02174 1,58696 0,00047 69,8889 3,1111 4,2618 9,6791 6 27 48 0,03704 1,77778 0,00137 48,7502 -0,7502 1,563 0,5628 7 41 67 0,02439 1,63415 0,00059 66,2256 0,7744 1,1559 0,5998 8 39 62 0,02564 1,58974 0,00066 64,4972 -2,4972 4,0278 6,2362 9 28 47 0,03571 1,67857 0,00128 50,578 -3,578 7,6128 12,8021 10 44 67 0,02273 1,52273 0,00052 68,5235 -1,5235 2,2738 2,3209
/>
/>
/>
/>
/>
Уравнение гиперболическоймодели:
/>
Рассчитаем коэффициентдетерминации по формуле (1).
/>=930,4; />
/>
Вычислим среднюю ошибкуаппроксимации А по формуле (2):
/>
А=0,1*38,1488=3,81488%
Коэффициент эластичностирассчитаем по формуле (3):
/>/>%
Построим график функции спомощью MS Excel.
/>
Рис. 5 Графикгиперболического уравнения регрессии.
9. Для указанных моделейнайти коэффициенты детерминации, коэффициенты эластичности и средниеотносительные ошибки аппроксимации. Сравнить модели по этим характеристикам исделать выводы.
Коэффициенты былирассчитаны в задании 8. Для сравнения моделей составим сводную таблицу 11:
Таблица11. Своднаятаблица характеристик моделей.
параметры
модель
Коэффициент детерминации, R/>
Коэффициент эластичности,/>(%) Средняя относительная ошибка аппроксимации, А (%) Линейная 0,917 0,788 3,648 Степенная 0,909 0,692 4,22 Показательная 0,896 0,817 4,317 Гиперболическая 0,923 0,638 3,815
Для всех моделей средняяотносительная ошибка аппроксимации не превышает 7%, значит, качество всехмоделей хорошее. Коэффициент детерминации более приближен к 1 у гиперболическоймодели, таким образом, эту модель можно взять в качестве лучшей для построенияпрогноза. Для гиперболической модели степень связи между факторным ирезультативным признаком самая низкая, т.к. />имеет наименьшее значение, а дляпоказательной модели самая высокая, т.к. коэффициент эластичности наибольший.