Проста лінійна регресія

Творча робота з курсу “Економетрика”тема: “Проста лінійна регресія” Розділ 1. Вступ. Короткий опис дослідженння. Наша мета полягає в дослідженні економічних явищ та закономірностей на мікрорівні. Для цього ми обрали такий об’єкт спостереження: завод оборонного комлексу України. Використовуючи інформацію про ціну ресурсів та оптову ціну на один з товарів, що випускає завод, спробуємо встановити залежність між ціною на ресурс та оптовою ціною на товар. Оскільки ми повинні використати теорію простої лінійної регресії, очевидно, ми прийдемо до висновку, що оптова ціна товару (НРГС-4) певним чином лінійно залежить від ціни на ресурс. Наша задача – з’ясувати, чи можна взагалі використовувати лінійну залежність в цьому випадку, і отримати лінійну (або зведену до лінійної ) функцію, що адекватно відображає спостережувану залежність. Пропонуємо проаналізувати модель залежності оптової ціни від ціни вищенаведеного фактору виробництва. Очевидно, така залежність є прямою, тобто знаки параматрів повинні бути додатніми. Приймемо для початку гіпотезу, що як коефіцієнти моделі, так і змінні будуть мати лінійний вигляд. Очікуємо в результаті дослідження виявити таку модель, що буде найбільш адекватною. Проаналізуємо для цього інші функції, що можуть бути зведеними до лінійних і відповідати нашій моделі. Розділ 1. Теорія побудови регресійної моделі. Треба зауважити, що теорія виробництва фірми, а також виробничі функції не дають інформації про те, як залежить ціна товару від ціни факторів виробництва. Ми знаємо що виробничі функції, а зокрема і функція Кобба-Дугласа, виводять залежність між кількістю використаних факторів виробництва та кінцевим випуском () . З такої функції ми можемо отримати залежність між кількістю використаних ресурсів та вихідним випуском. Тоді, цілком логічним є те, що ціна на товар обернено залежить від відношення між кількістю випущеного товару та кількістю використаного ресурсу. Це випливає з того, що ціна ресурсу обіймає значну частину оптової ціни, тобто складає найбільшу її частку (підтвердження цьому можна побачити в таблиці з даними). Звичайно, ми не можемо з точністю сказати, що така залежність може бути лінійною, але застосовуючи відповідний економетричний аппарат, ми визначимо придатність моделі, що зображена лінійною функцією або функцією, зведеною до лінійної. Наведемо використану інформацію. Зазначимо, що дані наведено на 1 день кожного другого місяця року. Зміна оптової ціни товару НРГС-4 за 1998-1999 роки Назва показника 1998 рік Січень Березень Травень Липень Вересень Листопад Ціна на ресурс, 698,53 882,93 803,50 1150,48 1217,49 1193,74 Оптова ціна 1472,19 1753,46 1698,01 1736,96 1930,53 1794,38 Назва показника 1999 рік Січень Березень Травень Липень Вересень Листопад Ціна на ресурс, 1079,94 1735,49 1777,49 1534,76 1545,00 1524,60 Оптова ціна 2070,84 2823,35 3121,11 2482,57 2505,7 2475,59 Одиниці виміру ціни – гривні. Джерело інформації – бухгалтерський віддів ВО "Радіоприлад", Запоріжжя. Розділ 2. Оцінка регресійної моделі. Розглянемо модель залежності оптової ціни від ціни на ресурс: Pопт = b0 + b1Рресурс, де b0 та b1 – невідомі параметри моделі, Рресурс – ціна ресурсу. Оскільки ми знаємо, що нашій моделі можуть відповідати не тільки лінійні функції вигляду , а і степеневі чи екпоненційні, оцінимо 4 види моделей: Lin-lin модель; Lin-log модель; Log-lin модель; Log-log модель. Накращою буде модель з найбільшим коефіцієнтом детермінації . Розрахункові дані наведені в наступних таблицях. Lin-lin модель. Variable Coefficient Std. Error t-Statistic Prob. PRICE_SOURCE 1.420318 0.148270 9.579258 0.0000 C 340.2095 194.0233 1.753447 0.1101 R-squared 0.901732 Mean dependent var 2132.643 Adjusted R-squared 0.891905 S.D. dependent var 540.6037 S.E. of regression 177.7388 Akaike info criterion 13.34952 Sum squared resid 315910.7 Schwarz criterion 13.43034 Log likelihood -78.09711 F-statistic 91.76219 Durbin-Watson stat 2.441104 Prob(F-statistic) 0.000002 Lin-log модель Variable Coefficient Std. Error t-Statistic Prob. LOG_X 1614.849 225.1863 7.171166 0.0000 C -9331.918 1600.066 -5.832208 0.0002 R-squared 0.837201 Mean dependent var 2132.643 Adjusted R-squared 0.820922 S.D. dependent var 540.6037 S.E. of regression 228.7708 Akaike info criterion 13.85433 Sum squared resid 523360.8 Schwarz criterion 13.93515 Log likelihood -81.12598 F-statistic 51.42562 Durbin-Watson stat 1.941843 Prob(F-statistic) 0.000030 Log-lin модель Variable Coefficient Std. Error t-Statistic Prob. PRICE_SOURCE 0.000666 6.50E-05 10.24050 0.0000 C 6.795716 0.085081 79.87346 0.0000 R-squared 0.912943 Mean dependent var 7.635971 Adjusted R-squared 0.904238 S.D. dependent var 0.251863 S.E. of regression 0.077940 Akaike info criterion -2.114740 Sum squared resid 0.060747 Schwarz criterion -2.033923 Log likelihood 14.68844 F-statistic 104.8678 Durbin-Watson stat 2.932728 Prob(F-statistic) 0.000001 Log-log модель Variable Coefficient Std. Error t-Statistic Prob. LOG_X 0.765822 0.094660 8.090221 0.0000 C 2.199048 0.672610 3.269426 0.0084 R-squared 0.867465 Mean dependent var 7.635971 Adjusted R-squared 0.854211 S.D. dependent var 0.251863 S.E. of regression 0.096167 Akaike info criterion -1.694450 Sum squared resid 0.092481 Schwarz criterion -1.613633 Log likelihood 12.16670 F-statistic 65.45167 Durbin-Watson stat 2.400324 Prob(F-statistic) 0.000011 Як ми бачимо, найбільший коефіцієнт детермінації спостерігаємо в Log-lin моделі. Оберемо саме цю модель для подальшого дослідження. Лінійний вигляд нашої моделі такий: . Як бачимо, тепер коефіцієнти нашої моделі – це та . Тобто, в нашому випадку, . Звичайно, ми очікували отримати інші коефіцієнти для нашої моделі (враховуючи, що вона класично лінійна), оскільки ми використовуємо Log-lin модель, коефіцієнти дорівнюють натуральним логарифмам та . Як ми і очікували, наявний прямий зв’язок між ціною ресурсу та оптовою ціною продукції, тобто знаки коефіцієнтів моделі є додатніми. Можемо перетворити її в експоненційну форму, отримавши . Тоді рівняння нашої моделі набуде вигляду . Для економітричного аналізу використаємо цю функцію, зведену до лінійної. При цьому для застосування моделі достатньо буде взяти антилогарифм від значення . Розрахунок показників. Перевірка на значимість коефіцієнтів моделі. Перевіремо дві нуль-гіпотези . Порівняємо t-статистику кожного з параметрів, що розраховується за формулою (з n – k ступенями вільності, де n – кількість спостережень, k – кількість оцінених параметрів), з t – критичним значенням (найбільше отримаємо з таблиці t-розподілу Стьюдента). В нашому випадку k = 2, n = 12. Рзрахункові дані отримаємо з таблиці, що була отримана за допомогою пакету Eviews. Ми отримали tрозр = 10,24 (для коефіцієнта b­1) з ймовірністю, що майже дорівнює нулю. Це означає, що наш коефіцієнт статистично значимий з майже стовідсотковою ймовірністю. До аналогічного висновку приходимо стосовно параметра bo (tрозр = 79,87). Статистична значимість коефіцієнта b­1 також означає, що х має значимий вплив на у. Інтерпретація коефіцієнта детермінації. Ми отримали кофіцієнт детермінації , що означає, що зміна y, що в нашій моделі є натуральним логарифмом від значення оптової ціни, на 91.2943% пояснюється зміною х. Побудова інтервалів довіри для оцінених коефіцієнтів. Як нам відомо, інтервали довіри для оцінених коефіцієнтів мають вигляд: . Оберемо рівень значимості . Розрахуємо за формулою: Також розрахуємо : Критичне значення візьмемо з таблиці t – розподілу Стьюдента. В результаті отримаємо: Це означає що коефіцієнти та лежать у відповідних проміжках з ймовірністю 95%. Перевірка моделі на адекватність за F ­– критерієм Фішера. Для перевірки моделі необхідно: Сформувати нуль-гіпотезу . Задати – рівень значущості (у нашому випадку 5%) Обчислити F-відношення : за таблицями F ­– розподілу Фішера знайти F ­– критичне значення при 5% рівні помилки та (1, n – 2) ступенями вільності. Цю гіпотезу відкидаємо з 5% ризиком помилитися, оскільки. Тобто, наша модель адекватна за F ­– критерієм Фішера. Розробка економічного прогнозу для дослідженої моделі. Задамо прогнозне значення х = 2000 для 1 січня 2000 року. Отримаємо прогнозне значення для залежної змінної. За допомогою пакету Eviews отримаємо . Задамо 95% рівень значущості. Інтервал довіри для математичного сподівання залежної змінної розраховується за формулою: Для певного значення у формула виглядає так: Отже, в результаті розрахунків отримаємо: Інтервали довіри для інших значень залежної змінної схематично наведені на графіку Наше прогнозне значення у та математичне сподівання у будуть лежати у відповідних проміжках з ймовірністю 95%. Відповідні значення для оптової ціни та її математичного сподівання будуть лежати у таких проміжках Як бачимо, розраховані інтервали довіри мають дуже відчутні проміжки. Аналіз економічної ситуації на основі розробленої моделі. Як ми побачили, оптова ціна суттєво залежить від ціни на ресурси. Такого результату і слід було очікувати, оскільки ціна на ресурс складає значну частку від собівартості товару. Тому слід зважати на зміну ціни ресурсів при визначенні оптової ціни товару. Треба зазначити, що розроблена модель досить адекватно відображає дійсність і може дати інформацію керівництву підприємства про те, яку ціну можна призначити на товар при зміні ціни на ресурс. Розділ 3. Пдсумки та висновки. В результаті нашого дослідження ми отримали залежність між оптовою ціною на товар і цінами на ресурс виробництва. Хоча вивчена нами економічна теорія витрат фірми не дає такої залежності, ми довели, що такий зв’язок існує, і його можна вважати лінійним. Треба зазначити, що наша модель не відображена лінійною функцією, на що ми сподівалися на початку дослідження. Для більш адекватного відображення наявної економічної ситуації слід використовувати експоненційну функцію, що може буде зведена до лінійної. При застосуванні саме такої моделі, зміна залежної змінної найбільш пояснюється зміною незалежної. В результаті ми отримали функцію, за допомогою якої можна визначити оптову ціну товару для заданої ціни на ресурс(за інших рівних умов): . Де х – ціна ресурсу, – оптова ціна продукції.