ЛАБОРАТОРНА РОБОТА №1
ТЕМА: КЛАСИЧНА ЛІНІЙНА РЕГРЕСІЯ
Мета:Дослідитиметод побудови загальної лінійної регресії та провести аналіз її основниххарактеристик
Задача:Навчитися отримувати оцінки параметрів загальної лінійної регресії за допомогою1МНК, визначати статистичні властивості окремих оцінок і моделі в цілому, будуватиточковий та інтервальний прогнози за допомогою отриманої моделі. Дослідитиальтернативні способи оцінки параметрів лінійної регресії.
Завдання: Дляданих з варіанту перевірити гіпотезу про лінійну залежність між змінними Y і X1, X2, X3.
Необхідно:
Побудувати загальну лінійну модель і оцінити коефіцієнти регресії задопомогою оператора 1МНК.
Оцінити значущость окремих коефіціентів регресії і всієї моделі вцілому.
Побудувати точковий та інтервальний прогноз на 3 періоди.
Розрахувати оцінки коефіціентів регресії методом покрокової регресії.
Результати надати у звіті в письмовому вигляді.
Звіт містить дані варіанту, проміжні розрахунки, кінцеві результатикожного етапу дослідження з необхідними поясненнями і висновками
КОРОТКІТЕОРЕТИЧНІ ВІДОМОСТІ
1. Економетричнамодель дає кількісну оцінку кореляційно-регресійного зв’язку між економічнимипоказниками, один чи кілька з яких є залежними (Y), а решта — незалежними змінними (X), тому часто економетричнімоделі називаються регресій ними моделями, або просто регресіями.
Припустимо, щоістинний зв’язок між Y і Х є лінійним, тобто
/> b0+ b1X1 + b2X2 + ……. + bmXm+e
або у матричномувигляді:
Y = Xb + e,
де Y- вектор залежних змінних моделі;
Х – матриця незалежнихзмінних моделі;
e — вектор відхилень моделі;
b — вектор параметрів моделі
Y = />, Х = />, b = />, e = />
Розглянемо його оцінку задопомогою лінійної регресійної моделі:
/>= b0+ b1X1+ b2X2 + ……. + bmXm
Оцінки параметрів цієїрегресії знаходяться з умови:
/> (1)
де е – вектор залишків моделі,
/>.
Продиференціювавши(1) по bj і прирівнявши відповіднічасткові похідні по bj до 0, отримаємо такий вираз:
/>,
/>
домноживши вираззліва на />, отримуємо вираз длязнаходження вектора b:
/>
Цей вираз називаєтьсяосновним операторомоцінювання параметрів лінійної моделі, а елементи вектора b є оцінками коефіцієнтів лінійноїрегресії.
6. Якщовиконуються всі необхідні умови для застосування 1МНК, то оцінки параметрівеконометричної моделі мають такі властивості:
1)незміщеності; 3) ефективності;
2) обґрунтованості; 4) інваріантності.
7. Одним зважливих завдань економетричного моделювання — оцінити прогнозне значення залежноїзмінної за умови, що пояснювальні змінні задані на перспективу. На основіеконометричної моделі можна отримати точковий та інтервальний прогнози залежноїзмінної на перспективу.
8. Незміщенаоцінка точкового прогнозу запишеться так:
M[У0(Х0)]=Х0B,
де Х0— заданий рівень пояснюючої змінноїна перспективу;
Y — точковий прогноз залежної функції наоснові економетричної моделі.
9. Дисперсіяпрогнозу дорівнює:
/>
його стандартна помилка :
/>
10.Довірчий інтервал для прогнозних значень:
/>
ta — значення t-крітеріюпри n-mступеняхсвободи і рівні значущості a.
11. З огляду на залежність між оцінками параметрів моделі такоефіцієнтами парної кореляції можна запропонувати альтернативну оцінкупараметрів 1 МНК на основі покрокової регресії, ідея якої базується наіснуванні залежності між оцінками параметрів моделі та коефіцієнтами парноїкореляції. Ця залежність пропорційна до відношення середньоквадратичнихвідхилень залежної та незалежної змінних.
12. Опишемо алгоритмпошагової регресії.
Крок 1. Усі вхідні дані стандартизують:
/>
де y*- нормалізована залежна змінна;
х* — нормалізованінезалежні змінні.
Крок 2.Знаходять кореляційну матрицю (матриця парних коефіцієнтів кореляції):
r*= />,
де /> – парні коефіцієнтикореляції між Y і незалежнимизмінними Х,
/>
де n– кількість спостережень;
/>-парні коефіцієнти кореляції між Хji Xi:
/>.
Крок 3. Вибирають/> . Відповідну незалежнузмінну xjвключають в лінійну модель, для якої за допомогою 1МНК знаходять оцінкипараметрів:
/>
де g- оцінки параметрів моделі, яка будується на основі нормалізованих даних.
Крок 4.Серед тих, що залишилися, значень />вибираєтьсямаксимальний і в модель вводиться наступна незалежна змінна xl.
/>.
Оцінюються параметри задопомогою відношення:
gr= rxy,
де r– матриця парних коефіцієнтів кореляції між незалежними змінними;
ryx-вектор парних коефіцієнтів кореляції між залежною та незалежнимизмінними.
Звідси оператороцінювання параметрів моделі:
/>
Якщо немає обмеження накількість введених змінних, обчислення виконуються до тих пір, поки не будутьвключені всі змінні.
Зв’язокміж оцінками параметрів моделі на основі нормалізованих і ненормалізованихзмінних запишеться таким чином:
/>
/>.
13.Тіснота зв’язку загального впливувід незалежних змінних на залежну визначається коефіцієнтами детермінації імножинної кореляції. Коефіцієнт детермінації без урахування числа ступенівсвободи
/>
з урахуванням ступенівсвободи:
/>.
14. Коефіцієнт детермінації показує, на скільки процентівваріація залежної змінної визначається варіацією пояснюючих (незалежних)змінних.
Коефіцієнткореляції є інваріантною оцінкою коефіцієнта детермінації. Він характеризуєтісноту зв’язку між залежною і пояснювальними змінними. Визначається як коріньквадратний від R2.
15. Оскількикоефіцієнти детермінації і кореляції є вибірковими характеристиками, то їхчислові значення також перевіряються на значущість згідно зі статистичнимигіпотезами. Для перевірки значущості коефіцієнта кореляції використовуєтьсяt-критерій.
Нульова гіпотеза:значення коефіцієнту кореляції несуттєво відрізняється від 0.
Розрахунковезначення критерію визначається як:
/>
Якщо розрахунковезначення цього критерію t не менше за критичне (табличне) tтаб при вибраному рівні довіри a і ступені свободи n — m, тобто t³ tтаб, нульова гіпотеза відхиляється івідповідний коефіцієнт кореляції є достовірним.
16. Гіпотеза про істотність зв’язкуміж залежною і незалежною змінними може бути перевірена з допомогою F-критерію.Нульова гіпотеза: всі коефіцієнти регресії несуттєво відрізняються від 0, тобтоН0: b0= b1 = ……… =bm = 0.
Розрахунковезначення F-критерію визначається за формулою:
/>
або вальтернативному запису:
/>
Розрахунковезначення порівнюється з табличним Fтаб при n-m i m-1ступенях свободи та вибраному рівні довіри a. Якщо F ³ Fтаб, нульова гіпотеза відхиляється іістотність моделі підтверджується, в протилежному випадку – відхиляється.
17. Гіпотезу прозначущість кожного з параметрів bj економетрічної моделі можна виконати за допомогою t-крітерію. Нульова гіпотеза: bj несуттєво відрізняються від 0, тобто H0: bj = 0. Розрахункове значення t-критерію:
/>
де cjj – діагональний елемент j-ї строки (стовпця) матриці />,
/> — стандартна помилка оцінки j-го параметра моделі.
Якщо t³ tтаб, нульова гіпотеза відхиляється івідповідний коефіцієнт регресії є достовірним.
18. На основі t-критерію і стандартної помилкибудуються граничні інтервали для оцінок параметрів моделі:
/>
де ta — табличне значення t-статистики з рівнем довіри a та ступенями свободи n-m.
ПРИКЛАДВИКОНАННЯ ЛАБОРАТОРНОЇ РОБОТИ
Нехай маємозмінні:
— середньомісячназарплата, ум. од.;
— продуктивністьпраці, ум. од.;
— фондомісткістьпродукції ум. од;
— виконання нормивиробітку,%
Гіпотеза, щопропонується для перевірки — середньомісячна зарплата лінійно залежить від продуктивності праці, фондомісткості продукції та виконання норми виробітку.
Позначимо Y — середньомісячна зарплата, X1 — продуктивність праці, X2 — фондомісткість продукції, X3 — виконання норми виробітку/
Вихідні дані наведено в таблиці.номер цеху середньомісячна з/п,Y
Продуктивність праці, X1
ФондомісткістьX2
Норма виробітку, X3 1 45 265 0,2 130 2 42 236 0,04 127 3 50 257 0,3 151 4 55 279 0,2 149 5 40 226 0,1 140 6 70 350 0,1 141 7 56 278 0,25 152 8 57 262 0,03 188 9 55 269 0,15 120 10 53 250 0,32 126
Матриця Хдоповнюється стовбцем одиниць для врахування коефіцієнта регресії b0:
/>
1. Оцінимо параметри регресії задопомогою 1МНК.
Підготуємонеобхідні проміжні матриці:
/>
/> />
Використовуючиоператор оцінювання МНК, отримуємо
/>
Þ Рівняння регресії маєвигляд:
Y = -23,83+0,23X1+9,018X2+0,097X3Ця модель має бути проаналізована на значущість вцілому (2), а також на значущість кожного коефіцієнта регресії зокрема (3).
2. Перевірказначущості моделі
Значущість всієїмоделі в цілому будемо проводити для рівня значущості a=0,05 за допомогою F-крітерія при (m-1) і (n-m) ступенях свободи. Розрахунковезначення F-критерію розраховується поформулі:
/>
де />, />
Y – спостеріганні значення фактора (вихідні дані),
n – число спостережень,
m – число оцінюваних параметрів.
Нульова гіпотезадля перевірки значущості моделі: Н0: b0= b1 = …… = bm= 0.
Проведемонеобхідні попередні розрахунки.
Використовуючивихідну матрицю Х і побудовану модель, отримуємо розрахункові Yp:
Yp = X*BT і залишкие = Y – Yp :
/> />
Сума квадратіввідхилень значень регресії від середнього та сума залишків дорівнює:
/> 583,5752 />,
/>
Табличне значеннядля (m-1), (n-m) F-критерію (0,95) = 4,76. Оскільки Fp>Fтабл, модель можна вважати статистичнозначимою. (нульова гіпотеза відхиляється).
Далі оцінюєтьязначущість кожного з параметрів bj.за допомогою t-статистики.
3. Оцінказначущості окремих коефіцієнтів регресії.
Гіпотезу прозначущість кожного з параметрів bj економетрічної моделі можна виконати за допомогою t-крітерію. Нульова гіпотеза, найбільшпоширена притестуванні економетричної моделі – bj несуттєво відрізняються від 0, тобто H0: bj = 0. Поширеність такої постановинульової гіпотези – в тому, що якщо вона підтверджується, то це має означати,що відповідний Xj статистично незначущо впливає на Y, його вплив з високою вірогідністюдорівнює 0, залежності між Y та Х практично немає і відповідна змінна повинна бути виключена змоделі. Виключенням є випадок, коли при незначущому bj залежність між X і Y таки існує, але нелінійна. В цьомувипадку треба змінити специфікацію моделі (надати їй іншу аналітичну форму).
Розрахунковезначення t-критерію:
/>де Sbj – стандартна помилка коефіцієнта bj,
cjj – діагональний j-й елемент матриці С=/>Визначимо значення стандартних помилок коефіцієнтіврегресії Sbj як корінь з дисперсіїкоефіцієнта bj:
/>
Для отриманняоцінок дисперсії Dj розрахуємо дисперсійно-коваріаційну матрицю (іноді її називаютьковаріаційною).
Розраховуєтьсявона за формулою
/>,
де /> — дисперсія залишків
Матрицю С=/> ми маємо.
/>, де
n – кількість спостережень, n=10
m – кількість оцінюваних параметрівмоделі, m=4.
Стандартне відхиленнязалишків />= 4,912352.
Отримуємо:
/> =
/>На діагоналі коваріаційної матриці отримуємо дисперсіїкоефіцієнтів регресії bj:
D(b0)= 318,9421,
D(b1)=0,002358,
D(b2)=272,2121,
D(b3)=0,007489Визначимо значення стандартних помилок коефіцієнтіврегресії Sbj:
/>
Sb0= />= 17,85895,
Sb1=/>= 0,048839,
Sb2=/> = 16,49885,
Sb3=/>= 0,086537 17,85895 0,048839 16,49885 0,086537
Sb =
Розрахунковезначення t-статистики отримуємо длякожного коефіцієнта:
tb0= b0/ Sb0 = -23,83/ 17,85895 = -1,33433 і т. п.-1,33433 4,658181 0,546609 1,121298
tp =
Розрахунковізначення t-статистики порівнюються заабсолютною величиною з табличним t10-4 = 1,943. Параметрвважається статистично значимим (нульова гіпотеза не підтверджується), якщо />
Це означає, що внашому випадку тільки b1 є статистично значущим і суттєво впливаєна модель.
Довірчі інтервалидля оцінок регресії будуються за формулою: