Исходные данныео продаже квартир на вторичном рынке жилья№ п/п y
x1
x2 Задание
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
22.5
26
18.5
13.2
25.8
17
18
21
14.5
23
19.5
14.2
13.3
16.1
13.516
29
35
28
30
51
38
30
32
27
39
29.5
29
30
30.8
28
31
15
10
10
25
10
12
15
20
10
5
15
12
5
10
25
10
y – цена квартиры (тыс.$);
x1 – жилая площадь(кв. м);
x2 – время пути до метро (мин).
По имеющимся статистическим данным
отдельно для пар (у, х1) и (у, х2) найти:
а) уравнение линейной регрессии;
б) коэффициент корреляции;
в) среднюю величину у при х1=35 (х2=12);
г) 95% доверительные интервалы для
индивидуального и среднего значения у;
д) с надежностью 0.95 интервальные оценки коэффициента регрессии b1и дисперсии s2;
е) коэффициент детерминации.
Оценить на уровне 0.05 значимость
уравнения регрессии.
Сделать анализ полученных результатов.
Табличныезначения стандартных функций распределения:
t0.05,14 = 2.145 F0.05,1,14 = 4.6
c20.025,14 =26.1 c20.975,14 =5.63
1. Парнаярегрессия y наx1.
а) Найтиуравнение линейной регрессии для x1.
№ п/п
yi
xi
y2
x2
x* y
xi – />
(xi–/>)2 1 22,5 29 506,25 841 652,5 -3,3 10,89 2 26 35 676 1225 910 2,7 7,29 3 18,5 28 342,25 784 518 -4,3 18,49 4 13,2 30 174,24 900 396 -2,3 5,29 5 25,8 51 665,64 2601 1315,8 18,7 349,69 6 17 38 289 1444 646 5,7 32,49 7 18 30 324 900 540 2,3 5,29 8 21 32 441 1024 672 -0,3 0,09 9 14,5 27 210,25 729 391,5 -5,3 28,09 10 23 39 529 1521 897 6,7 44,89 11 19,5 29,5 380,25 870,25 575,25 -2,8 7,84 12 14,2 29 201,64 841 411,8 -3,3 10,89 13 13,3 30 176,89 900 399 -2,3 5,29 14 16,1 30,8 259,21 948,64 495,88 -1,5 2,25 15 13,5 28 182,25 784 378 -4,3 18,49 16 16 31 256 961 496 -1,3 1,69 Сумма 292,1 517,3 5613,87 17273,89 9694,73 548,95 Средняя 18,2 32,3 350,9 1079,6 605,9 34,3
Такимобразом, выборочные средние значения />= 32,3; />= 18,2; />= 605,9;
выборочнаядисперсия />= 34,3;
выборочнаяковариация cov(x,y) = />= 605,9-32,3*18,2 = 18,04;
Коэффициентырегрессии b1=/>= />= 0,53
/>= 18,2 – 0,53*32,3 = 1,08
Приувеличении жилой площади на 1 кв.м цена квартиры в среднем возрастает на 0,53тыс.$.
Уравнениерегрессии />= 1,08 + 0,53 * x.
б) рассчитатькоэффициент корреляции
/>
/>
Между величинойжилой площади квартиры и ценной квартиры наблюдается умеренная положительнаязависимость.
в) определитьсреднюю величину y при x1=35.
/>
Средняя ценаквартиры при жилой площади 35 кв.м составляет 19.63 тыс.$. Промежуточныевычисления для последующих расчетов проводим в таблице.
№ п/п
yi
xi
/>
/>
/>
/>
/>
1 22,5 29 16.45 6.05 36.60 4.3 18.49
2 26 35 19.63 6.37 40.58 7.8 60.84
3 18,5 28 15.92 2.58 6.66 0.3 0.09
4 13,2 30 16.98 -3.78 14.29 -5.0 25.00
5 25,8 51 28.11 -2.31 5.34 7.6 57.76
6 17 38 21.22 -4.22 17.81 -1.2 1.44
7 18 30 16.98 1.02 1.04 -0.2 0.04
8 21 32 18.04 2.96 8.76 2.8 7.84
9 14,5 27 15.39 -0.89 0.79 -3.7 13.69
10 23 39 21.75 1.25 1.56 4.8 23.04
11 19,5 29,5 16.72 2.78 7.73 1.3 1.69
12 14,2 29 16.45 -2.25 5.06 -4.0 16.00
13 13,3 30 16.98 -3.68 13.54 -4.9 24.01
14 16,1 30,8 17.40 -1.30 1.69 -2.1 4.41
15 13,5 28 15.92 -2.42 5.86 -4.7 22.09
16 16 31 17.51 -1.51 2.28 -2.2 4.84
Сумма 292,1 517,3 169.59 281.27
Средняя 18,2 32,3 17.58
г) найти 95%доверительные интервалы для индивидуального и среднего значения y.
С учетомзначений из обеих таблиц:
Остаточнаядисперсия />
Дисперсиясреднего значения /> />
/>/>= 0.920
Стандартноеотклонение /> />
Дисперсияиндивидуального значения y0/>
/>
Стандартноеотклонение y0 />
Длядоверительной вероятности g=0,95 уровень значимости a = 1-g = 0,05.
Табличноезначение t-распределенияСтьюдента для уровня значимости a = 0,05 и числа степенейсвободы k= n-2 =16-2 =14 составляет t0.05,8 = 2,31.
Доверительныйинтервал для среднего значения />
/>
19.63 – 2.145×0.96 £ y £ 19.63 + 2.145×0.96
17.57£ y £ 21.69
Доверительныйинтервал для индивидуального значения />
/>
19.63 – 2.145×3.61 £ y0£ 19.63 + 2.145×3.61
11.89 £ y0£ 27.37
Сучетом возможных ошибок средняя цена квартиры с площадью 35 кв.м с вероятностью95% лежит в пределах от 17,57 до 21,69 тыс.$; при этом отдельно цена квартирыколебаться от 11,89 до 27,37 тыс.$.
д) снадежностью 0,95 найти интервальные оценки коэффициента регрессии b1 и дисперсии возмущений s2.
Дисперсиякоэффициента регрессии />=/>= 0.022
Стандартноеотклонение />
Доверительныйинтервал для коэффициента регрессии b1
/>
0.53–2.145×0.148 £ b1 £ 0.53+ 2.145×0.148
0.21 £ b1 £ 0.85
С надежностью0,95 увеличение площади квартиры на 1 кв.м приводит к увеличению цены квартирына величину от 0,21 до 0,85 тыс.$.
Табличныезначения распределения c2 Пирсона для уровня значимости 0,05 и числастепеней свободы 14 составляют
/>; />
Доверительныйинтервал дисперсии возмущений
/>
/>
7,42 £ s2 £ 34,42
Интервал длястандартного отклонения 2,72 £ s £ 5,87.
Снадежностью 0,95 дисперсия ошибок расчета находится в пределах от 7,42 до34,42, а стандартное отклонение цены квартиры от среднего значения лежит впределах от 2,72 до 5,87.
Оценить науровне 0,05 значимость уравнения регрессии.
Общая суммаквадратов отклонений y />= 281,27
Остаточнаясумма квадратов />= 169,59
Суммаквадратов, объясненная регрессией />=281,27–169,59 = 111,68
Величина F-критерия
/>= 9,23,
где m – число параметров(коэффициентов), рассчитанных по уравнению регрессии m=2.
Табличноезначение F-распределенияФишера для уровня значимости a=0,05 и числа степеней свободы k1=n-m=14 и k2=m-1=1 составляет F0,05,1,14=4,6.
Так какрасчетное значение F-критерия больше табличного критического, то уравнение регрессии y по x1 следует признатьзначимым, т.е. заслуживающим доверия.
Определимкоэффициент детерминации.
/>0,40
Вариациязависимой переменной (цены квартиры) на 40% определяется фактором x –площадью квартиры.
2. Парнаярегрессия y наx2.
а) Найтиуравнение линейной регрессии для x2.
№ п/п
yi
xi
y2
x2
x * y
xi – />
(xi –/>)2 1 22,5 15 506,25 225 337,5 1,9 3,61 2 26 10 676 100 260 -3,1 9,61 3 18,5 10 342,25 100 185 -3,1 9,61 4 13,2 25 174,24 625 330 11,9 141,61 5 25,8 10 665,64 100 258 -3,1 9,61 6 17 12 289 144 204 -1,1 1,21 7 18 15 324 225 270 1,9 3,61 8 21 20 441 400 420 6,9 47,61 9 14,5 10 210,25 100 145 1,9 3,61 10 23 5 529 25 115 -8,1 65,61 11 19,5 15 380,25 225 292,5 1,9 3,61 12 14,2 12 201,64 144 170,4 -1,1 1,21 13 13,3 5 176,89 25 66,5 -8,1 65,61 14 16,1 10 259,21 100 161 -3,1 9,61 15 13,5 25 182,25 625 337,5 11,9 141,61 16 16 10 256 100 160 -3,1 9,61 Сумма 292,1 209 5613,87 3263 3712,4 526,96 Средняя 18,2 13,1 350,9 203,94 232,025 32,9
Такимобразом, выборочные средние значения />= 13,1; />= 18,2; />= 232,025;
выборочнаядисперсия />= 32,9;
выборочнаяковариация cov(x,y) = />= 232,025-13,1*18,2 = -6,4;
Коэффициентырегрессии b1=/>= />= -0,19
/>= 18,2 – (-0,19)*13,1 = 20,7
Приувеличении времени пути до метро на 1 мин. цена квартиры в среднем снижается на0,19 тыс.$.
Уравнениерегрессии />= 20,7 – 0,19 * x.
б) рассчитатькоэффициент корреляции
/>
/>
Между временемпути до метро от квартиры и ценной квартиры наблюдается слабая отрицательнаязависимость.
в) определитьсреднюю величину y при x2=12.
/>
Средняя ценаквартиры при времени пути до метро 12 минут составляет 19.63 тыс.$.
Промежуточныевычисления для последующих расчетов проводим в таблице
№ п/п
yi
xi
/>
/>
/>
/>
/>
1 22,5 15 17,85 4,65 21,62 4.3 18.49
2 26 10 18,80 7,2 51,84 7.8 60.84
3 18,5 10 18,80 -0,3 0,09 0.3 0.09
4 13,2 25 15,95 -2,75 7,56 -5.0 25.00
5 25,8 10 18,80 7,0 49,0 7.6 57.76
6 17 12 18,42 -1,42 2,02 -1.2 1.44
7 18 15 17,85 0,15 0,02 -0.2 0.04
8 21 20 16,90 4,1 16,81 2.8 7.84
9 14,5 10 18,80 -4,3 18,49 -3.7 13.69
10 23 5 19,75 3,25 10,56 4.8 23.04
11 19,5 15 17,85 1,65 2,72 1.3 1.69
12 14,2 12 18,42 -4,22 17,81 -4.0 16.00
13 13,3 5 19,75 -6,45 41,60 -4.9 24.01
14 16,1 10 18,80 -2,7 7,29 -2.1 4.41
15 13,5 25 15,95 -2,45 6,003 -4.7 22.09
16 16 10 18,80 -2,8 7,84 -2.2 4.84
Сумма 292,1 209 261,27 281.27
Средняя 18,2 13,1 17.58
г) найти 95%доверительные интервалы для индивидуального и среднего значения y.
С учетомзначений из обеих таблиц:
Остаточнаядисперсия />
Дисперсиясреднего значения /> />
/>/>= 1,21
Стандартноеотклонение /> />
Дисперсияиндивидуального значения y0/>
/>
Стандартноеотклонение y0 />
Длядоверительной вероятности g=0,95 уровень значимости a = 1-g = 0,05.
Табличноезначение t-распределенияСтьюдента для уровня значимости a = 0,05 и числа степенейсвободы k= n-2 =16-2 =14 составляет t0.05,8 = 2,31.
Доверительныйинтервал для среднего значения />
/>
18,42 – 2,145×1,1 £ y £ 18,42 + 2,145×1,1
16,06£ y £ 20,78
Доверительныйинтервал для индивидуального значения />
/>
18,42 – 2,145×4,46 £ y0£ 18,42 + 2,145×4,46
8,85 £ y0£ 27,99
Сучетом возможных ошибок средняя цена квартиры с временем пути до метро 12 минутс вероятностью 95% лежит в пределах от 16,06 до 20,78 тыс.$; при этом отдельноцена квартиры колебаться от 8,85 до 27,99 тыс.$.
д) снадежностью 0,95 найти интервальные оценки коэффициента регрессии b1 и дисперсии возмущений s2.
Дисперсиякоэффициента регрессии />=/>= 0.035
Стандартноеотклонение />
Доверительныйинтервал для коэффициента регрессии b1
/>
-0,19–2,145×0,187 £ b1 £ -0,19 + 2,145×0,187
0,59£ b1 £ 0,21
С надежностью0,95 увеличение времени пути до метро на 1 минуту приводит к увеличению ценыквартиры на величину от – 0,59 до 0,21 тыс.$.
Табличныезначения распределения c2 Пирсона для уровня значимости 0,05 и числастепеней свободы 14 составляют
/>; />
Доверительныйинтервал дисперсии возмущений
/>
/>
11,44 £ s2 £ 53,03
Интервал длястандартного отклонения 3,38 £ s £ 7,28.
Снадежностью 0,95 дисперсия ошибок расчета находится в пределах от 11,44 до53,03, а стандартное отклонение цены квартиры от среднего значения лежит впределах от 3,38 до 7,28.
Оценить науровне 0,05 значимость уравнения регрессии.
Общая суммаквадратов отклонений y />= 281,27
Остаточнаясумма квадратов />= 261,27
Суммаквадратов, объясненная регрессией />=281,27–261,27 = 20
Величина F-критерия
/>= 1,07,
где m – число параметров(коэффициентов), рассчитанных по уравнению регрессии m=2.
Табличноезначение F-распределенияФишера для уровня значимости a=0,05 и числа степеней свободы k1=n-m=14 и k2=m-1=1 составляет F0,05,1,14=4,6.
Так какрасчетное значение F-критерия больше табличного критического, то уравнение регрессии y по x1 следует признатьзначимым, т.е. заслуживающим доверия.
Определимкоэффициент детерминации.
квартирастоимость регрессия вариация
/>0,07
Вариациязависимой переменной (цены квартиры) на 7% определяется фактором x –временем пути до метро.