Сборник рефератов

Контрольная работа: Линейные регрессионные модели

Согласно критерию Стьюдента 2 параметра модели a=27,18 и =-0,122 незначимы с приемлемыми уровнями >0,05 и >0,05. Следовательно, эта модель неудачна и не может быть использована к анализу и прогнозу индекса цен платных услуг. Следует изменить спецификацию модели (необходимо убрать фактор Х1).

Используя инструмент РЕГРЕССИЯ, оценим 2 модель.

1 этап. Оценка значимости модели в целом.

Таблица 5.

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R 0,984045
R-квадрат 0,968344
Нормированный R-квадрат 0,964827
Стандартная ошибка 0,445346
Наблюдения 11
Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия 1 54,60227273 54,60227 275,3055768 0,0000000468
Остаток 9 1,785 0, 198333
Итого 10 56,38727273      

Модель линейной регрессии с фактором X6 значима в целом согласно F-критерию (F=275,306) с приемлемым уровнем значимости 0,0000000468 ≤ 0,05

Итак, получаем модель

2 этап. Оценка параметров модели.

 

Коэф-ты

Станд. ошибка

t-стат.

P-Значение

Y-пересечение 12,98182 5,351909883 2,425642 0,038255004
X6 0,880682 0,05307763 16,59233 0,0000000468

Согласно критерию Стьюдента 2 параметра модели a=12,98 и b=0,88 значимы с приемлемыми уровнями <0,05 и <0,05.

3 этап. Проверка наличия необходимых свойств у остатка модели.

Таблица 6.

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

Стандартные остатки

1 101,05 -0,05 -0,118345267
2 101,05 -0,45 -1,065107404
3 101,05 0,15 0,355035801
4 101,05 -0,25 -0,591726335
5 101,05 -0,05 -0,118345267
6 108,8 0,00000000000132 0,000000000003128
7 101,05 1,15 2,721941143
8 101,05 0,15 0,355035801
9 101,05 -0,25 -0,591726335
10 101,05 -0,25 -0,591726335
11 101,05 -0,15 -0,355035801

График 1.

 

Проверяем случайность остатков Первое, что требуется, это чтобы график остатков располагался в горизонтальной полосе, симметричной относительно оси абсцисс. Согласно предпосылкам МНК возмущение должно быть случайной величиной с нулевым математическим ожиданием. Это имеет место для получения однофакторной регрессии. График остатка (возмущения, ошибки) располагается в горизонтальной полосе. Имеется большое количество локальных экстремумов (максимумов и минимумов). -значит остатки случайные.

Согласно следующей предпосылке остатки должны быть равноизменчивы. Для проверки этой предпосылки используем в Microsoft Excel инструмент "Среднее значение".

 

-0,000000000000006.

Проверка на гомоскедастичность по методу Гольдфельда-Квандта невозможна, так как недостаточно наблюдений (должно быть n>12m) /

Проверим отсутствие автокорреляции остатков. Для этого чаще всего используют критерий Дарбина Уотсона (d-критерий):

.

находится в Microsoft Excel при помощи инструмента "СУММКВРАЗН"

=3,215

, берется из таблицы 4.1 "SS"/ "остаток"

1,785

d=.

Критерий Дарбина Уотсона (d-критерий): n=12, m=1, , dl=0,97,du=1,33

             I     dl     II  du    III         IV 4-du   V  4-dl        VI           

      0         0,97      1,33        2         2,67       3,03          4

d=1,801III, IV. Значит нет оснований отклонить предположение об отсутствии автокорреляции соседних остатков по d-критерию с уровнем значимости .

Следующее необходимое условие: остатки должны иметь распределение Гаусса. можно ограничиться критерием размахов (RS - критерий).

.

-стандартная ошибка модели

=0,445346.

находится в Microsoft Excel при помощи функции "МАКС".

=1,15.

 находится в Microsoft Excel при помощи функции "МИН".

=-0,45.

RS=3,59

Критерий размахов, RS - критерий: n=12, α =0,05, a=2,8, b=3,91.

Если a <RS < b, то остатки имеют нормальный закон распределения с уровнем α =0,05.

2,8 <3,59 < 3,91.

Вывод: Все предпосылки регрессионного анализа выполняются с уровнем α =0,05. Значит модель успешно прошла проверку оценки ее качества.

Используя инструмент РЕГРЕССИЯ, оценим 3 модель.

1 этап. Оценка значимости модели в целом.

Таблица 7.

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R 0,863178866
R-квадрат 0,745077754
Нормированный R-квадрат 0,71675306
Стандартная ошибка 1,263784889
Наблюдения 11
Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия 1 42,01290252 42,0129 26,30488273 0,000620555
Остаток 9 14,37437021 1,597152
Итого 10 56,38727273      

Модель линейной регрессии с фактором X5 значима в целом согласно F-критерию (F=26,304) с приемлемым уровнем значимости 0,0000000468 ≤ 0,05

Итак, получаем модель

 

Коэф-ты

Станд. ошибка

t-стат.

P-Значение

Нижние 95%

Y-пересечение 55,68196551 8,991138974 6, 192982 0,00016021 35,34258057
Х5 0,453226954 0,088368512 5,128829 0,000620555 0,253323338

Согласно критерию Стьюдента 2 параметра модели a=55,68 и b=0,453 значимы с приемлемыми уровнями <0,05 и <0,05.

3 этап. Проверка наличия необходимых свойств у остатка модели.

Таблица 8.

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное 101,3

Остатки

Стандартные остатки

1 101,0953062 -0,095306249 -0,079492648
2 101,1406289 -0,540628945 -0,450925589
3 98,91981687 2,280183127 1,901845857
4 101,3219197 -0,521919726 -0,43532068
5 101,9564375 -0,956437461 -0,797741462
6 107,3045155 1,495484488 1,247347611
7 101,0499836 1,150016446 0,959201034
8 101,0046609 0, 195339141 0,162927675
9 102,5909552 -1,790955196 -1,493792616
10 101,1406289 -0,340628945 -0,284110403
11 101,7751467 -0,87514668 -0,729938779

График 2.

Проверяем случайность остатков. Согласно предпосылкам МНК возмущение должно быть случайной величиной с нулевым математическим ожиданием. Это имеет место для получения однофакторной регрессии. График остатка (возмущения, ошибки) располагается в горизонтальной полосе. Имеется большое количество локальных экстремумов (максимумов и минимумов). -значит остатки случайные.

Согласно следующей предпосылке остатки должны быть равно изменчивы. Для проверки этой предпосылки используем в Microsoft Excel инструмент "Среднее значение".

 

-0,0000000000000026.

Проверка на гомоскедастичность по методу Гольдфельда-Квандта невозможна, так как недостаточно наблюдений (должно быть n>12m) /

Проверим отсутствие автокорреляции остатков. Для этого чаще всего используют критерий Дарбина Уотсона (d-критерий):

.

находится в Microsoft Excel при помощи инструмента "СУММКВРАЗН"

=29,573

, берется из таблицы 4.1 "SS"/ "остаток"

14,374

d=.


Критерий Дарбина Уотсона (d-критерий): n=12, m=1, , dl=0,97,du=1,33

             I     dl     II  du    III         IV 4-du   V  4-dl        VI           

      0         0,97      1,33        2         2,67       3,03          4

d=2,057III, IV. Значит нет оснований отклонить предположение об отсутствии автокорреляции соседних остатков по d-критерию с уровнем значимости . Следующее необходимое условие: остатки должны иметь распределение Гаусса. можно ограничиться критерием размахов (RS - критерий).

.

-стандартная ошибка модели

=1,263784889.

находится в Microsoft Excel при помощи функции "МАКС".

=.2,280183127

 находится в Microsoft Excel при помощи функции "МИН".

=-1,790955196

RS=3,22138

Критерий размахов, RS - критерий: n=12, α =0,05, a=2,8, b=3,91.

Если a <RS < b, то остатки имеют нормальный закон распределения с уровнем α =0,05.

2,8 <3,22138 < 3,91.


Вывод: Все предпосылки регрессионного анализа выполняются с уровнем α =0,05. Значит модель успешно прошла проверку оценки ее качества.

3. Предложить модели тренда изучаемого показателя. Оценить качество моделей

Линейный тренд у показателя связан с ситуацией, когда наибольшим является коэффициент автокорреляции первого порядка.

>0,7, при это , где a,bR.

При выборе модели тренда нельзя выбирать функцию тренда с числом параметров при факторе время больше шестой части n, то есть m>.

Существует несколько видов тренда (линейный, полиномиальный, степенной, логарифмический, гиперболический). Из них необходимо выбрать наилучший вид тренда.

Построим графики основных типов тренда. Для выявления наилучшего уравнения тренда определим параметры трендов. Результаты расчетов представим в таблице 9. Согласно, данным этой таблицы наилучшей моделью тренда является полиномиальный тренд, для которого значение коэффициента детерминации наиболее высокое.


График 3. Линейный тренд.

График 4. Полиномиальный тренд.

График 5. Степенной тренд.


График 6. Экспоненциальный тренд.

 

Таблица 9.

Тип тренда Уравнение

Линейный

0,0016
Полиномиальный

0,1371
Степенной

0,0125
Экспоненциальный

0,0016

Итак, рассмотрим модель тренда. Но у показателя Y явно нет никакой тенденции (тренда), так как для  =0.1371<0,3. Модель неудачна.

4. Используя значимые в целом и по параметрам модели (с приемлемым уровнем значимости), для которых выполняются все предпосылки метода наименьших квадратов (свойств остатков), получит прогнозы изучаемого показателя на два следующих месяца.

Модели ,  значимы в целом и по параметрам и для них выполняются все предпосылки МНК. По этим моделям можно строить прогнозы изучаемого показателя. Различают точечный и доверительный прогнозы показателя. Точечный прогноз получают путем подстановки в уравнение регрессии значения фактора x, и он имеет нулевую вероятность. Этот прогноз полезен при формировании доверительного прогноза.

Пусть в модели  Х5 в последующих два будет увеличиваться на столько на сколько и в прошлом месяце 1,7% (в% к предыдущему периоду). Значит Х5 в следующем периоде уменьшится на 1%.

1,017*101,69103,41

55,68+0,453*103,41=102,52.

Доверительная вероятность равна 95%

где

=1,59, =0,55, тогда

102,52-5,12*0,55≤≤102,52+5,12*0,55

99,704≤≤105,33.


4. Сравнить полученные прогнозы показателей с фактическими данными

Получили, что в последующих двух месяцах изучаемый показатель будет колебаться в интервале от 99,704 до 105,33.

В июле 0,99*101,69100,67

55,68+0,453*100,67=101100,9 (как и фактические данные).

В августе0,98*101,6999,65

55,68+0,453*99,65100,82 (как и фактические данные)


Страницы: 1, 2, 3


© 2010 СБОРНИК РЕФЕРАТОВ