После подстановки
значений получились следующие данные:
Оценим значимость параметров
модели по критерию Стьюдента.
Предположим, что
параметры и коэффициент корреляции стат.
значимы. Для расчёта
использую следующие формулы:
где: ta , tb , tr - расчётное значение t-критерия Стьюдента для параметров.
После подстановки данных
в формулы получил следующие значения:
Сравним полученное
значение с табличным t-критерием
Стьюдента. tтабличное при Р=0,05 и (n-2)= 2,1788. Так как tрасчётное > tтабличное , то параметры b и r уравнения типичны (значимы). Так как
tрасчётное < tтабличное , то параметры с и а незначимы.
Оценим уравнение в целом по критерию
Фишера, выдвигаем гипотезу Н0:о том, что коэффициент регрессии равен
нулю.
Fф=Dфакт/Dост=10333,6/906,597=11,398.
FT(v1=1;v2=12)=4,75.
Т.к. Fф > FT при 5%-ном уровне значимости гипотеза Н0 отвергается,
уравнение в целом стат. значимо.
5. Автокорреляция уровней временного
ряда.
Для выбора прогностической модели необходимо
исследовать автокорреляцию уровней динамического ряда, т.е. изучить
корреляционную связь между последовательными значениями уровней временного
ряда.
Таблица 9. Расчет коэффициента автокорреляции.
год
тыс.чел.
yt-1
yt-2
yt-3
1992
29,3
-
-
-
1993
29,25
29,3
-
-
1994
48,03
29,25
29,3
-
1995
60,06
48,03
29,25
29,3
1996
66,39
60,06
48,03
29,25
1997
96,26
66,39
60,06
48,03
1998
93,59
96,26
66,39
60,06
1999
84,74
93,59
96,26
66,39
2000
92,91
84,74
93,59
96,26
2001
81,26
92,91
84,74
93,59
2002
69,73
81,26
92,91
84,74
2003
76,85
69,73
81,26
92,91
2004
67,9
76,85
69,73
81,26
2005
54,13
67,9
76,85
69,73
итого
950,4
896,27
828,37
751,52
По данному ряду определяю серию
коэффициентов автокорреляции (автокорреляционную функцию):
Рис. 3. Коррелограмма для ряда
численности безработных в РБ за 1992-2005гг.
Коррелограмма представляет собой
затухающую функцию. По графику видно, что наиболее высоким оказался ra1=0,809, т.е. уровни текущего года на 80,9% обусловлены
уровнями предыдущего года. Поэтому ряд содержит только тенденцию и не содержит
периодических колебаний. В данном ряду отсутствует трендовая компонента Т и
циклическая (сезонная) компонента S.
3.3. Многофакторный корреляционно –
регрессионный анализ безработицы
Таблица 10. Исходные
данные.
год
Уровень безраб-цы
Индекс ВРП
Доход на душу насел-я
Доля пенсионеров
1992
5,8
77,3
51,7
18,7
1993
5,9
93,3
137,4
19,6
1994
9,8
85,5
11,2
20,2
1995
12,7
86,2
83,7
20,9
1996
14,9
93,5
89,6
21,5
1997
21,3
102,2
130,5
22,1
1998
22,2
94,2
72,2
22,5
1999
17,3
108
99,9
22,8
2000
19,1
104,9
111,2
22,9
2001
18,4
106,4
110,2
23,2
2002
15,4
106,4
121,5
23,3
2003
16,8
106,7
104,5
23,3
2004
15,3
103,7
104,4
23,5
2005
12
104,8
111,3
23,8
итого
206,9
1373,1
1339,3
308,3
средн
14,779
98,079
95,664
22,0214
Для корреляционно-регрессионного
анализа необходимо из нескольких факторов произвести предварительный отбор
факторов для регрессионной модели. Сделаем это по итогам расчета коэффициента
корреляции. А именно возьмем те факторы, связь которых с результативным
признаком будет выражена в большей степени. Начнем наш анализ с рассмотрения
следующих факторов:
- Индекс ВРП - x1 (%)
- Доход на душу населения – x2 (%)
- Доля пенсионеров - x3 (%)
Рассчитаем коэффициент корреляции для
линейной связи и для имеющихся факторов - x1, x2 и x3. Коэффициент корреляции определяется по следующей формуле:
где: и – дисперсии факторного и
результативного признака соответственно; xy – среднее значение суммы произведений значений факторного и
результативного признака; x и y – средние значения факторного и
результативного признака соответственно.
Для фактора x1 получаем коэффициент корреляции r1: r1= 0,627
Для фактора x2 получаем коэффициент корреляции r2: r2 =0,295
Для фактора x3 получаем коэффициент корреляции r3: r3=0,717
По полученным данным можно сделать
вывод о том, что:
1)Связь между x1 и y прямая (так как коэффициент корреляции положительный) и
умеренно сильная. Поэтому, будем использовать фактор в дальнейших расчётах.
2)Связь между x2 и y прямая (так как коэффициент корреляции положительный) и
умеренная, так как она находится между 0,21 и 0,30. Таким образом, возникает
необходимость исключить данный фактор из дальнейших исследований.
3)Связь между x3 и y прямая (так как коэффициент корреляции положительный) и
сильная. Также будем использовать данный фактор в дальнейших расчетах.
Таким образом, два наиболее
влиятельных фактора - индекс ВРП и доля пенсионеров. Для имеющихся факторов x1 и x3 составим уравнение множественной
регрессии. Для анализа воспользуемся линейной формой связи, т.е. составим
линейное уравнение, т.к. линейное уравнение легче подвергать анализу,
интерпретации.
Проверим факторы на
мультиколлинеарность, для чего рассчитаем коэффициент корреляции rx1x3:
где: и – дисперсии факторного и
результативного признака соответственно; x,y – среднее
значение суммы произведений значений факторного и результативного признака; x и y – средние
значения факторного и результативного признака соответственно.
Подставив имеющиеся данные (из
таблицы 10) в формулу, имеем следующее значение: rx1x3=0,8998. Полученный коэффициент говорит об
очень высокой связи, поэтому дальнейший анализ по обоим факторам вестись не
может. Однако в учебных целях продолжим анализ.
Проводим оценку существенности связи
с помощью коэффициента множественной корреляции:
где: ryx1 – коэффициент корреляции между y и x1; ryx3 – коэффициент корреляции между y и x3; rx1x3 – коэффициент корреляции между x1 и x3.
Подставив имеющиеся данные в формулу
и получим: R=0,717
Так как R < 0,8, то связь признаем не существенной, но, тем не
менее, в учебных целях, проводим дальнейшее исследование.
Уравнение прямой имеет
следующий вид: ŷ = a + bx1 + cx3
Для определения параметров уравнения
необходимо решить систему:
Для данного уравнения найдем ошибку
аппроксимации:
А> 5%, то данную модель нельзя
использовать на практике.
Проведем оценку параметров на типичность. Рассчитаем значения
величин:
S2=28,039
ma=1,415; mb=0,023; mс=0,8404;
ta=10,403; tb=0,01; tc=0,001.
Сравним полученные выше значения t для α = 0,05 и числа степеней
свободы (n-2) с теоретическим значением t-критерия
Стьюдента, который tтеор = 2,1788. Расчетные значения tb и tс < tтеор, значит данные параметры не значимы
и данное уравнение не используется для прогнозирования.
Далее оценим существенность
совокупного коэффициента множественной корреляции на основе F-критерия Фишера по формуле:
где: n – число уровней ряда; к – число параметров; R – коэффициент множественной
корреляции.
После расчета получаем: F=5,819
Сравним Fрасч с Fтеор для числа степеней свободы U1 = 9 и U2 = 2, видим, что 0,045 < 19,40, то
есть Fрасч < Fтеор - связь признаётся не существенной, то есть корреляция между
факторами x1, x3 и у не существенна.
3.4.
Прогнозирование безработицы
Определив наличие
тенденции, можно начать прогнозирование. Прогнозирование проводится следующими
методами:
1)на основе средних
показателей динамики;
2)на основе экстраполяции
тренда;
3)на основе скользящих и
экспоненциальных средних.
I. Сначала проведем прогнозирование
методом среднего абсолютного прироста. Для этого надо проверить выполняются ли
предпосылки. Вычисляем данные для подстановки в формулы предпосылок:
ρ2=
310,14
σ2ост
= 250,11
т.к. σ2ост<
ρ2 , условие выполняется, значит можно строить прогноз на
основе среднего абсолютного прироста. Вычислим средний абсолютный прирост:
, где yp- прогнозируемый уровень; yb- конечный уровень ряда как наиболее
близкий к прогнозируемому; L-период
упреждения; ∆- средний абс.прирост.
Подставляем значения yb=54,13 L=1 ∆=1,91 в функцию прогноза:
yp =54,13+1,91*1=56,04 – прогноз на
2006г.
yp =54,13+1,91*2=57,95 – прогноз на
2007г.
Фактически численность
безработных в 2006г. составила 60,6 тыс.чел.
Вычислим ошибку прогноза
для сравнения методов прогнозирования на точность: 60,6-56,04=4,56 тыс.чел.
Теперь составим прогноз
методом среднего темпа роста. Вычислим средний темп роста: yp= yb*КL
=1,0096
Подставим это значение в
формулу и составим прогноз на 2006г.:
yp=54,13*1,00961=54,65
Вычислим ошибку: 60,6-54,65=5,95тыс.чел.
Так как ошибка при
прогнозировании методом среднего абсолютного прироста меньше ошибки при
прогнозировании методом среднего темпа роста, то можно сделать вывод, что
прогнозирование первым методом дает более точные результаты. Поэтому мы
оставляем для анализа результатов данные прогноза полученные методом среднего
абсолютного прироста. Составим диаграмму при прогнозировании методом
абсолютного прироста.
Рис. 4.Численность
безработных при прогнозировании «методом абсолютного прироста»
II. Следующий способ прогнозирования -
методом экстраполяции тренда.
Ранее по аналитическому
выравниванию нашли уравнение параболы второй степени: у =13,37+13,94t-1,0017t2
Сделаем прогноз на 2006г.,
примем t=7, т.к. нумерация дат определена с
середины ряда, т.е. ∑t=0.
уp=13,37+13,94*7-1,0017*49=60,87 –
прогноз на 2006г.
Определим доверительный
интервал прогноза, в основе которого лежит показатель колеблемости уровней
ряда. Колеблемость уровней ряда определяется по формуле: Sy =
Sy=91,44
Интервал определяется с
помощью ошибки прогноза Sp= Sy*Q, где Q-
поправочный коэффициент, учитывающий период упреждения.
Q= = 1,2127
Тогда ошибка прогноза: Sp=91,44*1,2127=110,886
Соответственно
доверительный интервал прогноза составит: уp+t*Sp, где t-табличное значение t-критерия Стьюдента. При ά=0,05 и числе степеней свободы n-3= 11 t=2,2010.
уp+2,2010*110,886 или 61,87 +244,061,
т.е. -182,2< уp
<305,93
Значит, прогнозная
величина находится в данном интервале.
Рис.5. Численность
безработных при прогнозировании «методом экстраполяции тренда»
III. Метод скользящих и экспоненциальных
средних.
Ранее в своих расчетах я
определила, что ряд не содержит периодических колебаний и отсутствуют трендовая
компонента Т и циклическая (сезонная) компонента S. Поэтому нет необходимости использовать метод скользящих
средних.
Метод экспоненциальных
средних.
Экспоненциальное сглаживание является
простым методом, который в ряде наблюдений позволяет строить приемлемые
прогнозы наблюдаемых временных рядов. Суть метода в том, что исходный ряд x(t) сглаживается с некоторыми экспоненциальными весами,
образуется новый временной ряд S(t) (с меньшим уровнем шума), поведение
которого можно прогнозировать.
Веса в экспоненциальных
средних устанавливаются в виде коэффициентов ά(|ά|<1). В качестве
весов используется ряд:
ά; ά(1-
ά); ά(1- ά)2; ά(1- ά)3 и т.д.
Экспоненциальная средняя
определяется по формуле:
где Qt – экспоненциальная средняя
(сглаженное значение уровня ряда) на момент t; ά- вес текущего наблюдения при расчете экспонен.
средней; yt –фактический уровень ряда; Qt-1-экспонен. средняя предыдущего
периода.
Каждый новый прогноз
основывается на предыдущем прогнозе:
где St- прогноз для периода t; St-1-прогноз предыдущего периода; ά-
сглаживающая константа; yt -1- предыдущий уровень.
Например, St=29,3+0,5*(29,25-29,3)=29,275.
При прогнозе учитывается
ошибка предыдущего прогноза, т.е. каждый новый прогноз St получается в результате корректировки
предыдущего прогноза с учетом ошибки.
Таблица 12. Расчет
прогноза и ошибки.
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
yt
29,3
29,25
48,03
60,06
66,39
96,26
93,59
84,74
92,91
81,26
69,73
76,85
67,9
54,13
-
прогноз
-
29,3
29,28
38,65
49,36
57,87
77,07
85,33
85,03
88,97
85,12
77,42
77,14
72,52
60,32
ошибка
-
-0,05
18,76
21,41
17,03
38,39
16,52
-0,59
7,876
-7,71
-15,4
-0,57
-9,24
-18,4
-
Рис. 6. Экспоненциальное
сглаживание.
При прогнозировании могут
использоваться экспоненциальные средние более высоких порядков, полученные
путем многократного сглаживания. Экспоненциальная средняя К-го порядка:
Qt(к) = ά Qt(к-1) +(1-
ά) Qt-1(к)
Экспоненциальные средние
2-го, 3-го порядка применяются в адаптивном прогнозировании по полиномиальным
моделям. Для прогноза использован линейный тренд: y=a+bt. Его параметры связаны с
экспоненциальными средними 1-го (Qt(1)) и 2-го (Qt(2)) порядков:
соответственно:
Необходимо задать
начальные условия Qt-1к:
Линейный тренд: уt=49,25+2,49t
Параметр сглаживания
ά определим: ά=2/(n+1).
Так как n=14, то ά=2/(14+1)=0,13.
Соответственно (1-
ά)/ά=(1-0,13)/0,13=6,69, ά/(1- ά)=0,13/(1-0,13)=0,15.
Начальные условия для
экспоненциального сглаживания:
Qо(1)=а-6,69*b=49,25-6,69*2,49=32,59
Qo(2)=а-2*6,69*b=49,25-2*6,69*2,49=15,93
Экспоненциальные средние Qt(1) и Qt(2) составят:
Qt(1)= άyt+(1- ά) Qt-1(1)=0,13*84,11+(1-0,13)*32,59=39,28, где
yt=yt=n ;Qt-1(1)= Qо(1)
Qt(2)= άQt(1)+(1- ά) Qt-1(2)=0,13*39,28+(1-0,13)*15,93=18,97, где
Qt-1(2)= Qo(2)
Тогда скорректированные
параметры линейного тренда составят:
2*39,28-18,97=59,59
=0,15*(39,28-18,97)=3,0465
Прогноз производим по
модели: , где l-период упреждения.
Тогда при l=1 прогноз на 2006г. составит: уp=59,59+3,0465*1 =60,6т.ч.
Соответственно при
прогнозе на 2007г. берем l=2: уp=59,59+3,0465*2=65,683.
Таким образом, по результатам
проведенного анализа следует, что численность безработных в 2006 году возрастет
по сравнению с 2005г. на 6,5 тыс.чел. или 12% и составит 60,6 тыс.чел., а в
2007г. возрастет на 11,55 тыс.чел. и составит 65,68 тыс.человек.
3.5. Анализ динамики уровня
безработицы
1. Расчет аналитических (∆у, Тр, Тпр,
|%|) и средних
показателей рядов динамики.
Таблица 1. Расчетная
таблица для ∆у, Тр, Тпр,|%|.
год
уровень
безр-цы %
абс прирост
коэф-ты роста %
коэф-ты прироста %
абс знач-е
1% прироста
базис
цепн
базис
цепн
базис
цепн
1992
5,8
1993
5,9
0,10
0,1
1,017
1,017
0,017
0,017
580
1994
9,8
4,00
3,9
1,6897
1,661
0,6897
0,661
590
1995
12,7
6,90
2,9
2,1897
1,296
1,1897
0,296
980
1996
14,9
9,10
2,2
2,569
1,173
1,569
0,173
1270
1997
22
16,20
7,1
3,793
1,477
2,793
0,477
1490
1998
22,2
16,40
0,2
3,828
1,009
2,828
0,009
2200
1999
17,7
11,90
-4,5
3,052
0,797
2,052
-0,203
2220
2000
19,1
13,30
1,4
3,293
1,079
2,293
0,079
1770
2001
18,4
12,60
-0,7
3,172
0,963
2,172
-0,0367
1910
2002
15,4
9,60
-3,0
2,655
0,837
1,655
-0,163
1840
2003
16,9
11,10
1,5
2,914
1,097
1,914
0,097
1540
2004
15,3
9,50
-1,6
2,638
0,9053
1,6379
-0,095
1690
2005
12
6,20
-3,3
2,069
0,784
1,069
-0,216
1530
итого
208,1
6,2
Максимальное значение
абсолютного прироста (по цепной системе) зафиксировано в 1997 году (7,1%),
минимальное значение - в 1999 году(-4,5%). Максимальное значение абсолютного
прироста по базисной системе составило 16,4% в 1998 году, минимальное – 0,1 в
1993 году. В общем абсолютный прирост уровня безработицы по цепной, так и по
базисной системам с 1992 по 1998г увеличивается, а с 1998г уменьшается. Это
объясняется, прежде всего, неравномерностью освоения инвестиций по отношения к
периоду финансового года, что характеризует большой поток инвестиций на
завершение начатых проектов в конце года, и относительно небольшой поток их в
течение остального времени.
Коэффициенты роста и
прироста, как по базисной, так и по цепным системам также сначала
увеличиваются, а потом уменьшаются. Максимальный коэффициент роста как по
цепной зафиксирован в 1994г., по базисной в 1998г.- 3,828. Минимальное значение
коэффициента роста по цепной системе принимает в 2005 году и составляет 0,784,
а по базисной системе – в 1993 году и составляет 1,017.
Коэффициент прироста
достигает своего максимального значения по базисным системам в 1993г., и
составляет - 0,017, по цепной системе в 1998г. (2,828). Коэффициент прироста
достигает своего минимального значения: по цепной системе в 1998г., и
составляет - -0,216; по базисной системе -2,828 в 1998 года.
Так как темпы роста и
прироста зависят от коэффициентов роста и прироста, то их максимальные значения
будут также находиться по цепной системе в 1994 г., по базисной в 1998г. Максимальное значение темпа роста по цепной системе составляет 166,1%,
по базовой - 382,76 %, минимальное - 78,43 % и 101,72 % соответственно. Максимальное
значение темпа прироста по цепной системе составляет 66,102%, по базовой -
282,76%, минимальное соответственно - -21,57% и 1,724%.
Рассчитаем среднегодовой
уровень численности безработных:
У=280,1/14=20,01%, т.е.
за период 1992-2005гг. ежегодно уровень численности безработных составила
20,01%.
Средний абсолютный
прирост:
Равен ∆=6,2/13=0,48%,
т.е. за период с 1992-2005гг. в среднем ежегодно абсолют. прирост уровня
численности безработных составил 0,48%.
Средний коэффициент
роста:
Тр=1,042 или
104,2% - это говорит о том, что с 1992-2005гг. в среднем ежегодно темп роста
безработных составил 104,2%.
Средний темп прироста:
Тпр =
104,2%-100%= 4,2% - с 1992-2005гг. в среднем темп прироста достигал 4,2%.
2. Определение наличия
тенденции.
Выдвигаем гипотезу Н0
об отсутствии тенденции, проверка осуществляется на основе кумулятивного
t-критерия Стьюдента. Расчетное значение определяется по формуле: