Сборник рефератов

Курсовая работа: Статистический анализ и прогнозирование безработицы

а=13,37; b=13,94; c=-1,0017.

Соответственно уравнение тренда составит: у =13,37+13,94t-1,0017t2


Оценим параметры уравнения на типичность.

где: S2- остаточная уточнённая дисперсия; mа, mв, mr - ошибки по параметрам.

После подстановки значений получились следующие данные:

 

  


Оценим значимость параметров модели по критерию Стьюдента.

Предположим, что параметры и коэффициент корреляции стат.

значимы. Для расчёта использую следующие формулы:

где: ta , tb , tr - расчётное значение t-критерия Стьюдента для параметров.

После подстановки данных в формулы получил следующие значения:

   

Сравним полученное значение с табличным t-критерием Стьюдента. tтабличное при Р=0,05 и (n-2)= 2,1788. Так как tрасчётное > tтабличное , то параметры b и r уравнения типичны (значимы). Так как tрасчётное < tтабличное , то параметры с и а незначимы.

Оценим уравнение в целом по критерию Фишера, выдвигаем гипотезу Н0:о том, что коэффициент регрессии равен нулю.

Fф=Dфакт/Dост=10333,6/906,597=11,398.

FT(v1=1;v2=12)=4,75.

Т.к. Fф > FT при 5%-ном уровне значимости гипотеза Н0 отвергается, уравнение в целом стат. значимо.

5. Автокорреляция уровней временного ряда.

Для выбора прогностической модели необходимо исследовать автокорреляцию уровней динамического ряда, т.е. изучить корреляционную связь между последовательными значениями уровней временного ряда.

Таблица 9. Расчет коэффициента автокорреляции.

год тыс.чел.

yt-1

yt-2

yt-3

1992 29,3 - - -
1993 29,25 29,3 - -
1994 48,03 29,25 29,3 -
1995 60,06 48,03 29,25 29,3
1996 66,39 60,06 48,03 29,25
1997 96,26 66,39 60,06 48,03
1998 93,59 96,26 66,39 60,06
1999 84,74 93,59 96,26 66,39
2000 92,91 84,74 93,59 96,26
2001 81,26 92,91 84,74 93,59
2002 69,73 81,26 92,91 84,74
2003 76,85 69,73 81,26 92,91
2004 67,9 76,85 69,73 81,26
2005 54,13 67,9 76,85 69,73
итого 950,4 896,27 828,37 751,52

По данному ряду определяю серию коэффициентов автокорреляции (автокорреляционную функцию):

ra1=0,809, ra2=0,52, ra3=0,233, ra4=-0,421, ra5=-0,854, ra6=-0,746, ra7=-0,894, ra8=-0,907, ra9=-0,735, ra10=-0,898, ra11=-0,919.

Построим график автокорреляционной функции.

Рис. 3. Коррелограмма для ряда численности безработных в РБ за 1992-2005гг.

Коррелограмма представляет собой затухающую функцию. По графику видно, что наиболее высоким оказался ra1=0,809, т.е. уровни текущего года на 80,9% обусловлены уровнями предыдущего года. Поэтому ряд содержит только тенденцию и не содержит периодических колебаний. В данном ряду отсутствует трендовая компонента Т и циклическая (сезонная) компонента S.


3.3. Многофакторный корреляционно – регрессионный анализ безработицы

Таблица 10. Исходные данные.

год Уровень безраб-цы Индекс ВРП  Доход на душу насел-я Доля пенсионеров
1992 5,8 77,3 51,7 18,7
1993 5,9 93,3 137,4 19,6
1994 9,8 85,5 11,2 20,2
1995 12,7 86,2 83,7 20,9
1996 14,9 93,5 89,6 21,5
1997 21,3 102,2 130,5 22,1
1998 22,2 94,2 72,2 22,5
1999 17,3 108 99,9 22,8
2000 19,1 104,9 111,2 22,9
2001 18,4 106,4 110,2 23,2
2002 15,4 106,4 121,5 23,3
2003 16,8 106,7 104,5 23,3
2004 15,3 103,7 104,4 23,5
2005 12 104,8 111,3 23,8
итого 206,9 1373,1 1339,3 308,3
средн 14,779 98,079 95,664 22,0214

Для корреляционно-регрессионного анализа необходимо из нескольких факторов произвести предварительный отбор факторов для регрессионной модели. Сделаем это по итогам расчета коэффициента корреляции. А именно возьмем те факторы, связь которых с результативным признаком будет выражена в большей степени. Начнем наш анализ с рассмотрения следующих факторов:

- Индекс ВРП - x1 (%)

- Доход на душу населения – x2 (%)

- Доля пенсионеров - x3 (%)

Рассчитаем коэффициент корреляции для линейной связи и для имеющихся факторов - x1, x2 и x3. Коэффициент корреляции определяется по следующей формуле:

где:  и  – дисперсии факторного и результативного признака соответственно; xy – среднее значение суммы произведений значений факторного и результативного признака; x и y – средние значения факторного и результативного признака соответственно.

Для фактора x1 получаем коэффициент корреляции r1: r1= 0,627

Для фактора x2 получаем коэффициент корреляции r2: r2 =0,295

Для фактора x3 получаем коэффициент корреляции r3: r3=0,717

По полученным данным можно сделать вывод о том, что:

1)Связь между x1 и y прямая (так как коэффициент корреляции положительный) и умеренно сильная. Поэтому, будем использовать фактор в дальнейших расчётах.

2)Связь между x2 и y прямая (так как коэффициент корреляции положительный) и умеренная, так как она находится между 0,21 и 0,30. Таким образом, возникает необходимость исключить данный фактор из дальнейших исследований.

3)Связь между x3 и y прямая (так как коэффициент корреляции положительный) и сильная. Также будем использовать данный фактор в дальнейших расчетах.

Таким образом, два наиболее влиятельных фактора - индекс ВРП и доля пенсионеров. Для имеющихся факторов x1 и x3 составим уравнение множественной регрессии. Для анализа воспользуемся линейной формой связи, т.е. составим линейное уравнение, т.к. линейное уравнение легче подвергать анализу, интерпретации.

Проверим факторы на мультиколлинеарность, для чего рассчитаем коэффициент корреляции rx1x3:

где:  и  – дисперсии факторного и результативного признака соответственно; x,y – среднее значение суммы произведений значений факторного и результативного признака; x и y – средние значения факторного и результативного признака соответственно.

Подставив имеющиеся данные (из таблицы 10) в формулу, имеем следующее значение: rx1x3=0,8998. Полученный коэффициент говорит об очень высокой связи, поэтому дальнейший анализ по обоим факторам вестись не может. Однако в учебных целях продолжим анализ.

Проводим оценку существенности связи с помощью коэффициента множественной корреляции:

где: ryx1 – коэффициент корреляции между y и x1; ryx3 – коэффициент корреляции между y и x3; rx1x3 – коэффициент корреляции между x1 и x3.

Подставив имеющиеся данные в формулу и получим: R=0,717

Так как R < 0,8, то связь признаем не существенной, но, тем не менее, в учебных целях, проводим дальнейшее исследование.


Уравнение прямой имеет следующий вид: ŷ = a + bx1 + cx3

Для определения параметров уравнения необходимо решить систему:

Решив систему, получим уравнение: Ŷ=14,72+0,00023 x1+0,00086x3

Для данного уравнения найдем ошибку аппроксимации:

А> 5%, то данную модель нельзя использовать на практике.

Проведем оценку параметров на типичность. Рассчитаем значения величин:

S2=28,039

ma=1,415; mb=0,023; mс=0,8404;

ta=10,403; tb=0,01; tc=0,001.

Сравним полученные выше значения t для α = 0,05 и числа степеней свободы (n-2) с теоретическим значением t-критерия Стьюдента, который tтеор = 2,1788. Расчетные значения tb и tс < tтеор, значит данные параметры не значимы и данное уравнение не используется для прогнозирования.

Далее оценим существенность совокупного коэффициента множественной корреляции на основе F-критерия Фишера по формуле:

где: n – число уровней ряда; к – число параметров; R – коэффициент множественной корреляции.

После расчета получаем: F=5,819

Сравним Fрасч с Fтеор для числа степеней свободы U1 = 9 и U2 = 2, видим, что 0,045 < 19,40, то есть Fрасч < Fтеор - связь признаётся не существенной, то есть корреляция между факторами x1, x3 и у не существенна.

3.4. Прогнозирование безработицы

Определив наличие тенденции, можно начать прогнозирование. Прогнозирование проводится следующими методами:

1)на основе средних показателей динамики;

2)на основе экстраполяции тренда;

3)на основе скользящих и экспоненциальных средних.

I. Сначала проведем прогнозирование методом среднего абсолютного прироста. Для этого надо проверить выполняются ли предпосылки. Вычисляем данные для подстановки в формулы предпосылок:

ρ2= 310,14

σ2ост = 250,11

т.к. σ2ост< ρ2 , условие выполняется, значит можно строить прогноз на основе среднего абсолютного прироста. Вычислим средний абсолютный прирост:

 , где yp- прогнозируемый уровень; yb- конечный уровень ряда как наиболее близкий к прогнозируемому; L-период упреждения; ∆- средний абс.прирост.

Подставляем значения yb=54,13 L=1 ∆=1,91 в функцию прогноза:

yp =54,13+1,91*1=56,04 – прогноз на 2006г.

yp =54,13+1,91*2=57,95 – прогноз на 2007г.

Фактически численность безработных в 2006г. составила 60,6 тыс.чел.

Вычислим ошибку прогноза для сравнения методов прогнозирования на точность: 60,6-56,04=4,56 тыс.чел.

Теперь составим прогноз методом среднего темпа роста. Вычислим средний темп роста: yp= yb*КL

=1,0096

Подставим это значение в формулу и составим прогноз на 2006г.:

yp=54,13*1,00961=54,65

Вычислим ошибку: 60,6-54,65=5,95тыс.чел.

Так как ошибка при прогнозировании методом среднего абсолютного прироста меньше ошибки при прогнозировании методом среднего темпа роста, то можно сделать вывод, что прогнозирование первым методом дает более точные результаты. Поэтому мы оставляем для анализа результатов данные прогноза полученные методом среднего абсолютного прироста. Составим диаграмму при прогнозировании методом абсолютного прироста.

Рис. 4.Численность безработных при прогнозировании «методом абсолютного прироста»

II. Следующий способ прогнозирования - методом экстраполяции тренда.

Ранее по аналитическому выравниванию нашли уравнение параболы второй степени: у =13,37+13,94t-1,0017t2

Сделаем прогноз на 2006г., примем t=7, т.к. нумерация дат определена с середины ряда, т.е. ∑t=0.

уp=13,37+13,94*7-1,0017*49=60,87 – прогноз на 2006г.

Определим доверительный интервал прогноза, в основе которого лежит показатель колеблемости уровней ряда. Колеблемость уровней ряда определяется по формуле: Sy =

Sy=91,44

Интервал определяется с помощью ошибки прогноза Sp= Sy*Q, где Q- поправочный коэффициент, учитывающий период упреждения.

Q= = 1,2127

Тогда ошибка прогноза: Sp=91,44*1,2127=110,886

Соответственно доверительный интервал прогноза составит: уp+t*Sp, где t-табличное значение t-критерия Стьюдента. При ά=0,05 и числе степеней свободы n-3= 11 t=2,2010.

уp+2,2010*110,886 или 61,87 +244,061, т.е. -182,2< уp <305,93

Значит, прогнозная величина находится в данном интервале.

Рис.5. Численность безработных при прогнозировании «методом экстраполяции тренда»

III. Метод скользящих и экспоненциальных средних.

Ранее в своих расчетах я определила, что ряд не содержит периодических колебаний и отсутствуют трендовая компонента Т и циклическая (сезонная) компонента S. Поэтому нет необходимости использовать метод скользящих средних.

Метод экспоненциальных средних.

Экспоненциальное сглаживание является простым методом, который в ряде наблюдений позволяет строить приемлемые прогнозы наблюдаемых временных рядов. Суть метода в том, что исходный ряд x(t) сглаживается с некоторыми экспоненциальными весами, образуется новый временной ряд S(t) (с меньшим уровнем шума), поведение которого можно прогнозировать.

Веса в экспоненциальных средних устанавливаются в виде коэффициентов ά(|ά|<1). В качестве весов используется ряд:

ά; ά(1- ά); ά(1- ά)2; ά(1- ά)3 и т.д.

Экспоненциальная средняя определяется по формуле:

где Qt – экспоненциальная средняя (сглаженное значение уровня ряда) на момент t; ά- вес текущего наблюдения при расчете экспонен. средней; yt –фактический уровень ряда; Qt-1-экспонен. средняя предыдущего периода.

Каждый новый прогноз основывается на предыдущем прогнозе:

St= St-1+ά(yt -1- St-1),

где St- прогноз для периода t; St-1-прогноз предыдущего периода; ά- сглаживающая константа; yt -1- предыдущий уровень.

Например, St=29,3+0,5*(29,25-29,3)=29,275.

При прогнозе учитывается ошибка предыдущего прогноза, т.е. каждый новый прогноз St получается в результате корректировки предыдущего прогноза с учетом ошибки.


Таблица 12. Расчет прогноза и ошибки.

1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006

 yt

29,3 29,25 48,03 60,06 66,39 96,26 93,59 84,74 92,91 81,26 69,73 76,85 67,9 54,13  -
прогноз  - 29,3 29,28 38,65 49,36 57,87 77,07 85,33 85,03 88,97 85,12 77,42 77,14 72,52 60,32
ошибка  - -0,05 18,76 21,41 17,03 38,39 16,52 -0,59 7,876 -7,71 -15,4 -0,57 -9,24 -18,4  -

Рис. 6. Экспоненциальное сглаживание.

При прогнозировании могут использоваться экспоненциальные средние более высоких порядков, полученные путем многократного сглаживания. Экспоненциальная средняя К-го порядка:

Qt(к) = ά Qt(к-1) +(1- ά) Qt-1(к)

Экспоненциальные средние 2-го, 3-го порядка применяются в адаптивном прогнозировании по полиномиальным моделям. Для прогноза использован линейный тренд: y=a+bt. Его параметры связаны с экспоненциальными средними 1-го (Qt(1)) и 2-го (Qt(2)) порядков:

 

соответственно:   

Необходимо задать начальные условия Qt-1к:

 

Линейный тренд: уt=49,25+2,49t

Параметр сглаживания ά определим: ά=2/(n+1).

Так как n=14, то ά=2/(14+1)=0,13.

Соответственно (1- ά)/ά=(1-0,13)/0,13=6,69, ά/(1- ά)=0,13/(1-0,13)=0,15.

Начальные условия для экспоненциального сглаживания:

Qо(1)=а-6,69*b=49,25-6,69*2,49=32,59

Qo(2)=а-2*6,69*b=49,25-2*6,69*2,49=15,93

Экспоненциальные средние Qt(1) и Qt(2) составят:

Qt(1)= άyt+(1- ά) Qt-1(1)=0,13*84,11+(1-0,13)*32,59=39,28, где yt=yt=n ;Qt-1(1)= Qо(1)

Qt(2)= άQt(1)+(1- ά) Qt-1(2)=0,13*39,28+(1-0,13)*15,93=18,97, где Qt-1(2)= Qo(2)

Тогда скорректированные параметры линейного тренда составят:

2*39,28-18,97=59,59

=0,15*(39,28-18,97)=3,0465

Прогноз производим по модели: , где l-период упреждения.

Тогда при l=1 прогноз на 2006г. составит: уp=59,59+3,0465*1 =60,6т.ч.

Соответственно при прогнозе на 2007г. берем l=2: уp=59,59+3,0465*2=65,683.

Таким образом, по результатам проведенного анализа следует, что численность безработных в 2006 году возрастет по сравнению с 2005г. на 6,5 тыс.чел. или 12% и составит 60,6 тыс.чел., а в 2007г. возрастет на 11,55 тыс.чел. и составит 65,68 тыс.человек.


3.5. Анализ динамики уровня безработицы

1. Расчет аналитических (∆у, Тр, Тпр, |%|) и средних показателей рядов динамики.

Таблица 1. Расчетная таблица для ∆у, Тр, Тпр,|%|.

год

уровень
безр-цы %

абс прирост коэф-ты роста % коэф-ты прироста %

абс знач-е
1% прироста

базис цепн базис цепн базис цепн
1992 5,8
1993 5,9 0,10 0,1 1,017 1,017 0,017 0,017 580
1994 9,8 4,00 3,9 1,6897 1,661 0,6897 0,661 590
1995 12,7 6,90 2,9 2,1897 1,296 1,1897 0,296 980
1996 14,9 9,10 2,2 2,569 1,173 1,569 0,173 1270
1997 22 16,20 7,1 3,793 1,477 2,793 0,477 1490
1998 22,2 16,40 0,2 3,828 1,009 2,828 0,009 2200
1999 17,7 11,90 -4,5 3,052 0,797 2,052 -0,203 2220
2000 19,1 13,30 1,4 3,293 1,079 2,293 0,079 1770
2001 18,4 12,60 -0,7 3,172 0,963 2,172 -0,0367 1910
2002 15,4 9,60 -3,0 2,655 0,837 1,655 -0,163 1840
2003 16,9 11,10 1,5 2,914 1,097 1,914 0,097 1540
2004 15,3 9,50 -1,6 2,638 0,9053 1,6379 -0,095 1690
2005 12 6,20 -3,3 2,069 0,784 1,069 -0,216 1530
итого 208,1 6,2

Максимальное значение абсолютного прироста (по цепной системе) зафиксировано в 1997 году (7,1%), минимальное значение - в 1999 году(-4,5%). Максимальное значение абсолютного прироста по базисной системе составило 16,4% в 1998 году, минимальное – 0,1 в 1993 году. В общем абсолютный прирост уровня безработицы по цепной, так и по базисной системам с 1992 по 1998г увеличивается, а с 1998г уменьшается. Это объясняется, прежде всего, неравномерностью освоения инвестиций по отношения к периоду финансового года, что характеризует большой поток инвестиций на завершение начатых проектов в конце года, и относительно небольшой поток их в течение остального времени.

Коэффициенты роста и прироста, как по базисной, так и по цепным системам также сначала увеличиваются, а потом уменьшаются. Максимальный коэффициент роста как по цепной зафиксирован в 1994г., по базисной в 1998г.- 3,828. Минимальное значение коэффициента роста по цепной системе принимает в 2005 году и составляет 0,784, а по базисной системе – в 1993 году и составляет 1,017.

Коэффициент прироста достигает своего максимального значения по базисным системам в 1993г., и составляет - 0,017, по цепной системе в 1998г. (2,828). Коэффициент прироста достигает своего минимального значения: по цепной системе в 1998г., и составляет - -0,216; по базисной системе -2,828 в 1998 года.

Так как темпы роста и прироста зависят от коэффициентов роста и прироста, то их максимальные значения будут также находиться по цепной системе в 1994 г., по базисной в 1998г. Максимальное значение темпа роста по цепной системе составляет 166,1%, по базовой - 382,76 %, минимальное - 78,43 % и 101,72 % соответственно. Максимальное значение темпа прироста по цепной системе составляет 66,102%, по базовой - 282,76%, минимальное соответственно - -21,57% и 1,724%.

Рассчитаем среднегодовой уровень численности безработных:

У=280,1/14=20,01%, т.е. за период 1992-2005гг. ежегодно уровень численности безработных составила 20,01%.

Средний абсолютный прирост:

Равен ∆=6,2/13=0,48%, т.е. за период с 1992-2005гг. в среднем ежегодно абсолют. прирост уровня численности безработных составил 0,48%.

Средний коэффициент роста:

Тр=1,042 или 104,2% - это говорит о том, что с 1992-2005гг. в среднем ежегодно темп роста безработных составил 104,2%.

Средний темп прироста:

Тпр = 104,2%-100%= 4,2% - с 1992-2005гг. в среднем темп прироста достигал 4,2%.

2. Определение наличия тенденции.

Выдвигаем гипотезу Н0 об отсутствии тенденции, проверка осуществляется на основе кумулятивного t-критерия Стьюдента. Расчетное значение определяется по формуле:

, где  

Таблица 2. Для расчёта характеристик S2 и Z2.

год

уровень
безр-цы %

S2

Z2

1992 5,8 82,16128 82,16
1993 5,9 80,35842 162,5197
1994 9,8 25,64699 188,1667
1995 12,7 4,684133 192,8508
1996 14,9 0,001276 192,8521
1997 22 50,91842 243,7705
1998 22,2 53,8127 297,5832
1999 17,7 8,041276 305,6245
2000 19,1 17,94128 323,5658
2001 18,4 12,50128 336,067
2002 15,4 0,28699 336,354
2003 16,9 4,144133 340,4982
2004 15,3 0,189847 340,688
2005 12 8,204133 348,8921
итого 208,1 348,8921 3691,593

Tp= 10,581; tp=4,26

Страницы: 1, 2, 3, 4, 5


© 2010 СБОРНИК РЕФЕРАТОВ