Сборник рефератов

Курсовая работа: Средние величины и показатели вариации

Рассматривая зарегистрированные при статистическом наблюдении величины того или иного признака у отдельных единиц совокупности, обнаруживаем, что они различаются между собой, колеблются, так как у каждой из единиц они складываются под действием многих причин и условий. Эти различия индивидуальных значений признака внутри изучаемой совокупности в статистике называют вариацией признака.

Вариация делится на случайную и систематическую. Вариация признака, которая не зависит от факторов, положенных в основу группировки, называется случайной вариацией. Например, в условиях налаженного и поддерживаемого в устойчивом состоянии технологического процесса наблюдаются случайные различия в качестве выпускаемой продукции, возникают эти различия под влиянием не поддающихся контролю и учету факторов, то есть случайных факторов. Вариация признака, которая зависит от факторов, положенных в основу выделения группы, называется систематической вариацией. При систематической вариации значения признака в пределах совокупности варьируют при переходе от одной группы к другой в связи с изменением группировочных признаков. Например, качество одного и того же вида продукции будет различно в различных условиях организации технологического процесса.

Показатели вариации являются числовой мерой уровня колеблемости признака, они измеряют отклонения от средних и дают возможность установить насколько однороден состав данной совокупности по изучаемому признаку, насколько надежна, типична средняя величина. Чем однороднее состав совокупности, тем более близки между собой отдельные значения признака, тем меньше разбросанность этих значений вокруг средней величины.

Наиболее распространенными (основными) характеристиками вариации являются размах вариации , среднее линейное отклонение , среднее квадратическое отклонение , дисперсия  и коэффициент вариации .

Самой простой характеристикой служит размах вариации  - разность между наибольшим и наименьшим признаками. Размах вариации – довольно грубая характеристика разбросанности ряда, так как и минимальное и максимальное значения сами могут быть весьма нетипичными для данной совокупности.

Среднее линейное отклонение опирается на учет индивидуальных отклонений вариант от средней арифметической величины данного ряда и определяется как средняя арифметическая из абсолютных величин этих отклонений.

Для первичных данных -  (8)

Для вторичных данных -  (9)

Этот показатель дает необъективную оценку вариации, как правило, занижает ее.

Дисперсия – это средняя арифметическая из квадратов отклонений индивидуальных значений признака от средней арифметической величины ряда. Для первичных данных дисперсия определяется по формуле:

, (10)

где

Для вторичных данных - , (11)

где .

Среднее квадратическое отклонение определяется по формуле . Среднее квадратическое отклонение является наиболее распространенным показателем степени вариации.

Размах вариации, среднее линейное отклонение и среднее квадратическое отклонение – это абсолютные меры вариации. Они выражаются в единицах измерения варьирующего признака. С их помощью можно сравнивать вариацию только одного и того же признака в разных распределениях, например, вариацию заработной платы рабочих на разных предприятиях какой - то отрасли, стаж работы рабочих различных отраслей. Причем сравнивать, например, средние квадратические отклонения вариационных рядов с разными средними уровнями непосредственно нельзя, так как по своему абсолютному значению квадратическое отклонение зависит не только от степени вариации признака, но и от абсолютных уровней вариант и средней.

Коэффициент вариации является относительной мерой вариации, определяется по формуле  (12), позволяет сравнивать степень варьирования признаков в вариационных рядах с разным уровнем средних, а также служит для сравнения вариации разных явлений.

Величина коэффициента вариации оценивает интенсивность колебаний признаков относительно их средней величины. Принята следующая оценочная шкала колеблемости признака:

% - колеблемость незначительная (невысокая)

% - колеблемость средняя (умеренная)

% - колеблемость значительная

Если его величина не превышает 33%, это говорит о типичности, надежности средней величины, об однородности совокупности.

Если он более 33%, то все указанные выводы следует изменить на противоположные.

Проиллюстрируем расчет показателей вариации на основе исходных расчетных данных примера 2.1.


Пример 4.9. Имеется следующий ряд распределения работников по стажу

Стаж, г. Число работников, чел.

2-5

5-8

8-11

4

5

2

Итого 11

Определить:

- размах вариации

- дисперсию

- среднее квадратическое отклонение

- коэффициент вариации

Решение:

1. Размах вариации

 лет

Размах вариации лучше определять по первичным данным, что мы уже делали при расчете величины интервала группировки  (см. пример 2.1). Для расчета остальных показателей оформим рабочую таблицу

Стаж, лет Число работников, чел

2-5

5-8

8-11

4

5

2

3,5

6,5

9,5

14,0

32,5

19,0

(3,5-5,955)2∙4=24,108

(6,5-5,955)2∙5=1,485

25,134

Итого 11 65,5 50,727

 лет

Дисперсия равна:


Среднее квадратическое отклонение равно

Коэффициент вариации равен

%

Анализ полученных данных говорит о том, что стаж работников предприятия отличается от среднего стажа  в среднем на 2,147 года или на 43,3%. Коэффициент вариации превышает 33%, и 40%, следовательно, вариация производственного стажа умеренная, найденный средний стаж плохо представляет всю совокупность работников, не является ее типичной, надежной характеристикой, а саму совокупность нет оснований считать однородной по производственному стажу.

5. Виды дисперсий

Правило сложения дисперсий. Коэффициент детерминации и эмпирическое корреляционное отношение

В статистике важно рассчитывать дисперсии для результативного признака , опираясь на данные аналитической группировки.

В этом случае дисперсии примут вид:

- общая дисперсия


 (13)

- внутригрупповые дисперсии

 (14)

- средняя из внутригрупповых дисперсий

 (15)

- межгрупповая дисперсия

 (16)

где  - общая средняя

- средняя -ой группы

Правило сложения дисперсий

 (17)

На основе этого правила рассчитывают эмпирические показатели тесноты корреляционной связи между факторным и результативным признаками.

Если учесть, что величина межгрупповой дисперсии характеризует влияние только факторного признака, а величина общей дисперсии помимо факторного признака характеризует влияние и всех остальных признаков, то отношение межгрупповой дисперсии к общей покажет силу влияния факторного признака на результативный.

Это отношение называют коэффициентом детерминации

 (18)

Корень квадратный из коэффициента детерминации называют эмпирическим корреляционным отношением.

 (19)

Оно показывает степень тесноты связи между факторным и результативным признаком и изменяется в пределах от 0 до 1. Нулевое значение говорит о том, что связи нет (тогда межгрупповая дисперсия равна 0). Значение 1 указывает на наличие функциональной зависимости между признаками, при которой значения исследуемого показателя полностью определяются значениями факторного (группировочного) признака (средняя из внутригрупповых дисперсий в этом случае принимает нулевое значение). И естественно, чем ближе  к 1, тем связь теснее. Для аналитической характеристики степени связи используют шкалу Чэддока

0 0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,999 1

сила

связи

отсутствует слабая умеренная заметная тесная весьма тесная функциональная

Проиллюстрируем расчеты по данным и результатам расчета примера 2.2.

Пример 4.10. Имеются следующие данные о зависимости выработки работников от их производственного стажа.

Стаж, г.

Число работников, чел.

Выработка изделий в среднем на работника, шт.

2-5

5-8

8-11

4

5

2

7,0

8,4

11,0

Итого 11

Опираясь на данные представленной таблицы и на исходные данные примера 2.2. определить коэффициент детерминации и эмпирическое корреляционное отношение.

Решение

Вычислим межгрупповую дисперсию по формуле (16)

.

Расчеты произведем в таблице

Стаж, лет

Число работников, чел.

Средняя выработка

2-5

5-8

8-11

4

5

2

7,0

8,4

11,0

(7-8,364)2∙4=7,442

(8,4-8,364)2∙5=0,006

(11-8,364)2∙2=13,897

Итого 11

21,345

Теперь вычислим общую дисперсию выработки изделий на основе индивидуальных данных примера 2.2 по формуле (13)

Для этого вначале возведем данные выработки в квадрат.

Выработка изделий, шт.

1 2

10

7

100

49

7

6

9

8

12

9

8

7

9

49

36

81

64

144

81

64

49

81

Итого 798

Тогда  или 74,9%

=0,865

Величина коэффициента детерминации говорит о том, что вариация выработки изделий на 74,9% зависит от вариации производственного стажа работников и на 25,1% от прочих признаков.

Величина эмпирического корреляционного отношения (0,865) свидетельствует о тесной взаимосвязи между стажем работников и их выработкой.

6. Дисперсия альтернативного признака

Частный случай атрибутивного (неколичественного) признака – признак альтернативный. Когда единицы совокупности либо имеют данный изучаемый признак, либо не имеют его. Примером таких признаков является: наличие бракованной продукции, ученая степень у преподавателей вуза, работа по полученной специальности, превышение среднедушевых денежных доходов их общероссийского уровня, наличие детей в семье и т.д.

В случае наличия альтернативного признака единице совокупности присваивается значение «1». В случае отсутствия – «0».

Весами в расчетах служат:

 - доля единиц обладающих данным признаком;

 - доля единиц, не обладающих данным признаком

Тогда средняя величина альтернативного признака равна:

дисперсия примет вид:

Дисперсия альтернативного признака изменяется в пределах от 0 до 0,25. Максимального значения 0,25 достигает при 0,5

Пример 4.11. При выборочном опросе 300 жителей Курска 60 из них высказались положительно по поводу хранения личных денежных сбережений в коммерческих банках города

Определить средний уровень, дисперсию и среднее квадратическое отклонение признака

Решение

Практическое применение вариации альтернативного признака в основном состоит в построении доверительных интервалов при проведении выборочного наблюдения.

7. Изучение формы распределения признака. Основные характеристики закономерностей распределения

Непременным условием успешности построений, исчислений и выводов на основе вариационных рядов является однородность обобщаемых в них совокупностей, устанавливаемая на базе глубокого теоретического анализа.

Четко выраженный порядок изменения частот в соответствии с изменением величины признака называют закономерностью распределения.

Знание типа закономерности распределения, (а следовательно, и формы кривой) необходимо прежде всего:

1. Для выяснения типичности условий получения первичного статистического материала. Так, появление многовершинной или существенно асимметричной кривой говорит о разнотипном составе совокупности и о необходимости перегруппировки данных с целью выявления более однородных групп.

2. Для обеспечения правильности выполнения практических расчетов и прогнозов. Так, применение формулы Г. Стерджесса для расчета оптимального числа групп интервального ряда, правила «трех сигм», коэффициента вариации Vσ в качестве индикатора однородности совокупности, метода наименьших квадратов при моделировании корреляционной связи явлений, методов дисперсионного анализа и других правомочно лишь в условиях нормального и близких к нему распределений.

Закономерности вариационных рядов, выражающие в типе распределения их частот, наглядно выступают на графиках – гистограмме и полигоне распределения частот. Их рассмотрение показывает, что в гистограмме наблюдается большая скачкообразность распределения, а в полигоне обнаруживается постепенность перехода от одной группы к другой. Ломаная линия полигона частично сглаживает скачкообразность гистограммы, является более обобщенным приемом анализа распределения.

При увеличении строк интервального вариационного ряда и соответственном уменьшении величины его интервалов число сторон полигона распределения будет расти и ломаной линии будет присуща тенденция превратиться в пределе в некую кривую. Такая кривая называется кривой распределения. В ней происходит наибольшее освобождение данных от влияния случайных факторов. Она выявляет и показывает в максимально обобщенном виде характер вариации, закономерность распределения частот внутри однокачественной совокупности явлений.

Кривые распределения могут быть разных типов. В практике социально-экономических исследований широко применяется кривая нормального распределения. Она представляет собой одновершинную симметричную колоколообразную фигуру, правая и левая ветви которой равномерно и симметрично убывают, асимптотически приближаясь к оси абсцисс.

Отличительной особенностью этой кривой является совпадение в ней средней арифметической, моды и медианы. Если всю площадь между кривой и осью абсцисс принять за 100%, то в пределах  заключено 68,3% частот, в пределах  - 95,4%, в пределах  99,7% («правило трех сигм»).

Хотя нормальное, или симметричное, распределение соответствует природе ряда явлений, однако для общественных явлений оно нехарактерно, так как в нем отражаются различия, вызванные внешними воздействиями, присущие не развивающейся, а лишь колеблющейся совокупности единиц. Для социальных явлений характерно развитие, динамизм. Поэтому ряды и кривые распределения частот общественных явлений, как правило, асимметричны, в них частоты возрастают до максимума и убывают от него неравномерно. Именно наличие асимметрии, или скошенности, в рядах однородных совокупностей служит косвенным указанием на то, что исследуемый процесс проходит активную стадию развития.

Асимметричные ряды и соответствующие кривые имеют различные формы распределений, исследованные математической статистикой. Такими формами являются распределение Пуассона, распределение Максвелла, распределение Пирсона и др. Здесь асимметричность рассматривается в целом как единый тип распределения. При этом различают правостороннюю и левостороннюю асимметрии (скошенность).

Если длинная ветвь кривой расположена правее вершины, то асимметрия называется правосторонней, если эта ветвь расположена левее вершины – левосторонней. При правосторонней асимметрии  при левосторонней . Поэтому разность между ними, отнесенную к , называют коэффициентом К. Пирсона и используют в качестве коэффициента асимметрии:

. (20)

При правосторонней асимметрии этот коэффициент положителен, при левосторонней – отрицателен. Если = 0, вариационный ряд симметричен. Чем больше абсолютная величина коэффициента, тем больше степень скошенности.

Наиболее точным показателем асимметрии распределения является коэффициент асимметрии , вычисляемый по формуле

 (21)

где n – число единиц совокупности. Как и в случае коэффициента Пирсона, при > 0 имеет место правосторонняя асимметрия, при < 0 левосторонняя. В симметричных распределениях  = 0.

Чем больше величина ||, тем более асимметрично распределение. Установлена следующая оценочная шкала асимметричности:

||  - асимметрия незначительная;

0,25 < ||  - асимметрия заметная (умеренная);

|| > 0,5 - асимметрия существенная.

Поскольку коэффициенты и являются относительными безразмерными величинами, они часто применяются для сравнительного анализа асимметричности различных рядов распределения.

Характер асимметрии иногда указывает на направление развития. При исследовании вариации признаков, в отношении которых имеется заинтересованность в их увеличении (выполнение норм, выпуск продукции и т.д.), правосторонняя асимметрия свидетельствует о прогрессивности развития, о том, что оно идет в сторону увеличения показателя, а левосторонняя асимметрия указывает на наличие большого числа отстающих участков.

При исследовании вариации признаков, в отношении которых имеется заинтересованность в их уменьшении (себестоимость, трудоемкость, расход сырья на единицу продукции и т.п.), правосторонняя асимметрия свидетельствует о недостатках в развитии изучаемого процесса, левосторонняя – о прогрессивности его развития, о том, что последнее идет в сторону уменьшения показателя. В распределении работников по стажу (см. пример 4.9  = 5,75 ) наблюдается правосторонняя асимметрия, так как коэффициент асимметрии положителен: (5,955-5,75):2,47=0,095. Такая асимметрия для данного ряда прогрессивна, она свидетельствует о развитии ряда в сторону увеличения исследуемого показателя.

Форму распределения можно ориентировочно определить непосредственно рассмотрением эмпирических данных ряда, особенно если они изображены гистограммой и полигоном. Чтобы убедиться в правильности ориентировочного определения формы распределения, эмпирические данные ряда исследуются на их близость к теоретическому распределению, устанавливаемому с помощью построения соответствующей кривой распределения. Однако во многих случаях ни теория, ни непосредственное рассмотрение эмпирических данных не дают ответов на вопрос о форме распределения. Тогда обычно ведется исследование на близость эмпирических данных к нормальному распределению, так как распределения с небольшой или умеренной асимметричностью в большинстве случаев по своему типу относятся к нормальным.

Для объективного суждения о степени соответствия эмпирического распределения нормальному в статистике используется ряд критериев, называемых критериями согласия или соответствия.

К ним относятся критерии Пирсона, Романовского, Ястремского, Колмогорова, основанные на использовании различных теоретических представлений.

Например, наиболее используемый критерий согласия Пирсона  («хи-квадрат») определяется по формуле:

, (22)

где - эмпирические частоты (частости)

 - теоретические частоты (частости)

Для оценки близости эмпирического распределения к теоретическому определяется вероятность  достижения этим критерием данной величины. Если эта вероятность превышает 0,05, то отклонения фактических частот от теоретических считаются случайными, несущественными. Если же , то отклонения считаются существенными, а эмпирическое распределение – принципиально отличным от теоретического.

Для характеристики степени отклонения симметричного распределения от нормального рассчитывается показатель эксцесса. Он приближенно может быть определен с помощью коэффициента Линдберга.


, (23)

где  - доля (в%) количества вариант, лежащих в интервале равном половине среднего квадратического отклонения (в ту и другую сторону от величины средней) в общем количестве вариант данного ряда;

38,29 – доля (в %) количества вариант, лежащих в интервале, равном половине среднего квадратического отклонения (в ту и другую сторону от величины средней) в общем количестве вариант ряда нормального распределения

Эксцесс может быть положительным, отрицательным и равным нулю.

У высоковершинных кривых показатель эксцесса имеет положительный знак, у низковершинных кривых – отрицательный знак. Для кривой нормального распределения его величина равна нулю.

Для более точной характеристики степени отклонения симметричного распределения от нормального рассчитывается показатель островершинности (показатель эксцесса) (Ek ) по формуле:

 (24)

Он, как и коэффициент Линдберга, может быть положительным, отрицательным и равным нулю. Показатель эксцесса, как и показатель асимметрии, - число отвлеченное. Предельным значением отрицательного эксцесса является значение Ek= -2; величина же положительного эксцесса является величиной бесконечной.

Определение показателей асимметрии и эксцесса имеет не только описательное значение, часто их величины дают определенные указания для дальнейшего исследования изучаемых явлений. Так, например, появление значительного отрицательного эксцесса может указывать на качественную неоднородность исследуемой совокупности.

Современные компьютерные технологии открывают широкие возможности для выполнения громоздких вычислительных операций по анализу вариационных рядов. Если материал теоретически осмыслен и выдвинута разумная гипотеза о форме распределения (последнее, кстати, ЭВМ тоже в состоянии проверить), вычислительные устройства могут быстро исчислить различные обобщающие показатели и критерии, построить графики и т.д. Это тем более возможно, так как показатели вариации сравнительно несложны и хорошо формализованы.


Список использованной литературы

1.  Виноградова Н.М., Евдокимова В.Т., Хитарова Е.М. и др. Общая теория статистики: Учебное пособие /Под ред. И.Г. Венецкого/ – М.: Статистика, 1968г- 380с

2.  Гусаров Виктор Максимович. Статистика: Учеб. пособие для студентов вузов обучающихся по экономическим специальностям/ В.М. Гусаров, Е.И. Кузнецова.- 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2007.- 479с

3.  Гусаров, Виктор Максимович. Обшая теория статистики: Учеб. пособие для студентов вузов обучающихся по экономическим специальностям/ В.М. Гусаров, С.М. Проява.- 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2008.- 207с

4.  Ильишев Анатолий Михайлович. Общая теория статистики: учебник для студентов вузов, обучающихся по специальностям экономики и управления / А.М. Ильишев, - М.: ЮНИТИ- ДАНА, 2008. – 535с

5.  Ряузов Н.Н. Общая теория статистики: Учебник для студ. экон. спец. вузов – 4-е изд. перераб. и доп. – М.: Финансы и статистика, 1984.- 343с

6.  Салин В.Н., Чурилова Э.Ю. Курс теории статистики для подготовки специалистов финансово-экономического профиля: Учебник. – М.: Финансы и статистика, 2006- 480с

7.  Статистические методы анализа факторов повышения эффективности общественного производства. Учебное пособие. Под ред. Ряузова Н.Н. Акиншиной М.К.- М. ВЗФЭИ. 1980-88с

8.  Статистика: Учеб. пособие / А.В. Багат, М.М. Конкина, В.М. Симчера и др.; Под ред. В.М. Симчеры. – М.: Финансы и статистика, 2005.- 368с

9.  Статистика. Компьютерные лабораторные работы: Методические указания к лабораторной работе №1 « Автоматизированный априорный анализ статистической совокупности в среде MS Excel». / Г.П. Кожевникова, А.В. Голикова, А.М. Каманина, А.М. Бобров. Под ред. проф. Г.П. Кожевниковой- М.: Вузовский учебник, 2005.-72с.

10.  Теория статистики: Учебник / Под ред. проф. Р.А. Шмойловой – 3-е изд., перераб. – М.: Финансы и статистика, 1999.- 560с.


Страницы: 1, 2


© 2010 СБОРНИК РЕФЕРАТОВ