Курсовая работа: Середні величини та показники варіації у правовій статистиці
Курсовая работа: Середні величини та показники варіації у правовій статистиці
Міністерство освіти і
науки України
Курсова робота
на тему: Середні величини та показники варіаціїу правовій статистиці
Харків 2011
Зміст
Вступ
1. Поняття середньої величини
2. Види середніх величин та техніка
їх обчислення
3. Поняття моди та медіани
4. Показники варіації та способи їх обчислення
Висновки
Список літератури
Вступ
Середні величини відносяться до узагальнюючих показників.
У статистиці усі показники розподіляються на індивідуальні
та середні. Індивідуальні показники завжди характеризують окремі одиниці сукупності.
Усі суспільні явища, в тому числі й правові, мають масовий характер і обов`язково
відносяться до статистичних сукупностей. Кожна одиниця сукупності відрізняється
від інших її одиниць розмірами ознаки, яка вивчається в процесі дослідження, тому
дати узагальнюючу характеристику статистичної сукупності можна тільки за допомогою
середніх показників. Наприклад, щоб об`єктивно оцінити, на якому підприємстві вища
заробітна плата, слід спочатку обчислити середню заробітну плату на кожному підприємстві
і тільки потім їх порівняти.
Закон великих чисел іноді називають законом середньої величини.
Дійсно, значення кожної окремої одиниці може істотно змінюватися під впливом різних
умов. В нашому прикладі заробітна плата кожного окремого робітника розрізнюється
залежно від стажу роботи, рівня кваліфікації, кількості відпрацьованого робочого
часу та інших умов. Але якщо проаналізувати середню заробітну плату, то можна встановити
тенденції її зміни і різницю в оплаті праці залежно від виду підприємства і проміжку
часу, за який наведені дані. Обчислена середня величина характеризує найбільш типові
закономірності у розвитку явища, абстрагуючись від тих відхилень, які властиві окремим
одиницям сукупності.
Необхідність в обчисленні середньої
величини обумовлюється тим, що суспільні явища, які вивчаються й правовою статистикою,
завжди носять масовий характер, а ознаки у окремих одиниць сукупності відрізняються
одна від одної, інакше кажучи, варіюють. Якщо припустити можливість існування сукупності,
в якій у всіх одиниць будуть однакові розміри ознаки, то в такій сукупності середню
величину обчислювати безглуздо.
1. Поняття середньої величини
Середня величина в статистиці – це узагальнюючий
показник, який характеризує типовий розмір ознаки якісно однорідної сукупності в
конкретних умовах простору і часу.
Головною передумовою для обчислення
і застосування середніх величин є те, що вони не можуть обчислюватися для різнорідної
сукупності. Це визначає, що наукове використання середніх величин базується на поєднанні
його з методом групування: спочатку слід поділити сукупність на окремі групи, а
лише після цього обчислювати середні величини для якісно однорідних груп сукупності
та сукупності в цілому.
Середні величини дуже широко застосовуються
для обчислення середнього рівня сукупності, порівняння двох або більше об`єктів,
характеристики динаміки явищ, вивчення зв`язку між ними.
У правовій статистиці середні величини
використовуються для: обчислення зміни у структурі злочинності; середньої кількості
осіб, яка припадає на один злочин, характеристики зміни у середньому віці злочинців
по окремих видах злочинів і по усій злочинності в цілому, для характеристики додержання
процесуальних строків (середні строки попереднього слідства, розгляду кримінальних,
цивільних та адміністративних справ), середньої величини збитків по окремих видах
злочинів та інші показники.
Існують різні точки зору на визначення
поняття середньої величини. Прихильники діалектичного підходу вважають, що в реальності
існують різні індивідуальні одиниці, а середня величина лише абстракція, яка характеризує
у загальному вигляді сукупність в цілому. На думку інших вчених, навпаки, – існує
лише середня величина, а кожна окрема одиниця, яка відхиляється від середньої, –
це атавізм або ненормальний стан. Звісно, що така точка зору значно спрощує статистичний
аналіз – не треба вивчати окремі одиниці сукупності, достатньо вивчити лише середні
величини та визначити тенденції їх зміни.
Нам здається, що точка зору прихильників
діалектичного підходу є більш вірною. Представники багатьох наук вважають, що окрім
встановлення елементарних математичних закономірностей, усі науки у своїх дослідженнях
повинні виявляти статистичні, а не функціональні закономірності. Лише в елементарній
математиці ми можемо одержати точний результат, а вже коли із чотирьох добуваємо
квадратний корінь, то одержуємо два результати: зі знаком або мінус два, або плюс
два.
Таким чином середній показник має лише
оціночне значення. В правовій статистиці, де окремі явища часто є унікальними він
ні в якому разі не може підмінювати, і тим більше замінювати, вивчення індивідуального.
Крім того, індивідуальні явища характеризують розподіл сукупності і дають змогу
встановити одиниці, які істотно відрізняються від інших одиниць.
Щоб встановити їх закономірності та
особливості в розвитку явища загальна середня величина, обчислена для усієї сукупності,
повинна доповнюватися вивченням середніх по окремих групах, . У правовій статистиці
дуже часто загальна середня величина по країні в цілому доповнюється середніми показниками
по окремих регіонах. Взагалі середня величина є вельми небезпечним показником. Вона
можна не тільки виявити, а і приховати закономірності розвитку явища.
правовий статистика медіана
варіація
2. Види середніх величин та техніка
їх обчислення
У практиці проведення статистичних досліджень
застосовуються різні види середніх величин. Це обумовлено перш за все наявністю
вихідних даних і метою дослідження. За технікою обчислення усі середні величини
можуть бути прості (незважені) та зважені, за класом всі вони відносяться до степенної
середньої. Загальна формула середньої степенної має такий вигляд (перша формула
– проста; друга – зважена):
; або ,
де – степенна середня величина; x – варіанти (значення ознаки одиниць
сукупності); n – загальна кількість одиниць
сукупності; f – вага, частота, яка показує
скільки разів зустрічається те чи інше значення ознаки; m – показник ступеню середньої; Σ
– знак суми.
За назвами в статистиці використовуються
середня арифметична, середня хронологічна, середня геометрична, середня квадратична
величини, середня гармонічна. Зміна значення показника степенної середньої величини
(m) визначає вид середньої величини: якщо m = 1, то ми одержуємо середню арифметичну
величину; якщо m = 2, то одержуємо середню квадратичну;
якщо m = 3, то – середню кубічну; якщо m = - 1,– маємо середню гармонічну; якщо
m = 0, то середню геометричну. З степенних
середніх в правовій статистиці найчастіше використовують середню арифметичну, значно
рідше – середню гармонічну; середня геометрична застосовується лише при обчисленні
середніх темпів динаміки, а середня квадратична – при обчисленні показників варіації.
Розмір обчисленої середньої величини
завжди відрізняється, оскільки обумовлюється показником степеню середньої величини.
В загальному вигляді це правило має назву мажорантності середніх: чим більше показник
ступеня, тим більше величина середньої. При цьому слід мати на увазі, що правильну
характеристику різних сукупностей в кожному окремому випадку визначає лише певний
вид середньої величини. Основний критерій визначення виду середньої величини – це
механізм утворення обсягу ознаки, яка варіює. Середня тільки тоді буде вірно відображати
усю сукупність, коли при заміні усіх ознак (варіантів) середньою загальний обсяг
варіюючої ознаки залишиться незмінним.
Залежно від того, як формується загальний
обсяг сукупності, і визначається вид середньої величини. Середня арифметична застосовується
тоді, коли обсяг варіючої ознаки утворюється як сума окремих варіантів, середня
квадратична – коли обсяг варіючої ознаки має вигляд суми квадратів окремих варіантів,
середня гармонічна – коли обсяг варіючої ознаки складається із суми обернених значень
окремих варіантів, середня геометрична – коли обсяг варіючої ознаки одержується
як добуток окремих варіантів.
У правовій статистиці середні арифметичні
величини застосовуються тоді, коли первинні (вихідні) дані наведені у такому вигляді,
що загальний обсяг ознаки для усієї сукупності можна одержати шляхом підсумовування
їх у всіх одиницях.
Середня арифметична проста (незважена)
обчислюється шляхом ділення суми індивідуальних значень ознаки на їх загальну кількість.
Спочатку підсумовують значення усіх варіантів, а потім ця сума ділиться на загальну
кількість одиниць сукупності. Наприклад, один слідчий районної прокуратури закінчив
за місяць 2 справи, інший – три. В результаті у середньому вони закінчили розгляд
2,5 справи ((2+3) : 2). При цьому не можна відкинути 0,5 справи і округлити цифру,
тому що в такому разі результат буде помилковий.
Середня арифметична проста використовується
дуже рідко, як правило, лише тоді, коли сукупність повністю симетрична (нормальний
закон розподілу одиниць) або має невелику кількість одиниць (як в нашому прикладі).
У загальному вигляді середня арифметична
проста обчислюється за формулою:
де: – середня арифметична
величина; x – значення ознаки одиниць сукупності;
n – кількість варіантів, з яких обчислюється середня (обсяг статистичної сукупності);
Σ – знак суми.
У правовій статистиці
застосовуються середня арифметична зважена, яка обчислюється за формулою:
де ƒ1, ƒ2 , … , ƒn – повторення (частота, вага) кожного
варіанта; x1, x2, …, xn – значення ознаки одиниць сукупності;
Σ – знак суми.
Середня арифметична зважена завжди обчислюється тоді, коли окремі
значення варіантів у сукупності повторюються кілька разів або коли ряд розподілу
значення ознаки несиметричний. При обчисленні середньої арифметичної зваженої за
наведеною формулою значення кожного варіанта (ознаки кожної одиниці сукупності)
слід помножити на відповідну йому вагу (частоту або повторюваність кожного варіанта)
і суму цих добутків поділити на суму частот (загальну кількість одиниць сукупності).
При цьому перемноження значень ознак сукупності на кількість їх повторювання в сукупності
(тобто варіантів на ваги) називається зважуванням, а одержана середня величина –
зваженою.
Використання середньої арифметичної зваженої дає змогу замінити
багаторазове підсумовування однакових варіантів, як це має місце при обчисленні
середньої арифметичної простої.
Отже, за наявності значної кількості первинних даних можна обчислювати
середню величину двома способами:
1) шляхом підсумовування значень ознаки у кожної окремої одиниці
сукупності – за формулою арифметичної простої;
2) на підставі заздалегідь впорядкованих даних у вигляді варіаційного
ряду розподілу – за формулою арифметичної зваженої. При цьому спочатку обов`язково
будується варіаційний ряд розподілу, для того щоб бути впевненими, що обчислюється
середня для якісно однорідної сукупності.
Обчислимо середню арифметичну зважену
за даними табл. 1 (первинні дані наведені у вигляді дискретного
ряду розподілу).
Таблиця 1.Кількість
розглянутих кримінальних справ в місцевому суді
Кількість засуджених по справі, х
Кількість розглянутих справ, ƒ
Добуток,
хƒ
1
20
20
2
14
28
3
12
36
4
10
40
5
4
20
Всього
60
144
За допомогою наведеної вище формули одержимо середню кількість
засуджених по кримінальній справі: 2, 4 людини (144 : 60).
Середня величина завжди має числове
вираження в тих самих одиницях виміру, що й первинні дані. При цьому її розмір обов`язково
знаходиться в межах від мінімального до максимального значення ознаки і вона не
може бути меншою за мінімальне і більшою за максимальне значення ознаки. Якщо ж
з якоїсь причини одержали середню величину, яка істотно відрізняється від варіантів,
то слід обчислити її заново.
Округлювати одержані дані можна лише
таким чином, щоб не втратити реального змісту показника. Якщо в даному прикладі
ми відкинемо десяту частину дробу, то істотно зменшимо результат. Якщо 2 особи помножити
на 60 кримінальних справ, одержимо 120 осіб, а в дійсності за цими розглянутими
кримінальними справами було засуджено 144 особи, тобто маємо зменшення на 24 особи.
Частіше доводиться обчислювати середні
арифметичні зважені з даних, наведених в статистичній звітності у вигляді інтервальних
варіаційних рядів розподілу, коли значення варіантів наведено не числом, а в межах
інтервалу: від до Наприклад, маємо такі дані про вік засуджених ( табл. 2).
Таблиця 2.Кількість
засуджених за віком за злочини проти власності
Вік особи,
рік
Кількість
засуджених,
ƒ
Середина інтервалу, рік, х
Добуток,
хƒ
До 18
24
15,5
372
18 – 24
48
21
1008
25 – 29
30
27
810
30 – 49
22
39,5
869
50 і старше
6
59,5
357
Всього
130
_
3416
Щоб обчислити середній вік усіх 130 осіб, засуджених за злочини
проти власності, спочатку необхідно визначити середній вік кожної групи, тому що
вік в документах первинного обліку (статистична картка на підсудного) наводиться
у вигляді інтервалів. Середній вік для кожної групи умовно приймають, як середину
кожного інтервалу. Вона обчислюється як середня арифметична проста умовно, оскільки
не завжди однаково зустрічаються в межах групи особи з різним віком. Нижня межа
інтервалу першої групи визначається згідно з кримінальним кодексом. Відповідальність
за вчинення цих видів злочинів настає з 14 років, таким чином середина першої вікової
групи буде дорівнювати 15,5 рокам ((14 + 17) : 2). Аналогічно обчислюється середина
усіх інших інтервалів, крім останнього, оскільки в ньому відсутня верхня межа інтервалу.
Останній інтервал повністю відкритий. Теоретично особа у будь-якому віці, якщо вона
вчинила злочин, може буде засуджена. В такому разі ця межа встановлюється умовно
таким чином, щоб інтервал був рівним сусідньому з ним. В нашому прикладі величина
передостаннього інтервалу дорівнювала 19 рокам (49 – 30). Відповідно, приймаємо
верхню межу останнього інтервалу рівною 69 років (50 + 19), тоді середина становить
59,5 років ((69 + 50) : 2).
Після встановлення середини кожного
інтервалу, за наведеною вище формулою середньої арифметичної зваженої обчислюємо
середній вік 130 засуджених за злочини проти власності. Він складає 26,3 роки (3416
: 130).
При цьому слід мати на увазі, що середня
величина, обчислена за даними інтервального варіаційного ряду розподілу, завжди
є наближеною, тому що при її обчисленні робиться припущення про однакові розміри
ознаки у кожної одиниці сукупності. Але точних даних одержати неможливо, оскільки
в звітності вони наведені у такому вигляді. Звісно, що чим більше величина інтервалу
і чим більше одиниць в ньому, тим більше відхилень від дійсної середньої величини
можна одержати. Істотно вплинути на розмір середньої величини, обчисленої з інтервального
ряду, може й довільне встановлення межі відкритих інтервалів, тому що із підрахунку
можуть повністю зникнути найбільш віддаленні значення ознаки.
Середня арифметична, яка обчислюється
за даними варіаційного ряду, має ряд властивостей, які мають практичне значення
при її обчисленні. Найголовніші властивості такі:
1.
Добуток середньої на суму частот
завжди дорівнює сумі добутку варіантів на частоти.
2.
Якщо від кожного значення варіанта
відняти якесь число, то середня арифметична величина зменшиться на теж саме число.
3.
Якщо до кожного значення варіанта
додати якесь число, то середня арифметична величина збільшиться на теж саме число.
4.
Якщо кожне значення варіанта
поділити на якесь число, то середня арифметична величина зменшиться на теж саме
число разів. Ця властивість дає змогу значно простіше обчислити середню арифметичну
величину.
5.
Якщо кожне значення варіанта
помножити на якесь число, то середня арифметична величина збільшиться на теж саме
число разів.
6.
Якщо усі частоти (ваги) поділити
(або помножити) на якесь число, то середня арифметична величина від цього не зміниться.
Цією властивістю часто користуються, коли частоти (ваги) мають вигляд у відсотках
до підсумку.
Дуже рідко в правовій статистиці застосовуються
середня гармонічна – обернена величина середньої арифметичної із обернених значень
варіантів. Застосування середньої арифметичної або гармонічної залежить від первинних
даних. Якщо за ваги (частоти) береться не кількість одиниць сукупності, а величини,
одержані внаслідок множення значень варіантів на кількість одиниць, тобто зразу
маємо добуток хƒ, то в цьому разі обчислюється середня гармонічна. У правовій
статистиці, як правило, такі дані не зустрічаються або зустрічаються дуже рідко.
В інших галузях статистики ця величина застосовується для обчислення середньої врожайності,
середньої продуктивності праці, середнього відсотка виконання плану тощо. До цього
часу статистики так і не визначилися, за якою середньою слід обчислювати середній
термін будівництва. За правилами математичної статистики (мажорантності середніх
величин) середня арифметична завжди більша за середню гармонічну, особливо якщо
йдеться про значний розмір показника.
Для розрахунку середньої величини за
формулою середньої гармонічної зваженою необхідно виходити з логічного усвідомлення
вихідних величин. Наприклад, кількість оштрафованих осіб – це складова частина загальної
суми штрафу. Тому щоб встановити середній розмір штрафу (розрахункова величина)
ми повинні його обраховувати за формулою середньої гармонічної зваженої.
Але може обчислюватися і середня гармонічна
проста за формулою:
Дана формула використовується лише
тоді, коли вага кожного варіанта дорівнює одиниці. На практиці таке практично не
зустрічається.
Середня гармонічна зважена обчислюється
за формулою:
де: Х ¾ значення ознаки, що варіює; М=Xf ¾ результат перемноження значення варіантів на їх
ваги.
Якщо ми дійсно будемо розраховувати
середній розмір стягнутих штрафів тим чи іншим органом або в тій чи іншій місцевості,
то знаменник дробу буде мати реальний зміст – кількість оштрафованих осіб, які сплатили
штраф.
Техніка обчислення середньої геометричної
і середньої хронологічної, які в правовій статистиці застосовуються при обчисленні
показників в рядах динаміки, наведена розділі Х цього підручника.
3. Поняття моди та медіани
Крім математично обчислених степенних середніх величин у статистиці
застосовуються показники описового характеру – структурні середні, з яких найчастіше
використовуються мода та медіана, які у впорядкованому ряду розподілу характеризують
значення тенденцій окремих варіантів.
Модою в статистиці називається таке
значення ознаки, яке зустрічається найчастіше. Якщо дані розташовані у вигляді дискретного
ряду розподілу, то модою буде значення того варіанту, який має найбільшу частоту.
Мода в статистиці застосовується тоді, коли слід охарактеризувати показник, який
найчастіше зустрічається в сукупності. Наприклад, при вивченні цін на ринку встановлюємо
ціни, які зустрічаються найчастіше; при встановленні найбільш ходового розміру взуття
і одягу визначаємо той, який користується найбільшим попитом. Ці показники дають
змогу спланувати, які товари необхідно виробляти в більшій кількості, а також які
товари поставляти на ринок і за якими цінами.
Але в правовій статистиці такі показники
застосовуються лише для опису сукупності, а не для наукової характеристики явища.
Наприклад, маємо такі первинні дані про вік осіб, які вчинили злочини проти особи,
в районі міста за місяць: 17, 25, 30, 31, 27, 28, 15, 18, 21, 22, 25, 24, 16, 24,
26, 19, 32, 35, 19, 17, 20, 21, 22, 23, 22, 26 (дані вибрані з первинних облікових
документів без їх обробки). Порядок заповнення документів первинного обліку дає
змогу позначити тільки ціле число повних років життя. Тому в цьому разі ми можемо
обчислювати моду за принципом дискретного ряду розподілу, хоча первинні дані відносяться
до інтервального варіаційного ряду. Мода в нашому прикладі дорівнюватиме 22 роки,
оскільки цей показник зустрічається найчастіше (три рази).
В інтервальному варіаційному ряду розподілу
легко відшуковується лише модальний інтервал, а сама мода визначається приблизно.
Формула обчислення моди в інтервальному
ряду має такий вигляд:
М0 = Х0 + і ,
де: М0 – мода; X0 – нижня границя модального
інтервалу; i – величина модального інтервалу; f1 – частота інтервалу, який передує модальному;
f2 – частота модального
інтервалу; f3 – частота інтервалу,
який слідує після модального.
За даними табл. 2 обчислимо
моду. Модальний інтервал становить від 18 до 24 років, тому що йому відповідає максимальна
частота (48 засуджених). Тоді мода матиме такий вигляд:
Медіаною в статистиці називають значення
варіанти, яка ділить впорядкований ряд розподілу на дві рівні за чисельністю одиниць
сукупності частини, знаходиться у середині ряду.
Якщо усі значення дискретного ряду
записати в певному порядку (зростання або зменшення значення показників), то це
буде значення, яке знаходиться у середині ряду. За наведеним раніш прикладом обчислимо
медіану. Спочатку впорядкуємо дані про вік осіб, які вчинили злочини проти особи,
розташувавши дані в ранжованому порядку зростання показників віку: 15, 16, 17, 17,
18, 19, 19, 20, 21, 21, 22, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 28, 30, 31,
32, 35. Якщо б ми мали непарну кількість одиниць ряду, то центральна з них і була
б медіаною. В нашому ж прикладі наявне парне число одиниць сукупності. Тоді медіана
обчислюється як середня арифметична проста двох центральних варіантів або за формулою
(∑ƒ + 1) : 2. До загальної кількості одиниць сукупності необхідно додати
одиницю і одержане число поділити на два. В нашому прикладі було наведено 26 особи,
які вчинили злочини. За наведеною формулою знаходимо місце медіани (26 + 1):2 =
13,5. Медіана знаходиться посередині між 13 і 14 значеннями і дорівнює 22,5 рокам,
тобто між 22 і 23 роками.
Складніше обчислюється медіана в варіаційному
ряду. Існує така формула для її знаходження:
де: Ме – медіана; хн – нижня границя
медіанного інтервалу; І – величина медіанного інтервалу; Σf – сума частот ряду; SМе-1 – сума накопичених частот інтервалу,
попереднього медіанному; fМе – частота
медіанного інтервалу.
За якою б формулою не обчислювали медіану, сутність її не видозмінюється.
Медіана в якому завгодно випадку повинна поділити варіаційний ряд на дві рівні частини
за сумою частот. Тому спочатку в інтервальному ряду розподілу знаходимо інтервал,
в якому розташована медіана, а потім приблизно обчислюємо саму медіану. За даними
табл. 10 обчислимо медіану. З`ясовуємо, що інтервал, в якому знаходиться медіана,
дорівнює від 18 до 24 років. Потім за формулою, яка наведена, обчислюємо медіану:
Медіана як показник має перевагу перед іншими видами середніх
величин, тому що вона не залежить від наявності чи відсутності показників в окремих
інтервалах. На її розмір впливає лише порядок розташування показників, а також те,
наскільки вірно побудовано ряд розподілу. В такому разі її обчислення нескладне.
Слід зауважити, що мода і медіана є
специфічними видами середніх величин, тому що вони завжди характеризують лише центр
розподілу статистичної сукупності.
Моду, медіану та середню арифметичну
слід завжди використовувати у сукупності, оскільки вони характеризують ряд розподілу
неоднозначно. Якщо ряд симетричний, то вони повністю співпадають.
В нашому прикладі, мода дорівнює 22
роки, медіана – 22,5 роки, а середній вік, який обчислюється за середньою арифметичною,
– 23,3 роки (додаємо усі первинні дані (15 + 16 + 17 + … + 35 = 605) і ділимо їх
на кількість осіб – на 26). Наведений ряд розподілу має асиметрію, але не значну.
За даними табл. 10, маємо такі результати: середній вік – 26,3 роки; мода – 21,4
роки; медіана – 23,1 роки, тобто цей ряд має значно більшу асиметрію.
4. Показники варіації та способи
їх обчислення
Середні величини мають велике теоретичне і практичне значення,
оскільки вони дають змогу однією величиною охарактеризувати сукупність однотипних
явищ. Проте для всебічної характеристики таких явищ їх не достатньо. Статистичній
сукупності притаманні коливання у кожної окремої одиниці, які у математиці називаються
варіацією. Ці коливання обумовлені тим, що статистичні сукупності виникають та існують
під впливом багатьох взаємопов`язаних причин. Деякі автори вважають, що на злочинність
впливають від 230 до 250 різних факторів.
Причини, які впливають на суспільні явища, можуть бути основними
та другорядними. З точки зору діалектики основні причини формують сукупність і впливають
на середні показники, а також на знаходження центру розподілу. Другорядні причини
обумовлюють варіацію ознак, сумісну їх дію, напрямки розвитку явища.
Істотним при цьому є те, що повністю дати оцінку явищу за допомогою
тільки середніх показників неможливо: коливання окремих ознак в різних сукупностях
можуть бути значними і незначними, а середні величини при цьому будуть однакові.
Для підтвердження цієї тези наведемо дані про розподіл засуджених за двома різними
складами злочинної діяльності за строками позбавлення волі (табл. 3).
Таблиця 3.Розподіл
засуджених за строками позбавлення волі за двома
складами злочинної діяльності
ПРИКЛАД № 1
ПРИКЛАД № 2
Строк позбавлення волі,
рік, х
Кількість засуджених, ƒ
Добуток, хƒ
Строк позбавлення волі, рік, х
Кількість засуджених, ƒ
Добуток,
хƒ
1
5
5
3
30
90
4
15
60
5
10
50
6
60
360
6
20
120
8
15
120
7
10
70
11
5
55
9
30
270
Всього
100
600
Всього
100
600
В обох прикладах ми взяли по 100 осіб засуджених. В кожному з
них середній строк позбавлення волі, який обчислено за середньою арифметичною зваженою,
має однакове значення, котре дорівнює 6 рокам (600 : 100). Однак, навіть на перший
погляд видно, що сукупності є різними. В першій сукупності більшість осіб дійсно
одержала середній строк позбавлення волі, в другій – навпаки, більшість осіб одержала
мінімальні та максимальні строки позбавлення волі за цим складом злочинів.
Щоб встановити, як відрізняються наведені сукупності, а також
які межі коливання має ознака, необхідно обчислити такі показники варіації: розмах
варіації, середнє лінійне відхилення, середнє квадратичне відхилення і коефіцієнт
варіації. Кожний з цих показників має певні аналітичні переваги при вирішенні тих
чи інших завдань статистичного аналізу.
Розмах варіації – це різниця між найбільшим і найменшим значеннями
ознаки у сукупності. Залежно від того, в якому вигляді наведені первинні дані, техніка
обчислення цього показника різна: це може бути різниця між верхньою межею останнього
інтервалу і нижньою межею першого інтервалу або різниця між середніми значеннями
цих інтервалів. Обраховується за формулою:
R = xmax – xmin ,
де: R – розмах варіації; xmax – найбільше значення ознаки
в сукупності; xmin – найменше значення ознаки в сукупності.
За даними табл. 3
в першому прикладі розмах варіації склав 10 років (11 – 1), а в другому
– 6 років (9 – 3).
Розмах варіації відображає тільки крайні значення ознаки, тому
він є головним показником у тих випадках, коли варіанти повторюються один раз. В
інших випадках розмах варіації застосовується для того, щоб одержати загальне уявлення
про варіацію ознаки у всієї сукупності. Наприклад, розмах варіації віку у студентів
різних форм навчання має бути різним, але він завжди буде меншим за розмах варіації
віку всього населення певного регіону. В деяких регіонах він може бути більше 100
років.
Безумовною перевагою цього показника, як міри оцінки коливання
ознаки, можна вважати нескладність його обчислення і розуміння. Але його недоліком
є те, що він оцінує лише крайні коливання ознаки, а вони можуть бути для сукупності
випадковими і зовсім не відображати розподіл відхилення ознаки в сукупності. У зв`язку
з цим, надійність даного показника є невисокою, але його часто використовують для
попередньої оцінки варіації при статистичних розрахунках.
Так, в першому прикладі 60 % осіб засуджені на строк, який збігається
з середнім строком позбавлення волі; в другому – їх лише 20 %, але розмах варіації
в другому прикладі менший, ніж в першому, що не відповідає ні логіці, ні дійсності.
За даними табл. 9 розмах варіації дорівнює 4 особам (5 – 1);
за даними, які застосовані для розрахунку медіани, – 20 рокам (35 – 15). Це ще раз
підтверджує висновок про те, що розмах варіації істотно залежить від значень ознаки
і дає лише приблизну характеристику наявності коливань ознаки в сукупності.
Для характеристики реального розподілу відхилень окремих значень
одиниць сукупності від середньої величини застосовуються середнє лінійне та середнє
квадратичне відхилення.
Середнє лінійне відхилення – це арифметична середня з абсолютних
значень відхилень ознаки окремих варіантів від їх середньої арифметичної. Середнє
лінійне відхилення обчислюється за формулою:
,
де: Λ – середнє
лінійне відхилення; x – значення ознаки; – середнє значення ознаки; f – частота
(вага) кожного варіанта.
При обчисленні цього показника відхилення від середньої величини
однаково оцінюються як в більший, так і менший бік. Це є не зовсім вірним з точки
зору економічного аналізу, тому що нас завжди цікавлять зрушення і зміни в сукупності
в якійсь-то один бік і ми дуже обережно ставимося до змін в іншій бік. Наприклад,
незначні строки покарання свідчать про те, що особами вчинено менше тяжких злочинів. У табл. 4
наведений розрахунок середнього лінійного та середнього квадратичного
відхилень.
Таблиця 4.Розрахунок
середнього лінійного та середнього квадратичного відхилень
Приклад № 1
Приклад № 2
x
f
x –
(x-)f
(х-)2f
x
f
x –
(х-)f
(х-)2f
1
5
- 5
- 25
125
3
30
- 3
- 90
270
4
15
- 2
- 30
60
5
10
- 1
- 10
10
6
60
0
0
0
6
20
0
0
0
8
15
2
30
60
7
10
1
10
10
11
5
5
25
125
9
30
3
90
270
Всього
100
_
0
370
_
100
_
0
560
На підставі даних, які наведені в табл. 4, видно, що для обчислення середнього лінійного відхилення слід
брати абсолютне значення показників. Якщо підсумувати усі значення з урахування
знаку, то в четвертому та дев`ятому стовпчиках табл. 4
одержимо нуль. З точки зору математики одержання нуля є обов`язковим,
які б первинні дані ми не мали. Для статистики нульовий результат немає сенсу.
Обчислимо за даними табл. 4
середнє лінійне відхилення для першого прикладу – 1,1 роки (підсумуємо
усі дані, наведені в четвертому стовпчику, незважаючи на знак перед числом, тобто
25 + 30 + 0 + 30 + 25, цю суму слід поділити на загальну кількість засуджених осіб,
на 100 чоловік); для другого прикладу – 2,0 роки ((90 + 10 + 0 +10 +90) : 100),
за даними, які наведені у дев`ятому стовпчику. Одержані дані характеризують, що
друга сукупність має більші коливання, ніж перша.
Найчастіше при економічних розрахунках для оцінки щільності взаємозв`язку
явищ, обчислення похибки репрезентативності тощо використовується середнє квадратичне
відхилення.
Середнє квадратичне відхилення – це корінь квадратний із середнього
квадрату відхилень ознаки кожного варіанту від їх середньої арифметичної. Цей показник
обчислюється за такою формулою:
,
де: σ – середнє квадратичне відхилення; x – значення
ознаки; –
середнє значення ознаки.
Щоб його знайти, достатньо суму п`ятого і десятого стовпчиків
табл. 4 поділити на загальну кількість
показників і з одержаної величини добути корінь квадратний.
Середнє квадратичне відхилення в першому прикладі дорівнює 1,92
рокам (370 ділимо на 100 і добуваємо корінь квадратний), в другому прикладі – 2,37
рокам. Отже, середнє квадратичне відхилення дає змогу встановити, що друга сукупність
(другий приклад) має значно більші коливання ознак – в 1,23 рази ( 2.37 : 1.92).
Усі наведені показники (розмах варіації, середнє лінійне і середнє
квадратичне відхилення) дають змогу встановити і оцінити міру коливання ознак в
абсолютному розмірі, тому всі вони обов`язково мають точно такі ж одиниці виміру,
як і одиниці сукупності. Для роз`яснення техніки обчислення показників варіації
і були взяті дві однакові з точки зору одиниць виміру сукупності, тому їх можна
і порівнювати між собою.
Недоліком середнього квадратичного відхилення є те, що воно характеризує
тільки абсолютну міру коливання ознаки. Якщо обчислювати середнє квадратичне відхилення
за даними табл. 9, то можна одержати показник 1,28 чол. В цьому разі порівнювати
його з показниками наших прикладів не можна.
Між середнім лінійним, середньо величиною і середнім квадратичним
відхиленням існує такий зв`язок 1,25 Λ = σ, а σ = 1/3 . В симетричних
рядах розподілу середнє квадратичне відхилення можна визначити за формулою: σ
= 1/6 (xmax
– xmin),
або ж σ = 1/6 R.
Розрахунок середнього квадратичного відхилення має логічний зміст
лише в тому випадку, коли фактичний розподіл ознаки близький до нормального. Для
явно асиметричних розподілень його розрахунок не має сенсу.
Квадрат середнього відхилення має назву дисперсії. Значення цього
показника істотно зростає, коли нам необхідно обчислити варіацію альтернативної
ознаки. Як вже підкреслювалось, альтернативна ознака – це така, яку кожна одиниця
сукупності або має, або не має. Наприклад, наявність вченого ступеню у викладачів
вищого учбового закладу.
Кількісно варіація альтернативної ознаки виражається двома значеннями:
наявність ознаки позначається через одиницю, а її відсутність – нуль. Позначивши
частку одиниць, які мають дану ознаку через р, а одиниці, які не мають цієї ознаки
через q
= (1 – р), визначимо середню арифметичну альтернативної
ознаки. Вона буде дорівнювати:
.
Після цього обчислимо дисперсію альтернативної ознаки:
= q2p
+ p2q =
p q (q +
p) =
=
p*q = p (1 – p).
Отже частка для альтернативної ознаки замінює середню величину,
а дисперсія є добутком частки на доповнення її до одиниці.
Для більш детальної характеристики сукупності застосовується
відносний показник – коефіцієнт варіації. Існують різні думки щодо того, за яким
з показників його можна обчислювати. На практиці завжди порівнюють за допомогою
середнього квадратичного відхилення, яке найбільш реалістично відображає коливання
ознаки в сукупності.
Коефіцієнт варіації – це відсоткове відношення середнього квадратичного
відхилення до середнього рівня. Як правило, цей середній рівень обчислюється за
формулою середньої арифметичної. Коефіцієнт варіації обчислюється за формулою:
,
де: V – коефіцієнт
варіації; –
середнє квадратичне відхилення; – середній розмір ознаки в статистичній
сукупності.
За даними табл. 4
коефіцієнт варіації в першому прикладі дорівнює 32,0 % ( 1,92 : 6
х 100), в другому прикладі – 39,5 % (2,37 : 6 х 100); за даними табл. 9 – 53,3 %
(1,28 : 2,4 х 100).
Коефіцієнт варіації дає змогу порівняти різні сукупності. Чим
менше цей показник, тим менше коливання ознаки в сукупності і тим більш однорідна
сукупність, і навпаки.
Показник коефіцієнта варіації слід використовувати для оцінки
однорідності сукупності. Існує оціночний критерій – сукупність однорідна і середня
величина в ній є типовою, якщо коефіцієнт варіації не перевищує 33 %. Таким чином,
тільки сукупність, яка наведена в першому прикладі, є однорідною, хоча в ній розмах
варіації був значно більшим, ніж в інших сукупностях.
Розрізняють такі значення відносних коливань (варіації)
–
незначну ознаку V ≤ 10 %
–
середню V = 10,1 – 30 %.
–
велику V > 30 %.
При розрахунку коефіцієнта варіації ознаки у різних сукупностях
та умовах виникає необхідність його оцінки. Наприклад, якщо вивчають кількість справ,
розглянутих суддями різних місцевих судів за визначений період (місяць, рік), кількість
осіб засуджених повторно у різних виправних установах тощо, то істотність різниці
коефіцієнтів варіації розраховують за формулою:
tф =
Різницю коефіцієнтів варіації вважають невипадковою, якщо критерій
згоди tф › 3, якщо ж tф ‹ 3, роблять висновок, що при цій кількості
спостережень нульова гіпотеза не підтверджується, і тому істотна різниця не доведена.
Список літератури
1. Лунеев В.В. Юридическая статистика: Учебник. –
М.: Юристъ, 2009. – 400 с.
2. Постанова Кабінету Міністрів України “Про порядок
ведення спеціальної митної статистики” від 12 грудня 2002 р. № 1865. // Урядовий
кур`єр 19.12. 2002. – с. 20.