Принципи побудови статистичних угруповань і класифікацій

Класифікацією називається систематизований розподіл явищ на певні групи, класи, розряди на підставі їх подібності і відмінностей.
Перерахуємо відмінні риси класифікації:
1) в основу її кладеться якісної ознаки;
2) класифікації стандартні. Вони встановлюються органами державної і міжнародної статистики;
3) класифікації стійкі (тобто залишаються незмінними протягом тривалого періоду часу).
Якщо угруповання проводиться за кількісною ознакою, то необхідно звернути особливу увагу на число одиниць досліджуваного об'єкта і ступінь коливання группировочного ознаки.
При використанні персональних комп'ютерів для обробки статистичних даних угруповання одиниць об'єкта проводиться за допомогою стандартних процедур.
Одна з таких процедур заснована на використанні формули Стерджесса для визначення оптимального числа груп:

де n - число груп, N - число одиниць сукупності.
Відповідно до формули (2.1) вибір числа груп залежить від обсягу сукупності.
Недолік формули полягає в тому, що її застосування дає хороші результати, якщо сукупність складається з великої кількості одиниць, і розподіл одиниць за ознакою, покладеному в основу угруповання, близько до нормального.
Інший спосіб визначення числа груп заснований на застосуванні показника середнього квадратичного відхилення (s). Якщо величина інтервалу груп дорівнює 0,5 s, то сукупність розбивається на 12 груп, а коли величина дорівнює 2/3 s і s, то сукупність ділиться відповідно на 9 і 6 груп. Якщо сукупність розбивається на 12 груп, то інтервали будуються таким чином:

від - 3,0 s до -2,5 s

від - 2,5 s до - 2,0 s

від -2,0 s до - 1,5 s

від - 1,5 s до - 1,0 s

від -1,0 s до -0,5 s

від + 0,5 s до + 1,0 s

від + 1,0 s до + 1,5 s

від + 1,5 s до + 2,0 s

від + 2,0 s до + 2,5 s

від + 2,5 s до + 3,0 s,


де - середнє значення ознаки за сукупністю, яке визначається за формулою. де - -е значення ознаки, s - середньоквадратичне відхилення.
Ці методи можуть утворити «порожні» або нечисленні групи, в які не потрапила жодна одиниця сукупності. Наявність таких інтервалів свідчить неправильності побудови угруповання.
Після визначення числа груп, наприклад за формулою Стерджесс, слід визначити інтервал угруповання.

Інтервал - це значення варьирующего ознаки, що лежать в певних межах. Кожен інтервал має свою величину, верхню і нижню межі або хоча б одну з них. Нижньою межею інтервалу називається найменше значення ознаки в інтервалі, а верхньою межею - найбільше значення ознаки в ньому. Величина інтервалу (або інтервальна різниця) являє собою різницю між верхньою і нижньою межами інтервалу. Інтервали угруповання бувають рівні та нерівні. Останні діляться на прогресивно зростаючі, прогресивно убутні, довільні і спеціалізовані. Якщо величина ознаки проявляється у порівняно вузьких межах, і розподіл носить рівномірний характер, то будують угруповання з рівними інтервалами. Величина рівного інтервалу визначається за формулою:

де - розмах варіації, Xmax, Xmin - максимальне і мінімальне значення ознаки в сукупності, а n - число груп.
Перш ніж визначити розмах варіації, з сукупності необхідно виключити аномальні спостереження.
Отриману за формулою (2.2) величину округлюють. Вона є кроком інтервалу.
Існують наступні правила визначення кроку інтервалу. Якщо величина інтервалу, розрахована за формулою (2.2) являє собою величину, що має один знак до коми (наприклад 0,66; 1,372; 5,8), то отримані значення доцільно округлити до десятих і використовувати їх в якості кроку інтервалу. У наведеному прикладі кроком інтервалу будуть відповідно значення: 0,7; 1,4; 5,8.
Коли розрахована величина інтервалу має дві значущі цифри до коми і кілька знаків після коми, то це значення треба округлити до цілого числа. Наприклад: 12,785; 15,01; 13; 15.
У разі, коли розрахована величина інтервалу являє собою тризначне, чотиризначний і так далі число, цю величину необхідно округлити до найближчого числа, кратного 100 або 50. Наприклад 248 слід округлити до 250.
Розглянемо приклад. Необхідно зробити угруповання з рівними інтервалами підприємств за вартістю основних фондів, при цьому максимальне значення ознаки Xmax = 2040 млн. Руб. а мінімальне його значення - Xmin = 290 млн. руб. Сукупність включає 80 одиниць. Відповідно до формули (2.1) вона повинна бути розбита на 7 груп. Спочатку слід знайти

R = 2040-290 = 1750 млн. Руб.
Визначимо величину інтервалу: млн. Руб.
Після цього побудуємо інтервали груп (табл. 2.5.).

Таблиця 2.5
Варіанти побудови груп

Величина кожного наступного інтервалу у цього угруповання більше попереднього інтервалу на 200 млн. Руб. тобто збільшується в арифметичній прогресії.

Правила введення даних

Поставити свої запитання або залишити побажання або зауваження можна внизу сторінки в розділі Disqus.
Можна також залишити заявку на допомогу в розв'язанні контрольних робіт у наших перевірених партнерів (тут або тут).

Схожі статті