3. Основні питання методології статистичних групувань

Основні питання методології статистичних групувань охоплюють такі питання:

1) вибір групувальної ознаки;

2) вибір кількості груп та інтервалів;

3) вибір кількості ознак, за якими проводиться групування.

Усі ці питання вирішуються залежно від сутності та тенденцій розвитку досліджуваних явищ.

Найголовніше питання теорії групувань – це вибір групувальних ознак, за якими відмежовуються окремі групи. Суспільні явища відрізняються значною кількістю різноманітних рис. При проведенні групування обов`язково виникає питання про вибір такої ознаки, яка буде адекватна меті дослідження і характеру первинної інформації. При проведенні групування обов`язково слід вибрати істотну ознаку, яка найбільш повно і точно зможе схарактеризувати досліджуване явище, дасть змогу вивчити його типові риси і властивості. При цьому необхідно також враховувати зміни в суспільному житті, і при вивченні явищ точно додержуватися принципу місця і часу їх виникнення і існування.

Групувальні ознаки за формою вираження можна поділити на атрибутивні (якісні) та кількісні, а за характером коливання ознаки – на альтернативні та ознаки, які мають числові різновиди.

Атрибутивна ознака характеризує властивості, якість даного явища і не має кількісного виразу. Кількість груп при проведенні групування за атрибутивною (якісною) ознакою визначається числом різновидів цієї ознаки. Наприклад, групування населення за статтю матиме дві групи (чоловіки і жінки); за рівнем освіти – 7 груп (повна вища, базова вища, професійно-технічна, повна загальна середня, базова загальна середня, початкова загальна та без освіти). У випадках, коли різновидів атрибутивної ознаки значна кількість, то статистичні органи складають спеціальні класифікатори, переліки груп (наприклад, групування осіб, які вчинили злочин, за родом занять, фахом).

Якщо ознака альтернативна, то можливо утворення лише двох груп: в одній одиниці сукупності мають цю ознаку, а в іншій – не мають (наприклад, особа або судима, або ні). При наявності альтернативної ознаки може існувати лише два варіанти значень (1 ознака існує, 0 – відсутність ознаки).

Кількісна ознака має числове вираження, вона завжди є у кожної одиниці сукупності, але в різних розмірах, (наприклад, групування працівників за стажем роботи, за розміром заробітної плати; осіб, які вчинили злочин, за кількістю попередніх судимостей і т. п.). При проведенні групування за кількісною ознакою питання про кількість груп і розмір інтервалів має вирішуватися одразу при проведенні групування.

Питання про вибір кількості груп та величину інтервалів є дуже складним, вирішення його пов`язане з конкретним завданням дослідження. Як загальний принцип виступає вимога, щоб кількість груп була не надто великою і не надто малою, і щоб до кожної групи потрапила достатня кількість одиниць сукупності. Якщо цей принцип не додержується, то при побудові значної кількості груп може бути такий випадок, що однорідні одиниці сукупності опиняться у різних групах. І навпаки, при побудові незначної кількості груп до однієї й тієї ж групи будуть заноситися різні одиниці, що може привести до помилкових висновків усього проведеного статистичного дослідження. Наприклад, віковий інтервал осіб, які засуджені, включає в себе осіб у віці 30 – 50 років, складає найбільшу питому вагу серед усіх осіб, хоча злочинна активність після 30 років (якщо розглядати по окремому року) знижується. Але за зведеними статистичними даними різних звітів це важко встановити, тому що цей інтервал охоплював двадцять вікових груп, а інші інтервали значно менше. («Статистична картка на підсудного (обвинуваченого)» включає такі вікові групи: 14 – 16; 16 – 18; 18 – 25; 25 – 30; 30 – 50; 50 –

65; старше 65. Відповідно інтервал 14 – 16 – два роки; 16 – 18 – також два роки; 18 – 25 – сім років; 25 – 30 – п`ять років; 50 – 65 – чотирнадцять років). Це ще раз підкреслює необхідність наукового обґрунтування, як встановлення вікових інтервалів, так і наукової інтерпретації одержаних даних внаслідок такого розподілу вікових груп.

Вимога про те, щоб до кожної групи потрапила достатньо велика кількість одиниць сукупності, випливає з теоретичного положення математики, згідно з яким для одержання типових показників необхідно брати значну кількість одиниць сукупності. Але в окремих випадках інтерес становлять і малочисельні групи, якщо вони характеризують нове явище, яке тільки народжується і ще не має масового характеру. При вирішенні питання про чисельність одиниць групи необхідно також враховувати сутність і тенденції розвитку досліджуваного явища. Орієнтовно, з точки зору математики, кількість груп можна обчислити за формулою американського вченого Стерджесса:

N = 1 + 3,322 lg N,

де n – кількість груп;

N – кількість одиниць сукупності, або її загальний обсяг.

Застосовуючи цю формулу, обсяг сукупності і кількість груп можна встановити таким чином: якщо обсяг сукупності до 24 одиниць, то груп – 5; якщо обсяг сукупності від 25 до 44, то треба утворити груп 6; якщо обсяг сукупності від 45 до 89 одиниць, то груп 7; якщо обсяг сукупності від 90 до 179, то груп 8; якщо обсяг сукупності від 180 до 359, то груп 9; якщо обсяг сукупності від 360 до 719, то груп 10; якщо обсяг сукупності від 720 до 1439 одиниць, то груп 11. Висновок – чим більше одиниць сукупності, тим більше можна і треба утворювати груп. Що стосується кожного окремого випадку, то завдання утворення кількості груп вирішується по-різному з урахуванням конкретних завдань і умов існування сукупності і її проявів. Наведена вище формула може вважатися лише орієнтиром для утворення груп сукупності. Реально їх створювати треба з урахуванням соціально-економічної сутності досліджуваних явищ.

При розгляді питання про вибір розміру інтервалів слід також керуватися знанням сутності досліджуваного явища. З точки зору теорії статистики інтервали можуть бути рівні та нерівні. В статистиці інтервалом називають різницю між максимальним і мінімальним значеннями ознаки в кожній групі.

Якщо значення групувальної ознаки змінюються рівномірно, то виділяються рівні інтервали груп за формулою:

i = ,

де: Хмакс, Хмін – найбільше і найменше значення ознаки всієї сукупності;

n – кількість груп.

Наприклад, необхідно згрупувати студентів за віком, утворивши 8 груп з рівними інтервалами, якщо відомо, що вік (кількість років, що повністю виповнилися) знаходиться в межах від 16 до 32 років. Розмір інтервалу буде 2 роки [(32–16):8]. Звідси слід утворити такі групи: 16–18, 18–20, 20–22, 22–24, 24–26, 26–28, 28–30, 30–32. Обов`язково треба вирішити питання про позначення нижньої та верхньої межі кожного інтервалу (або від, або до, або від … до…). (Статистична картка на підсудного (обвинуваченого) має такі інтервали від … до…).

На практиці, при вивченні правових явищ рівні інтервали застосовуються дуже рідко, тому що частіше за все однакова кількість ознаки має різне якісне значення, наприклад, групування за строками позбавлення волі. В правовій статистиці в основному застосовують прогресивно збільшувані інтервали і частіше за все межі інтервалів відокремлюються таким чином, щоб було повністю зрозуміло, до якого інтервалу відносити те чи інше явище. Наприклад, законодавець розробив такі групи для вивчення віку осіб, які вчинили злочин: 14–15 років, 16–17 років, 18–24 роки, 25–28 років, 29–39 років, 40–49 років, 50–59 років, 60 років і більше. В цьому випадку зрозуміло що у останню групу входять особи, яким виповнилось 60 років (тобто верхня межа включається у цю групу).

(Якщо, навпаки, необхідно вказати, що верхні межі інтервалів не входять у цю групу, тоді в останній групі треба записати старше 60 років).

Залежно від кількості ознак, за якими провадиться групування, воно може бути простим і складним.

Просте групування проводиться за однією ознакою, наприклад, групування засуджених за видами злочинів.

Складне групування – за кількома ознаками, воно може бути комбінаційним і багатомірним.

Комбінаційним є таке групування, якщо воно побудоване за двома і більше поєднаними ознаками, коли кожна група, яка побудована за однією ознакою, поділяється ще на підгрупи за іншими ознаками (наприклад, групування осіб, які вчинили злочин, за видами злочинів і статтю або віком у поєднані). Ці групувань дають змогу вирішити багато завдань у галузі виділення типів і структурних зрушень, а також вивченні взаємозв‘язків між явищами.

Багатомірним є групування, яке побудоване за кількома ознаками одночасно. Наприклад, групування сімей за рівнем споживання продовольчих і непродовольчих товарів одночасно. Таке групування можна проводити за великим набором ознак. Цей вид групувань спирається на метод розпізнавання образів – кластерний аналіз (від англ. cluster – скупчення, група елементів, які характеризуються якоюсь загальною якістю). В цьому випадку досліджується сукупність не послідовно за окремими ознаками (як при комбінаційному групуванні), а одночасно за великою кількістю ознак.


Информация о работе «Зведення та групування статистичних даних»
Раздел: Математика
Количество знаков с пробелами: 45498
Количество таблиц: 6
Количество изображений: 0

Похожие работы

Скачать
38291
2
15

... , то 60% варіації залежної величини пояснюється варіацією незалежного параметра кореляції і зв’язок є щільним. Розділ 2. Аналіз статистичного спостереження характеристик вибірки комерційних банків 2.1 Результати первинного статистичного спостереження показників діяльності комерційних банків Згідно з вихідними даними, в табл.2.1 наведені результати статистичного спостереження показників ді ...

Скачать
49260
15
16

... та темпами росту агрегатних комплексів. На основі регресійного аналізу взаємозв ' язку середніх величин факторних величин (активів) та результатних величин (прибутку) розраховані статистичні коефіцієнти рентабельності роботи комерційних банків у приведеній статистичній виборці. Вихідні індивідуальні данні В табл.1 наведені розраховані згідно методичних вказівок вихідні дані для індивідуального ...

Скачать
49793
18
5

... навантаження поділяються на показники антро­погенного та природного навантаження. Щоб оцінити антропо­генне навантаження на довкілля, застосовують показники: ·  видобутку (збору врожаю) окремих природних ресурсів; ·  що характеризують кiлькiсть викидів і скидів забруднюючих речовин та вiдходiв у атмосферне повітря, водні ресурси та в землю; ·  що характеризують кiлькiсть використовуваних ...

Скачать
52450
6
0

... дисципліну, яку він назвав статистикою. Основним змістом цього курсу було опис політичного стану та визначних пам'яток держави. Цей напрямок розвитку статистики одержав назву опису вального. Зміст, задачі та предмет вивчення статистики в розумінні Г. Ахенваля були ще далекі від сучасного погляду на статистику як науку. Значно ближче до сучасного розуміння статистики стала англійська школа полі ...

0 комментариев


Наверх