загрузка...
Пошук по сайту

Групування статистичних даних

Групування статистичних даних online

Є наступні звітні дані 25 заводів однієї з галузей промисловості.

№ заводу Середньорічна вартість основних засобів, млн. грв.
1 4,0
2 8,0
3 5,1
4 4,9
5 6,3
6 7,5
7 6,6
8 3,3
9 6,7
10 3,4
11 3,3
12 3,9
13 4,1
14 5,9
15 6,4
16 3,9
17 5,6
18 3,5
19 3,0
20 5,4
21 2,0
22 4,5
23 4,8
24 5,9
25 7,2

З метою вивчення залежності між середньорічною вартістю основних виробничих фондів і випуском валової продукції зробіть угруповання заводів з середньорічної вартості основних виробничих фондів, утворивши шість груп заводів з рівними інтервалами.

Рішення
Число груп наближено визначається за формулою Стерджесса
 n = 1 + 3,2log n
 n = 1 + 3,2log 25 = 6
 Тоді ширина інтервалу складе:
формула Стерджесса
Групування статистичних даних

  Группы   x   Кол-во f   x * f   S   (x - x ср) * f   (x - x ср)2 * f   (x - x ср)3 * f   (x - x ср)4 * f   Частота
  2 - 3   2.5   2   5   2   4.88   11.91   -29.05   70.89   0.08
  3 - 4   3.5   7   24.5   9   10.08   14.5152   -20.9019   30.0987   0.28
  4 - 5   4.5   4   18   13   1.76   0.7744   -0.3407   0.1499   0.16
  5 - 6   5.5   5   27.5   18   2.8   1.568   0.8781   0.4917   0.2
  6 - 7   6.5   4   26   22   6.24   9.7344   15.1857   23.6896   0.16
  7 - 8   7.5   3   22.5   25   7.68   19.6608   50.3316   128.849   0.12
      25   123.5   0   33.44   58.16   16.0992   254.1697  

 Для оцінки ряду розподілу знайдемо такі показники:
 Показники центру розподілу.
 Средняя взвешенная
Средняя взвешенная

 Мода
Мода
 Вибираємо в якості початку інтервалу 3, так як саме на цей інтервал приходиться найбільша кількість.

 Найбільш часто зустрічається значення ряду – 3.63
 Медіана
 Медіана поділяє вибірку на дві частини: половина варіант менше медіани, половина - більше.
Медіана

 Таким чином, що 50% одиниць сукупності будуть менша за величиною 4.88
 Кварта
 Кварта - це значення ознаки в ранжируваному ряду розподілу, вибрані таким чином, що 25% одиниць сукупності будуть менша за величиною Q1; 25% будуть укладені між Q1 і Q2; 25% - між Q2 і Q3; інші 25% перевершують Q3.
Кварта

 Таким чином, що 25% одиниць сукупності будуть менша за величиною 3.61
 Q2 збігається з медіаною, Q2 = 4.88


 Решта 25% перевершують 6.19
 Децілі (децентілі)
 Децілі - це значення ознаки в ранжируваному ряду розподілу, вибрані таким чином, що 10% одиниць сукупності будуть менша за величиною D1; 80% будуть укладені між D1 та D9; інші 10% перевершують D9.
Децілі

 Таким чином, 10% одиниць сукупності будуть менша за величиною 3.07


 Інші 10% перевершують 7.17
 Показники варіації.
 Розмах варіації
 R = Xmax - Xmin
 R = 8.0 - 2.0 = 6
 Середнє лінійне відхилення
Середнє лінійне відхилення

 Кожне значення ряду відрізняється від іншого не більш, ніж на 1.34
 Дисперсія
Дисперсія

 Середнє квадратичне відхилення
Середнє квадратичне відхилення
 Кожне значення ряду відрізняється від середнього значення 4.94 не більше, ніж на 1.53
 Коефіцієнт варіації
Коефіцієнт варіації
 Оскільки v>30% ,але v<70%, то варіація помірна
 Показники форми розподілу.
 Коефіцієнт осциляції
Коефіцієнт осциляції
 Відносне лінійне відхилення
Відносне лінійне відхилення
 Відносний показник квартільной варіації
Відносний показник квартільной варіації
 Ступінь асиметрії
 Симетричним є розподіл, в якому частоти будь-яких двох варіантів, равностоящіх в обидві сторони від центру розподілу, рівні між собою
Ступінь асиметрії

 Позитивна величина вказує на наявність правосторонньою асиметрії
 Для симетричних розподілів розраховується показник ексцесу (островершінності). Ексцес представляє собою випад вершини емпіричного розподілу вгору або вниз від вершини кривій нормального розподілу.

  Ex > 0  - островершінное розподіл
 Інтервальний оцінювання центру генеральної сукупності
 Довірчий інтервал для генерального середнього
Довірчий інтервал для генерального середнього
Інтервальний оцінювання центру генеральної сукупності
 Оскільки n<=30, то визначаємо значення tkp за таблицею розподілу Стьюдента.
 По таблиці Стьюдента знаходимо Tтабл
 Tтабл (n-m-1;a) = (5;0.05) = 2.015

 (4.94 - 1.25;4.94 + 1.25) = (3.69;6.19)
 Перевірка гіпотез про вигляді розподілу.
 Перевіримо це припущення з допомогою критерію згоди Пірсона
критерій згоди Пірсона
 где p i  — ймовірність попадання в i-й інтервал випадкової величини, розподіленої по гіпотетичному законом.
 Для обчислення ймовірностей pi застосуємо формулу і таблицю функції Лапласа.
  Інтервали угруповання  Видимий частота ni  Ф(xi)  Ф(xi+1)  pi  n pi  Складові статистики Пірсона Ki
 2 - 3  2  0.3997  0.4732  0.0735  1.8375  0.0143
 3 - 4  7  0.2324  0.3997  0.1673  4.1825  1.8979
 4 - 5  4  0.016  0.2324  0.2164  5.4100  0.3674
 5 - 6  5  0.258  0.016  0.242  6.050  0.1822
 6 - 7  4  0.4131  0.258  0.1551  3.8775  0.0038
 7 - 8  3  0.4783  0.4131  0.0652  1.6300  1.1514
   25          3.617

 Визначимо кордон критичної області. Так як статистика Пірсона вимірює різницю між емпіричним і теоретичним розподілами, то чим більше її спостережуване значення Kнабл, тим сильніше довід проти основної гіпотези.
 Тому критична область для цієї статистики завжди правобічна: [Kkp;+∞).
 Її кордон K kp = χ2(k-r-1;a) знаходимо за таблицями розподілу «хі-квадрат» і заданим значенням σ, k (число інтервалів),  r=2 (параметри x і a оцінені за вибіркою).
 Kkp = 7.8; Kнабл = 3.62
 Спостережуване значення статистики Пірсона не потрапляє в критичну область: Кнабл<Kkp, тому немає підстав відкидати основну гіпотезу. Справедливо припущення про те, що дані вибірки мають нормальний розподіл.

Скачати у форматі rtf