Студопедия
Новини освіти і науки:
Контакти
 


Тлумачний словник






Числові характеристики

; ;

 

 

тема 11. СТАТИСТИЧНІ РОЗПОДІЛИ ВИБІРОК

ТА ЇХ ЧИСЛОВІ ХАРАКТЕРИСТИКИ

 

1. Загальна інформація

Кількісні ознаки елементів генеральної сукупності можуть бути одновимірними і багатовимірними, дискретними і неперервними.

Коли реалізується вибірка, кількісна ознака, наприклад Х, набуває конкретних числових значень (Х = хі), які називають варіантою.

Зростаючий числовий ряд варіант називають варіаційним.

Кожна варіанта вибірки може бути спостереженою ni раз (ni ³ 1 ), число ni називають частотою варіанти xi.

При цьому ,

де k — кількість варіант, що різняться числовим значенням;

n — обсяг вибірки.

Відношення частоти ni варіанти xi до обсягу вибірки n називають її відносною частотою і позначають через Wi , тобто

.

Для кожної вибірки виконується рівність

.

Якщо досліджується ознака генеральної сукупності Х, яка є неперервною, то варіант буде багато. У цьому разі варіаційний ряд — це певна кількість рівних або нерівних частинних інтервалів чи груп варіант зі своїми частотами.

Такі частинні інтервали варіант, які розміщені у зростаючій послідовності, утворюють інтервальний варіаційний ряд.

На практиці для зручності, як правило, розглядають інтервальні варіаційні ряди, у котрих інтервали є рівними між собою.

 

2. Дискретний статистичний розподіл вибірки та її числові характеристики

Перелік варіант варіаційного ряду і відповідних їм частот, або відносних частот, називають дискретним статистичним розподілом вибірки.

У табличній формі він має такий вигляд:

 

X = xi x1 x2 x3 xk
ni n1 n2 n3 nk
Wi W1 W2 W3 Wk

 

Дискретний статистичний розподіл вибірки можна подати емпіричною функцією F *(x).

Емпірична функція F *(x) та її властивості. Функція аргументу х, що визначає відносну частоту події X < x, тобто

,

називається емпіричною, або комулятою.

Тут n — обсяг вибірки;

nx — кількість варіант статистичного розподілу вибірки, значення яких менше за фіксовану варіанту х;

F *(x) — називають ще функцією нагромадження відносних частот.

Властивості F *(x):

1) 0 £ F *(x)£ 1;

2) F(xmin) = 0, де xmin є найменшою варіантою варіаційного ряду;

3) , де xmax є найбільшою варіантою варіаційного ряду;

4) F(x) є неспадною функцією аргументу х, а саме: F(x2 F(x1) при x2 ³ x1.

Полігон частот і відносних частот. Дискретний статистичний розподіл вибірки можна зобразити графічно у вигляді ламаної лінії, відрізки якої сполучають координати точок (xi; ni), або (xi; Wi).

У першому випадку ламану лінію називають полігоном частот, у другому — полігоном відносних частот.

Числові характеристики:

1) вибіркова середня величина . Величину, яка визначається формулою

,

називають вибірковою середньою величиною дискретного статистичного розподілу вибірки.

Тут xiваріанта варіаційного ряду вибірки;

niчастота цієї варіанти;

n — обсяг вибірки ( ).

Якщо всі варіанти з’являються у вибірці лише по одному разу, тобто ni =1, то

;

2) відхилення варіант. Різницю ( )ni називають відхиленням варіант.

При цьому

.

Отже, сума відхилень усіх варіант варіаційного ряду вибірки завжди дорівнює нулеві;

3) мода (Mo*). Модою дискретного статистичного розподілу вибірки називають варіанту, що має найбільшу частоту появи.

Мод може бути кілька. Коли дискретний статистичний розподіл має одну моду, то він називається одномодальним, коли має дві моди — двомодальним і т. д.;

4) медіана (Me*). Медіаною дискретного статистичного розподілу вибірки називають варіанту, яка поділяє варіаційний ряд на дві частини, рівні за кількістю варіант;

5) дисперсія. Для вимірювання розсіювання варіант вибірки відносно вибирається дисперсія.

Дисперсія вибірки — це середнє арифметичне квадратів відхилень варіант відносно , яке обчислюється за формулою

або

;

6) середнє квадратичне відхилення вибірки sB. При обчисленні DB відхилення підноситься до квадрата, а отже, змінюється одиниця виміру ознаки Х, тому на основі дисперсії вводиться середнє квадратичне відхилення

,

яке вимірює розсіювання варіант вибірки відносно , але в тих самих одиницях, в яких вимірюється ознака Х;

7) розмах (R). Для грубого оцінювання розсіювання варіант відносно застосовується величина, яка дорівнює різниці між найбільшою xmax і найменшою xmin варіантами варіаційного ряду. Ця величина називається розмахом

;

8) коефіцієнт варіації V. Для порівняння оцінок варіацій статистичних рядів із різними значеннями , які не дорівнюють нулеві, вводиться коефіцієнт варіації, який обчислюється за формулою

.

3. Інтервальний статистичний розподіл вибірки та його числові характеристики

Перелік часткових інтервалів і відповідних їм частот, або відносних частот, називають інтервальним статистичним розподілом вибірки.

У табличній формі цей розподіл має такий вигляд:

 

h x1 x2 x2 x3 x3 x4 xk–1 xk
ni n1 n2 n3 Nk
Wi W1 W2 W3 Wk

 

Тут h = xixi–1 є довжиною часткового i-го інтервалу. Як правило, цей інтервал береться однаковим.

Інтервальний статистичний розподіл вибірки можна подати графічно у вигляді гістограми частот або відносних частот, а також, як і для дискретного статистичного розподілу, емпіричною функцією F *(x) (комулятою).

Гістограма частот та відносних частот.Гістограма частот являє собою фігуру, яка складається з прямокутників, кожний з яких має основу h і висотy .

Гістограма відносних частот є фігурою, що складається з прямокутників, кожний з яких має основу завдовжки h і висоту, що дорівнює .

Емпірична функція F *(x) (комулята).При побудові комуляти F *(x) для інтервального статистичного розподілу вибірки за основу береться припущення, що ознака на кожному частинному інтервалі має рівномірну щільність імовірностей. Тому комулята матиме вигляд ламаної лінії, яка зростає на кожному частковому інтервалі і наближається до одиниці.

Аналогом емпіричної функції F *(x) у теорії ймовірностей є інтегральна функція F(x) = P(X < x).

Медіана. Для визначення медіани інтервального статистичного розподілу вибірки необхідно визначити медіанний частковий інтервал. Якщо, наприклад, на і-му інтервалі [xi–1 – xi] F *(xi–1) <0,5i F *(xi)> 0,5, то, беручи до уваги, що досліджувана ознака Х є неперервною і при цьому F*(x) є неспадною функцією, всередині інтервалу [xi–1 xi] неодмінно існує таке значення X =Me, де F * (Me) = 0,5.

Рис. 112

 

З подібності трикутників DАВС і DАВ1С1, зображених на рис. 112, маємо:

, (361)

де називають кроком.

Мода. Для визначення моди інтервального статистичного розподілу необхідно знайти модальний інтервал, тобто такий частинний інтервал, що має найбільшу частоту появи.

Використовуючи лінійну інтерполяцію, моду обчислимо за формулою

,

де xi–1 — початок модального інтервалу;

h — довжина, або крок, часткового інтервалу;

— частота модального інтервалу;

частота домодального інтервалу;

частота післямодального інтервалу.

для інтервального статистичного розподілу вибірки.Для визначення перейдемо від інтервального розподілу до дискретного, варіантами якого є середина часткових інтервалів і який має такий вигляд:

 

 

Тоді обчислюються за формулами:

; .

 

 

4. Двовимірний статистичний розподіл вибірки та його числові характеристики

Перелік варіант та відповідних їм частот спільної їх появи утворюють двовимірний статистичний розподіл вибірки, що реалізована з генеральної сукупності, елементам цієї вибірки притаманні кількісні ознаки Х і Y.

У табличній формі цей розподіл має такий вигляд:

 

 

Тут — частота спільної появи варіант

.

Загальні числові характеристики ознаки Х:

загальна середня величина ознаки Х

загальна дисперсія ознаки Х

загальне середнє квадратичне відхилення ознаки Х

Загальні числові характеристики ознаки Y:

загальна середня величина ознаки Y

загальна дисперсія ознаки Y

загальне середнє квадратичне відхилення ознаки Y




<== попередня сторінка | наступна сторінка ==>

Не знайшли потрібну інформацію? Скористайтесь пошуком google:


 

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.005 сек.