Емпіричний закон розподілення (Статистичний розподіл). Гістограма і полігон
Визначення 4. Нехай - вибірка з об’єму , - варіаційний ряд. Тоді число , де - кількість повторень варіанти у вибірці об’єму , називається частотою цієї варіанти.
Визначення 5. Нехай – дискретна випадкова величина. Тоді таблиця
називається таблицею відносних частот або емпіричним законом розподілення. Графік – полігон.
Зауваження 2. Якщо випадкова величина неперервна, то складаємо інтервальний варіаційний ряд:
1. Знаходимо min і max і весь проміжок ділимо на частин, де (формула Стерджесса).
2. Будуємо інтервальний варіаційний ряд:
3. Згідно з [2]
,
,
- момент 4-го порядку; округляємо до більшого непарного числа.
Визначення 6. Таблиця:
називається інтервальною таблицею частот. Графік – гістограма (по осі ).
Теорема 1. При для .
,
де - деяка точка всередині інтервалу групи (знаходиться за теоремою щодо середнього).
Зауваження 3. Зауважимо, що чим більше інтервал, тим краще, але це “чим більше” має свої межі: якщо брати число інтервалів, скажімо, , то з ростом гістограма не буде поточечно сходитися з функцією щільності. Доведено, що логарифмічна швидкість росту числа інтервалів в залежності від об’єму вибірки найшвидша, при якій ще має місце поточечна збіжність до функції щільності.
1.2 Вибіркова (емпірична) функція розподілу
Визначення 7.Емпіричною функцією розподілення, побудованій за вибіркою об’єму називається випадкова функція , при , що дорівнює .
Трактування: Емпірична функція розподілення - це емпірична ймовірність події .
Зауваження 4. - випадкова функція, вона є функцією від випадкових величин . Те ж саме можна сказати, про гістограму й вибіркові моменти.
Зауваження 5. є в кожній точці оцінкою .
Приклад 1.
Варіаційний ряд:
Теорема 2. Нехай – вибірка об’єму із невідомого розподілення F з функцію розподілення . Нехай – емпірична функція розподілення, побудована за цією вибіркою , тоді для
, при або .
Теорема 3. Якщо функція неперервна , то при
Величина , як міра відхилення емпіричної функції від теоретичної при має функцію розподілення Колмогорова. Це дає можливість побудувати довірчі межі для , в котрих з більшою ймовірністю буде знаходитись невідома функція розподілення. Якщо підібрано так, що , то нерівність виконується одразу для всіх з ймовірністю близькою до .