1) Випадкові величини I(Х1 < у), I(Х2 < у),... однаково розподілені, тому (де використовується однакова распреділеність?)
2)Випадкові величини I(Х1 < у), 1(Х2 < у),... незалежні й однаково розподілені, тому (де використовується незалежність?)
Ho di(x <y) = F(y)(1 - F(y)), оскільки І(Х < у) BF(y).
3) Скористаємося ЦПТ Ляпунова (а що це таке?).
4) Оскільки I(Х1 < у) (число успіхів в одному іспиті) має розподіл Бернуллі ВF(y) (ще раз - чому?), те п • Fn*(y) = åni=1 I(X1 < y) біноміальний розподіл Вn,F(y)(чому? і при чому тут зміст біноміального розподілу? а також при чому тут його стійкість по сумуванню?).
Властивості гістограмиНехай ¦ — щира невідома щільність розподілу В (якщо В абсолютно безупинно). Нехай, крім того, число k інтервалів групи не залежить від п. Див. зауваження 5 для випадку, коли k = k(n). Справедлива
Теорема 4. При п ® µдля будь-якого j = 1,..., k
Якщо, до того ж, щира щільність f(x) безупинна на інтервалі aj , то інтеграл праворуч дорівнює lj • f(uj), де uj -деяка крапка усередині інтервалу угруповання aj (знайдеться по теоремі про середній).
Вправа.Довести теорему 4, використовуючи (1) і ЗБЧ.
Теорема затверджує, що (для безупинної щільності) висота стовпця гістограмми, побудованого над інтервалом угруповання, з ростом обсягу вибірки зближається зі значенням щільності розподілу в одній із крапок цього інтервалу. Або (для довільної щільності) площа відповідного стовпця гістограмми зближається з площею над тим же інтервалом під графіком щільності.
Вправа.Намалювати твердження теореми 4 на графіку щільності / гістограмми.
Зауваження 5.Помітимо, що чим більше інтервалів угруповання, тим краще. Але це «чим більше» має свої границі: якщо брати число інтервалів, скажемо, порядку п, те з ростом п гістограмма не будепоточечносходитися до щільності.
Справедливо наступне твердження: якщо щільність розподілу елементів вибірки є безупинною функцією і k(n)/n ® 0, то має місце поточечна збіжність гістограмми до щільності (див. зауваження 1).
Зі своєї сторони, можу запропонувати завжди брати число інтервалів, скажемо, рівне цілої частини від кореня п'ятого ступеня з п (помноженого на еp, якщо обсяг вибірки більше 413):