Передумови та постановка задачі однофакторного дисперсійного аналізу в контексті перевірки статистичної гіпотези щодо рівності математичних сподівань багатьох вибірок
Нехай на кількісну нормально розподілену величину впливає фактор , який має постійних рівнів. Дисперсії невідомі і рівні між собою. Маємо досліджень на кожному рівні. Чи впливає фактор на поведінку випадкової величини ?
Коротко:
1. , , - невідоме. Маємо вибірки
,
,
…,
,
…,
2. Необхідно перевірити статистичну гіпотезу:
.
7.3 Загальна, факторна та залишкова суми квадратів відхилень та зв’язок між ними [1]
Маємо вибірок по спостережень у кожній:
, (7.1)
,
…,
,
…,
Тоді загальне середнє арифметичне:
, (7.2)
Середнє арифметичне ї вибірки:
. (7.3)
Тоді загальна сума квадратів, що характеризує загальну варіацію всієї сукупності значень відносно оцінки їх центру тяжіння буде мати вигляд:
, (7.4)
Враховуючи, що
(7.4)
можна записати як
(7.5)
Зауваження. Складова
Позначимо , а . Тоді (7.5) набуде вигляду:
. (7.6)
Тобто, загальна варіація складається з двох адитивних компонент: факторної , що характеризує вплив досліджуваного фактора на рівнях, та , що характеризує похибку вимірювань.