МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах
РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ" ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах Гендерна антидискримінаційна експертиза може зробити нас моральними рабами ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів
Контакти
Тлумачний словник Авто Автоматизація Архітектура Астрономія Аудит Біологія Будівництво Бухгалтерія Винахідництво Виробництво Військова справа Генетика Географія Геологія Господарство Держава Дім Екологія Економетрика Економіка Електроніка Журналістика та ЗМІ Зв'язок Іноземні мови Інформатика Історія Комп'ютери Креслення Кулінарія Культура Лексикологія Література Логіка Маркетинг Математика Машинобудування Медицина Менеджмент Метали і Зварювання Механіка Мистецтво Музика Населення Освіта Охорона безпеки життя Охорона Праці Педагогіка Політика Право Програмування Промисловість Психологія Радіо Регилия Соціологія Спорт Стандартизація Технології Торгівля Туризм Фізика Фізіологія Філософія Фінанси Хімія Юриспунденкция |
|
||||||||||
Тема 6. Емпіричні моделі кількісного аналізу на основі статистичних рівняньЛекція 5 В економетричних дослідженнях кількісний аналіз статистичних даних здійснюється на основі емпіричних критеріїв. Розглянемо найбільш важливі. Коефіцієнт кореляції відображає ступінь взаємозв’язку між факторами. Коефіцієнт кореляції визначається грецькою буквою ρ, яка вимовляється як “ро” і відповідає латинській “r”. Для змінних х і у цей коефіцієнт визначається наступним чином: (6.1) де ρх,у – коефіцієнт кореляції змінних х і у; σх,у – середньоквадратичне відхилення змінних х і у. Якщо х і у незалежні, то ρ дорівнює нулю. Якщо між змінними існує позитивна залежність, то σх,у, а відповідно, і ρх,у будуть позитивними. Якщо існує строга позитивна лінійна залежність, то ρх,у має максимальне значення, яке дорівнює 1. Аналогічним чином при негативному зв’язку ρх,у буде від’ємним з мінімальним значенням –1. В економетричному аналізі для дослідження впливу факторів розраховуються коефіцієнти часткової кореляції: , (6.2) де rxy,z – коефіцієнт часткової кореляції між х і у у випадку постійного впливу показника z; rxy, rxz, ryz – звичайні коефіцєнти кореляції між х і у, х і z, у і z відповідно. Іншим важливим показником, який використовується для оцінки значущості моделі є коефіцієнт детермінації. Він представляє собою міру тісноти зв’язку між факторами економетричної моделі. Коефіцієнт детермінації пов’язаний з коефіцінтом кореляції – як квадрат від останього: r = r2. (6.3) При r2=1 маємо точний (функціональний) зв’язок, при r2=0 можно зробити висновок про відсутність кореляційного зв’язку. Таким чином, коефіцієнти кореляції і детермінації дозволяють досліднику встановити ступінь зв’язку і окреслити коло факторів, які здійснюють вплив на результативний показник. Основними напрямками оцінки адекватності економетричної моделі є: 1. Перевірка за допомогою F-теста (F-критерій Фішера); 2. Використання t-розподілу Стьюдента для оцінки надійності коефіцієнта кореляції; 3. Перевірка моделі на гомо-гетескедастичність; 4. Перевірка факторів економетричної моделі на мультиколінеарність. F-тест використовується для оцінки того, чи важливе пояснення, яке дає рівняння в цілому. Тобто в регресійному аналізі побудова F-статистики здійснюється шляхом відношення дисперсії залежної змінної на “пояснювальні” і “непояснювальні” складові: F = (ESS / k) / RSS / (n-k-1), (6.4) де ESS - пояснювальна сума квадратів відхилень; RSS – залишкова (непояснювальна) сума квадратів; к – кількість ступенів свободи; n – кількість значень факторів моделі. При здійсненні F-теста для рівняння перевіряється, чи перевищує r2 те значення, яке може бути отримано випадково. Для розрахунку F-статистики для рівняння в цілому, формулу (6.4) можна трансформувати шляхом ділення чисельника і знеменника рівняння на TSS (загальну суму квадратів), відмічаючи, що ESS/TSS дорівнює r2, а RSS/TSS дорівнює (1 - r2). В результаті отримуємо наступне рівняння:
F= r2 / к / (1 - r2) / (n – k - 1). (6.5) Розрахунковий F-критерій визначається при відповідному рівні значущості і ступенях свободи і порівнюють з критичним F-критерієм Фішера. Значення останнього критерія представлені в спеціальних таблицях. Якщо розрахунковий F-критерій перевищує його критичне значення, то можно стверджувати, що пояснення, яке дає рівняння в цілому важливе, а економетрична модель адекватна. У протилежному випадку – модель вважається неадекватною, а пояснення неважливе. Іншим важливим статистичним параметром для перевірки адекватності економетричної моделі є t-розподіл Стьюдента. Він використовується для оцінки надійності коефіцієнта кореляції. В цьому випадку t-статистика для r розраховується наступним чином: (6.6) Вибравши рівень значущості в 5%, дослідним шляхом знаходять критичне значення t з (n - 2) ступенями свободи. Якщо значення t перевищує його критичне значення (позитивний або негативний бік), то нульову гіпотезу відхиляють (про те, що коефіцієнт кореляції дорівнює нулю). В цьому випадку роблять висновок про лінійний зв’язок (позитивний або негативний). Слід відзначити, якщо нульова гіпотеза підтверджується, то значення t буде перевищувати його критичне значення (в позитивний або негативний бік) тільки в 5% випадках. Це означає, що при виконанні перевірки ймовірності допущення помилки, що відхиляє нульову гіпотезу, коли вона фактично вірна, складає 5%. Ймовірно, що ризик допущення такої помилки в 5% випадків досить великий для дослідника. Тоді він може скоротити ступінь ризику, здійснюючи розрахунки при рівні значущості в 1%. Критичне значення t зараз буде вище, ніж до цих пір, тому необхідна більш висока (позитивна або негативна) t-статистика для відхилення нульової гіпотези, а це означає, що потрібне більш вище значення коефіціента кореляції. Наступним епатом оцінки адекватності економетричної моделі є перевірка її на гетеро або гомоскедастичність. Гомоскедастичність означає однаковий розподіл фактичних значень виборки змінних. Тобто фактичні значення спостережень іноді будуть позитивними, іноді негативними, іноді – відносно близькими до нуля, проте в апріорі відсутні причини появи великих відхилень між спостереженнями. Разом з тим, для деяких виборок, можливо, більш доцільно припустити, що теоретичний розподіл випадкового члена є різним для різних спостережень. Це не означає, що випадковий член обов’язково буде мати особливо більші (позитивні або негативні) значення в кінці виборки, проте це означає, що апріорна йомовірність отримання більш відхилених значень буде відносно висока. Це є прикладом гетероскедастичності, що означає “неоднаковий розподіл”. Гетероскедастичність стає проблемою, коли значення змінних, які включаються в рівняння регресії, значно відрізняються в різних спостереженнях. Якщо залежність може буде описана рівнянням, в якому економічні показники змінюють свій масштаб одночасно, то зміна значень невключених змінних і помилок виміру, впливаючи разом на випадковий член, роблять його порівняно незначними при незначних у і х і порівняно великими – при великих у і х. Досить часто можно виявити проблему гетероскедастичності. В таких умовах можна здійснити відповідні дії по виключенню цього ефекту на етапі спеціфікації моделі регресії, і це дозволить зменшити або, можливо, усунути необхідність формальної перевірки. На нинішньому етапі запропоновано значне число тестів (і, відповідно, критеріїв для них). Найбільш поширеними тестами є: тест рангової кореляції Спірмена, тест Голфреда-Квандта і тест Глейзера. При виконання теста рангової кореляції Спірмена припускається, що дисперсія випадкового члена буде або збільшуватися, або зменшуватися відповідно до збільшення змінної х, і тому в регресії абсолютні значення залишків і значення х будуть корельовані. Дані по х і залишки упорядковуються, і коефіцієнт рангової кореляції визначається як: rx,e = 1 – (6ΣD2i/n(n2 - 1)), (6.7) де Di – різниця між рангом х і рангом помилки е; е – залишки. Якщо припускати, що відповідний коефіцієнт кореляції для генеральної сукупності дорівнює нулю, то коефіцієнт рангової кореляції має нормальний розподіл з математичним очікуванням 0 і дисперсією 1/(n - 1) в більших вибірках. Таким чином, відповідна тестова статистика дорівнює rx,e √n-1, і при використанні двобокового критерію нульова гіпотеза про відсутність гетероскедастичності буде відхилена при рівні значущості в 5%, якщо вона перевищує 1,96, і при рівні значущості в 1%, якщо вона перевищує 2,58. Якщо в моделі регресії знаходиться більше однієї пояснювальної змінної, то перевірка гіпотези може здійснюватися з використанням іншої з них. Ймовірно, що найбільше відомим є формальний критерій, запропонований С. Голдфелдом і Р. Квандтом. При проведенні перевірки з цього критерію слід припускати, що стандартне відхилення (σі) розподілу ймовірностей Uі пропорційне значенню х в цьому спостереженні. Запропоновано також, що випадковий член розподілений нормально і не піддається автокореляції. Всі n спостережень у виборці упорядковуються за значенням х, після чого оцінюються окремі регресії для перших n’ і для останніх n’ спостережень; середні (n - 2n’) спостережень відхиляються. Якщо припущення відносно природи гетероскедастичності доцільне, то дисперсія U і в останніх n’ спостереженнях буде більшою, ніж в перших n’, і це буде відображено в сумі квадратів залишків в двох вказаних “часткових” регресіях. Визначаємо суми квадратів залишків в регресіях для перших n’ і останніх n’ спостережень відповідно через RSS1 i RSS2. Розраховуємо відношення RSS2/RSS1, яке має F-розподіл з (n’ – к - 1) і (n’ – к - 1) ступенями свободи, де к – число пояснювальних змінних в регресійному рівнянні. Потужність критерію залежить від вибору n’ по відношенню до n. Грунтуючись на результатах деяких проведених експериментів, С. Голдфелд і Р. Квандт стверджують, що n’ повинно складати порядок 11, коли n = 30, і порядка 22, коли n = 60. Якщо в моделі знаходиться більше однієї пояснювальної змінної, то спостереження повинні упорядковуватися за тією з них, яка, як запропоновано, пов’язана з σі і n’ повинна бути більшою, ніж к + 1 (де к – число пояснювальних змінних). Метод Голдфелда-Квандта може бути також використаний для перевірки на гетероскедастичність при припущенні, що σі обернено пропорційний хі. При цьому використовується подібна процедура, що і розглянута вище, проте тестова статистика зараз є показником RSS1/RSS2, який знову має F-розподіл з (n’ – к - 1) і (n’ – к - 1) ступенями свободи. Тест Глейзера дозволяє більш ретельно розглянути характер гетероскедастичності. Він грунтується на тому, що знімається припущення, що σі пропорційна хі, а перевіряється лише більш подібна функціональна форма. Для того, щоб використовувати цей метод, необхідно оцінити регресійну залежність у від х за допомогою методу найменших квадратів, а потім розрахувати абсолютні значення залишків е, оцінивши їх регресію. У кожному випадку нульова гипотеза про відсутність гетероскедастичності буде відхилена, якщо оцінка регресії відрізняється від нуля. Якщо при оцінюванні більше однієї функції, то орієнтиром при визначенні характеру гетероскедастичності може служити найкраща з них. Мультиколінеарність – це поняття, яке використовується для опису проблеми, коли нестрога лінійна залежність між пояснювальними змінними призводить до отримання ненадійних оцінок регресії. Проте, така залежність, зовсім необов’язково дає незадовільні оцінки. Якщо всі інші умови задовільні, тобто якщо кількість спостережень і вибіркові дисперсії пояснювальних змінних великі, а дисперсія випадкового члена – мала, то в результаті можна отримати досить позитивні оцінки. Більш детально проблему мільтиколінеарності було розглянуто в темі 3. Читайте також:
|
|||||||||||
|