7.2. методи визначення гетероскедастичностіМожливість перевірки припущень про наявність гетероскедастичності залежить від природи вихідних даних. Розглянемо методи перевірки гетероскедастичності для різних вихідних даних. 7.2.1. Перевірка гетероскедастичності на основі критерію m Цей метод застосовується тоді, коли вихідна сукупність спостережень досить велика. Розглянемо відповідний алгоритм. Крок 1. Вихідні дані залежної змінної Y розбиваються на k груп відповідно до зміни рівня величини Y. Крок 2. За кожною групою даних обчислюється сума квадратів відхилень: Крок 3. Визначається сума квадратів відхилень в цілому по всій сукупності спостережень: Крок 4. Обчислюється параметр : де n — загальна сукупність спостережень; nr — кількість спостережень r-ї групи. Крок 7. Обчислюється критерій: який наближено відповідатиме розподілу при ступені свободи , коли дисперсія всіх спостережень однорідна. Тобто якщо значення не менше за табличне значення при вибраному рівні довіри і ступені свободи , то спостерігається гетероскедастичність. Приклад 7.2. Для даних, які наведено в прикладі 7.1, перевіримо наявність гетероскедастичності згідно з критерієм m. Розв’язання. Крок 1. Розіб’ємо дані, які наведені в табл. 7.1, на три групи, по шість спостережень у кожній.
Крок 2. Обчислимо суму квадратів відхилень індивідуальних значень кожної групи від свого середнього значення: 2.1. 2.2.
Крок 3. Знайдемо суму квадратів відхилень за всіма трьома групами: = S1 + S2 + S3 = 0,05313 + 0,2822 + 1,1703 = 1,5056. Крок 4. Обчислимо параметр Крок 5. Знайдемо критерій Цей критерій наближено задовольняє розподіл c2 з k – 1 = 2 ступенями свободи. Порівняємо значення критерію з табличним значенням критерію c2 з k – 1 = 2 ступенями свободи при рівні довіри 0,99 c2кр = 9,21. Оскільки m > c2кр, то дисперсія може змінюватись, тобто для даних табл. 7.1 спостерігається гетероскедастичність. 7.2.2. Параметричний тест Гольдфельда — Квандта Коли сукупність спостережень невелика, то розглянутий метод не застосовний. У такому разі Гольдфельд і Квандт запропонували розглянути випадок, коли , тобто дисперсія залишків зростає пропорційно до квадрата однієї з незалежних змінних моделі: Y = XA + u. Для виявлення наявності гетероскедастичності згадані вчені склали параметричний тест, в якому потрібно виконати такі кроки. Крок 1. Упорядкувати спостереження відповідно до величини елементів вектора Xj. Крок 2. Відкинути c спостережень, які містяться в центрі вектора. Згідно з експериментальними розрахунками автори знайшли оптимальні співвідношення між параметрами c і n, де n — кількість елементів век- тора : Крок 3. Побудувати дві економетричні моделі на основі 1МНК за двома утвореними сукупностями спостережень за умови, що перевищує кількість змінних m. Крок 4. Знайти суму квадратів залишків за першою (1) і другою (2) моделями і : , де — залишки за моделлю (1); , де — залишки за моделлю (2). Крок 7. Обчислити критерій який в разі виконання гіпотези про гомоскедастичність відповідатиме F-розподілу з , ступенями свободи. Це означає, що обчислене значення R* порівнюється з табличним значенням F-критерію для ступенів свободи і і вибраного рівня довіри. Якщо , то гетероскедастичність відсутня. Приклад 7.3. У табл. 7.3 наведено дані про загальні витрати та витрати на харчування. Для цих даних перевірити гіпотезу про відсутність гетероскедастичності. Таблиця 7.3
Розв’язання. 1. Ідентифікуємо змінні: Y — витрати на харчування, залежна змінна; X — загальні витрати, незалежна змінна; Y = f (X, u). 2. Для перевірки гіпотези про відсутність гетероскедастичності застосуємо параметричний тест Гольдфельда - Квандта. 2.1. Упорядкуємо значення незалежної змінної від меншого до більшого і відкинемо c значень, які містяться всередині впорядкованого ряду: c » 4. 2.3. Визначимо залишки за цими двома моделями: uI = YI – ; uII = YII – . Залишки та квадрати залишків наведено в табл. 7.3. 2.4. Обчислимо залишкові дисперсії та знайдемо їх співвідношення: 2.5. Порівняємо критерій R* з критичним значенням F-критерію при g1 = 5 і g2 = 5 ступенях свободи і рівні довіри Р = 0,99 Fa = 0,01 = 11. Оскільки R* > Fкр, то вихідні дані мають гетероскедастичність. 7.2.3. Непараметричний тест Гольдфельда - Квандта Гольдфельд і Квандт для оцінювання наявності гетероскедастичності запропонували також непараметричний тест. Цей тест базується на числі піків у величини залишків після упорядкування спостережень за . Закономірність зміни залишків, коли дисперсія є однорідною, — явище гомоскедастичності ілюструє рис. 7.1, а на рис.7.2 спостерігається явище гетероскедастичності. Цей тест, звичайно, не такий надійний, як параметричний, але він досить простий. Зауважимо, що на рис.7.1 зображено, як змінюються залишки, що мають постійну дисперсію, а на рис.7.2 — залишки, дисперсія яких змінна для різних груп стостережень. 7.2.4. Тест Глейсера Ще один тест для перевірки гетероскедастичності склав Глейсер. Він запропонував розглядати регресію абсолютних значень залишків , що відповідають регресії найменших квадратів, як певну функцію від , де — та незалежна змінна, яка відповідає зміні дисперсії . Для цього використовуються такі види функцій: 1) 2) 3) і т.ін. Рішення про відсутність гетероскедастичності залишків приймається на підставі статистичної значущості коефіцієнтів і . Переваги цього тесту визначаються можливістю розрізняти випадок чистої і замішаної гетероскедастичності. Чистій гетероскедастичності відповідають значення параметрів , а змішаній — . Залежно від цього треба користуватись різними матрицями S. Нагадаємо, що . Приклад 7.4. Нехай потрібно перевірити наявність гетероскедастичності при побудові економетричної моделі, яка описуватиме залежність між доходом і рівнем заощаджень. Вихідні дані наведено в табл.7.4. Таблиця 7.4
Використаємо параметричний тест Гольдфельда — Квандта для встановлення гетероскедастичності при визначенні залежності між наведеними показниками. Розв’язання. Ідентифікуємо змінні: Y — заощадження — залежна змінна; Х — дохід — пояснювальна змінна, Y = f(X). Крок 1. Вихідна сукупність спостережень упорядковується відповідно до величини елементів вектора Х, який може впливати на зміну величини дисперсії залишків. Оскільки в табл. 7.3 дані про дохід упорядковані, то переходимо до наступного кроку. Крок 2. Відкинемо c спостережень, які міститимуться в центрі векторів Х і Y, де , і поділимо сукупність спостережень на дві частини, кожна з яких містить спостережень. Крок 3. Побудуємо економетричну модель за першою сукупністю, яка включає спостереження від першого по сьомий місяць включно: . Система нормальних рівнянь для визначення параметрів цієї моделі запишеться так: Звідси = 2,1216; = 0,007. Економетрична модель має вигляд I: . Крок 4. Побудуємо економетричну модель виду за другою сукупністю спостережень, починаючи від дванадцятого по вісімнадцятий місяць. Система нормальних рівнянь для визначення параметрів цієї моделі запишеться так: Звідси = – 0,408; = 0,165. Економетрична модель має вигляд: II: Крок 5. Знайдемо розрахункові значення залежної змінної моделі — величини заощадження за кожною з двох моделей і визначимо відхилення фактичних значень заощаджень від розрахункових. Таблиця 7.5 Таблиця 7.6
У табл.7.5 наведено результати обчислення суми квадратів залишків за першою моделлю S1 = 0,2202. У табл.7.6 наведено обчислення суми квадратів залишків за другою моделлю S2 = 0,3039. Крок 6. Обчислимо критерій R*, який наближено відповідає F-розподілу: Порівняємо його значення з табличним значенням F-критерію при вибраному рівні довіри Р = 0,99 і ступенях свободи g1 = 5 і g2 = 5. Fтабл = 11. Звідси R* < Fтабл, що свідчить про відсутність гетероскедастичності. |
| Оглавление| |