Економетрія - Навчальний посібник (Наконечний С.І., Терещенко Т.О., Романюк Т.П.)

7.2. методи визначення гетероскедастичності

Можливість перевірки припущень про наявність гетероскедастичності залежить від природи вихідних даних. Розглянемо методи перевірки гетероскедастичності для різних вихідних даних.

7.2.1. Перевірка гетероскедастичності на основі критерію m

Цей метод застосовується тоді, коли вихідна сукупність спостережень досить велика. Розглянемо відповідний алгоритм.

Крок 1. Вихідні дані залежної змінної Y розбиваються на k груп  відповідно до зміни рівня величини Y.

Крок 2. За кожною групою даних обчислюється сума квадратів відхилень:

Крок 3. Визначається сума квадратів відхилень в цілому по всій сукупності спостережень:

Крок 4. Обчислюється параметр :

де n — загальна сукупність спостережень; nr  — кількість спостережень r-ї групи.

Крок 7. Обчислюється критерій:

який наближено відповідатиме розподілу  при ступені свободи , коли дисперсія всіх спостережень однорідна. Тобто якщо значення  не менше за табличне значення  при вибраному рівні довіри і ступені свободи , то спостерігається гетероскедастичність.

Приклад 7.2. Для даних, які наведено в прикладі 7.1, перевіримо наявність гетероскедастичності згідно з критерієм m.

Розв’язання.

Крок 1. Розіб’ємо дані, які наведені в табл. 7.1, на три групи, по шість спостережень у кожній.

група I

група II

група III

0,36

0,41

0,82

0,20

0,50

1,04

0,08

0,43

1,53

0,20

0,59

1,94

0,10

0,90

1,75

0,12

0,95

1,99

Крок 2. Обчислимо суму квадратів відхилень індивідуальних значень кожної групи від свого середнього значення:

2.1.

2.2.

               

               

Крок 3. Знайдемо суму квадратів відхилень за всіма трьома групами:

= S1 + S2 + S3 = 0,05313 + 0,2822 + 1,1703 = 1,5056.

Крок 4. Обчислимо параметр

Крок 5. Знайдемо критерій

Цей критерій наближено задовольняє розподіл c2 з k – 1 = 2 ступенями свободи. Порівняємо значення критерію  з табличним значенням критерію c2 з k – 1 = 2 ступенями свободи при рівні довіри 0,99 c2кр = 9,21. Оскільки m > c2кр, то дисперсія може змінюватись, тобто для даних табл. 7.1 спостері­гається гетероскедастичність.

7.2.2. Параметричний тест Гольдфельда — Квандта

Коли сукупність спостережень невелика, то розглянутий метод не застосовний.

У такому разі Гольдфельд і Квандт запропонували розглянути випадок, коли , тобто дисперсія залишків зростає пропорційно до квадрата однієї з незалежних змінних моделі:

Y = XA + u.

Для виявлення наявності гетероскедастичності згадані вчені склали параметричний тест, в якому потрібно виконати такі кроки.

Крок 1. Упорядкувати спостереження відповідно до величини елементів вектора Xj.

Крок 2. Відкинути c спостережень, які містяться в центрі вектора. Згід­но з експериментальними розрахунками автори знайшли оптимальні спів­відношення між параметрами c і n, де n — кількість елементів век- тора :

Крок 3. Побудувати дві економетричні моделі на основі 1МНК за двома утвореними сукупностями спостережень  за умови, що  перевищує кількість змінних  m.

Крок 4. Знайти суму квадратів залишків за першою (1) і другою (2) моделями  і :

, де  — залишки за моделлю (1);

, де  — залишки за моделлю (2).

Крок 7. Обчислити критерій

який в разі виконання гіпотези про гомоскедастичність відповідатиме F-роз­поділу з ,  ступенями свободи. Це означає, що обчислене значення R* порівнюється з табличним значенням F-крите­рію для ступенів свободи  і  і вибраного рівня довіри. Якщо , то гетероскедастичність відсутня.

Приклад 7.3. У табл. 7.3 наведено дані про загальні витрати та витрати на хар­чування. Для цих даних перевірити гіпотезу про відсутність гетероскедастичності.

Таблиця 7.3

Номер спостереження

Витрати на харчування

Загальні витрати

 

u

u2

1

2,30

15

2,16

0,14

0,020

2

2,20

15

2,16

0,04

0,002

3

2,08

16

2,20

-0,12

0,015

4

2,20

17

2,25

-0,05

0,002

5

2,10

17

2,25

-0,15

0,022

6

2,32

18

2,29

0,26

0,0007

7

2,45

19

2,34

0,11

0,012

8

2,50

20

 

 

 

9

2,20

20

 

 

 

10

2,50

22

 

 

 

11

3,10

64

 

 

 

12

2,50

68

2,37

0,13

0,016

13

2,82

72

2,52

0,29

0,085

14

3,04

80

2,68

0,36

0,128

15

2,70

85

2,99

-0,29

0,084

16

3,94

90

3,18

0,76

0,573

17

3,10

95

3,38

-0,28

0,076

18

3,99

100

3,57

0,42

0,178

Розв’язання.

1. Ідентифікуємо змінні:

Y — витрати на харчування, залежна змінна;

X — загальні витрати, незалежна змінна;

Y = f (X, u).

2. Для перевірки гіпотези про відсутність гетероскедастичності застосуємо параметричний тест Гольдфельда - Квандта.

2.1. Упорядкуємо значення незалежної змінної від меншого до більшо­го і відкинемо c значень, які містяться всередині впорядкованого ряду:

  c » 4.

2.3. Визначимо залишки за цими двома моделями:

uI = YI – ;

uII = YII – .

Залишки та квадрати залишків наведено в табл. 7.3.

2.4. Обчислимо залишкові дисперсії та знайдемо їх співвідношення:

2.5. Порівняємо критерій R* з критичним значенням F-критерію при g1 = 5 і g2 = 5 ступенях свободи і рівні довіри Р = 0,99 Fa = 0,01 = 11. Оскільки R* > Fкр, то вихідні дані мають гетероскедастичність.

7.2.3. Непараметричний тест Гольдфельда - Квандта

Гольдфельд і Квандт для оцінювання наявності гетероскедастичності запропонували також непараметричний тест. Цей тест базується на числі піків у величини залишків після упорядкування спостережень за .

Закономірність зміни залишків, коли дисперсія є однорідною, — явище гомоскедастичності ілюструє рис. 7.1, а на рис.7.2 спостерігається явище гетероскедастичності.

Цей тест, звичайно, не такий надійний, як параметричний, але він досить простий.

Зауважимо, що на рис.7.1 зображено, як змінюються залишки, що мають постійну дисперсію, а на рис.7.2 — залишки, дисперсія яких змінна для різних груп стостережень.

7.2.4. Тест Глейсера

Ще один тест для перевірки гетероскедастичності склав Глейсер. Він запропонував розглядати регресію абсолютних значень залишків , що від­повідають регресії найменших квадратів, як певну функцію від , де  — та незалежна змінна, яка відповідає зміні дисперсії . Для цього використовуються такі види функцій:

1)

2)

3)  і т.ін.

Рішення про відсутність гетероскедастичності залишків приймається на підставі статистичної значущості коефіцієнтів  і . Переваги цього тесту визначаються можливістю розрізняти випадок чистої і замішаної гетероскедастичності. Чистій гетероскедастичності відповідають значення параметрів , а змішаній — . Залежно від цього треба користуватись різними матрицями S. Нагадаємо, що .

Приклад 7.4. Нехай потрібно перевірити наявність гетероскедастичності при побудові економетричної моделі, яка описуватиме залежність між доходом і рівнем заощаджень. Вихідні дані наведено в табл.7.4.

Таблиця 7.4

Місяць

Дохід

Заощадження

Місяць

Дохід

Заощадження

1

10,8

2,36

10

17,5

2,59

2

11,4

2,20

11

18,7

2,90

3

12,0

2,08

12

19,7

2,95

4

12,6

2,20

13

20,6

2,82

5

13,0

2,10

14

21,7

3,04

6

13,9

2,12

15

23,1

3,53

7

14,7

2,41

16

24,8

3,44

8

15,5

2,50

17

25,9

3,75

9

16,3

2,43

18

27,2

3,99

Використаємо параметричний тест Гольдфельда — Квандта для встановлення гетероскедастичності при визначенні залежності між наведеними показниками.

Розв’язання. Ідентифікуємо змінні:

Y — заощадження — залежна змінна;

Х — дохід — пояснювальна змінна, Y = f(X).

Крок 1. Вихідна сукупність спостережень упорядковується відповідно до величини елементів вектора Х, який може впливати на зміну величини дисперсії залишків. Оскільки в табл. 7.3 дані про дохід упорядковані, то переходимо до наступного кроку.

Крок 2. Відкинемо c спостережень, які міститимуться в центрі векторів Х і Y, де , і поділимо сукупність спостережень на дві частини, кожна з яких містить  спостережень.

Крок 3. Побудуємо економетричну модель за першою сукупністю, яка включає спостереження від першого по сьомий місяць включно: . Система нормальних рівнянь для визначення параметрів цієї моделі запишеться так:

Звідси  = 2,1216;

                  = 0,007.

Економетрична модель має вигляд

I: .

Крок 4. Побудуємо економетричну модель виду  за другою сукупністю спостережень, починаючи від дванадцятого по вісімнадця­тий місяць.

Система нормальних рівнянь для визначення параметрів цієї моделі запишеться так:

Звідси  = – 0,408;

                   = 0,165.

Економетрична модель має вигляд:

II:

Крок 5. Знайдемо розрахункові значення залежної змінної моделі  — величини заощадження за кожною з двох моделей і визначимо відхилення фактичних значень заощаджень від розрахункових.

                Таблиця 7.5         Таблиця 7.6

Місяць

у

 

u

u2

 

Місяць

y

 

u

u2

1

2,36

2,00

0,36

0,1296

 

12

2,95

2,99

–0,04

0,0016

2

2,20

2,06

0,14

0,0196

 

13

2,82

3,09

–0,27

0,0729

3

2,08

2,13

–0,05

0,0025

 

14

3,04

3,21

–0,17

0,0289

4

2,20

2,19

0,01

0,0001

 

15

3,53

3,37

0,16

0,0256

5

2,10

2,24

–0,14

0,0196

 

16

3,94

3,56

0,38

0,1444

6

2,12

2,34

–0,22

0,0484

 

17

3,75

3,68

0,07

0,0049

7

2,41

2,43

–0,02

0,0004

 

18

3,99

3,83

0,16

0,0256

Разом

 

 

 

0,2202

 

Разом

 

 

 

0,3039

У табл.7.5 наведено результати обчислення суми квадратів залишків за першою моделлю S1 = 0,2202.

У табл.7.6 наведено обчислення суми квадратів залишків за другою моделлю S2 = 0,3039.

Крок 6. Обчислимо критерій R*, який наближено відповідає F-розподілу:

Порівняємо його значення з табличним значенням F-критерію при вибраному рівні довіри Р = 0,99 і ступенях свободи g1 = 5 і g2 = 5. Fтабл = 11. Звідси R* < Fтабл, що свідчить про відсутність гетероскедастичності.