Економетрія - Навчальний посібник (Наконечний С.І., Терещенко Т.О., Романюк Т.П.)

5.1. побудова економетричної моделі на основі покрокової регресії

Оцінювання параметрів економетричної моделі та її дисперсійний аналіз становлять загальний процес побудови моделі. Поєднання цих частин зумовило появу альтернативного методу оцінювання параметрів моделі 1МНК, яка базується на елементах дисперсійного аналізу.

При елементарному тлумаченні взаємозв’язку між двома змінними за допомогою 1МНК увагу, як правило, акцентують на коефіцієнтах кореляції. Причому неважко показати, що

 ,

де ryx — парний коефіцієнт кореляції між Y та X;  — середньоквадратичне відхилення залежної змінної;  — середньоквадратичне відхилення незалежної змінної.

Отже,оцінка параметрів моделі прямо пропорційна до коефіцієнта парної кореляції. Аналогічні співвідношення виконуються і в загальному випадку.

А це означає, що оцінити параметри моделі можна через коефіцієнти кореляції: спочатку оцінити тісноту зв’язку між кожною парою змінних, а потім знайти оцінки параметрів економетричної моделі.

Оскільки коефіцієнти парної кореляції та співвідношення між ними і оцінками параметрів моделі базуються на дисперсіях та середніх квадратичних відхиленнях, то побудову економетричної моделі через коефіцієнти парної кореляції доцільно розглянути в дисперсійному аналізі моделі.

Залежність оцінок параметрів економетричної моделі і коефіцієнтів парної кореляції покладено в основу алгоритму покрокової регресії.

Опишемо цей алгоритм.

Крок 1-й. Усі вихідні дані змінних стандартизуються (нормалізуються):

                                       (5.1)

де  — нормалізована залежна змінна;  — нормалізовані незалежні змінні;  — середнє значення j-ї незалежної змінної;  — середнє значення залежної змінної; ,  — середньоквадратичні відхилення.

При цьому середні значення  і  дорівнюють нулю, а дисперсії — одиниці.

Крок 2-й. Знаходиться кореляційна матриця (матриця парних коефіцієнтів кореляції):

                      (5.2)

де  — парні коефіцієнти кореляції між залежною і незалежними змінними,

n  —  кількість спостережень;

 — парні коефіцієнти кореляції між незалежними змінними,

Крок 3-й. На підставі порівняння абсолютних значень  вибираються  Найбільше  вказує на ту незалежну змінну, яка найтісніше пов’язана з y. На цьому кроці на основі 1МНК знаходиться оцінка параметра цієї змінної в моделі:

                ,               (5.3)

де  — оцінка параметру моделі, яка будується на основі стандартизованих даних.

Крок 4-й. Серед інших значень  вибирається  і в модель вводиться наступна незалежна змінна

і т.д.

Якщо немає обмеження на внесення до економетричної моделі кожної наступної незалежної змінної, то обчислення виконуються доти, поки поступово не будуть внесені до моделі всі змінні.

Сума квадратів залишків для такої моделі запишеться так:

.

звідси мінімізації підлягає

.

Узявши похідну за кожним невідомим параметром bj цієї функції і прирівнявши всі здобуті похідні нулю, дістанемо систему нормальних рівнянь.

Система нормальних рівнянь для знаходження параметрів моделі  bj в загальному вигляді запишеться так:

Позначимо матрицю парних коефіцієнтів кореляції між незалежними змінними через r, а вектор парних коефіцієнтів кореляції між залежною і незалежними змінними через . тоді система нормальних рівнянь набере вигляду

,

а оператор оцінювання параметрів:

                                (5.4)

Оскільки всі змінні виражені в стандартизованому масштабі, то параметри  показують порівняльну силу впливу кожної незалежної змінної на залежну: чим більше за модулем значення параметра , тим сильніше впливає j-та змінна на результат.

Зв’язок між оцінками параметрів моделі на основі стандартизованих і нестандартизованих змінних запишеться так:

                                (5.5)

Приклад 5.1. Для десяти цехів машинобудівного підприємства наведено такі дані (табл. 5.1).

Побудуємо економетричну модель, яка описуватиме зв’язок продуктивності праці з наведеними чинниками згідно з алгоритмом покрокової регресії.

Таблиця 5.1

Номер цеху

Середньомісячна зарплата у

Продуктивність праці х1

Фондомісткість продукції х2

виконання норми виробітку х3, \%

1

45

265

0,20

130

2

42

236

0,04

127

3

50

257

0,30

151

4

55

279

0,20

149

5

40

226

0,10

140

6

70

350

0,10

141

7

56

278

0,25

152

8

57

262

0,03

188

9

55

269

0,15

120

10

53

250

0,32

126

Запишемо кореляційну матрицю для цих вихідних даних:

Із матриці бачимо, що діагональні її елементи дорівнюють одиниці, бо вони характеризують зв’язок кожної змінної із собою. Ця матриця квадратна і симетрична.

У першому рядку містяться коефіцієнти парної кореляції, що характеризують тісноту зв’язку кожної змінної з продуктивністю праці.

Так,

                  = 0,9;        = 0,03;       = 0,28.

де  — продуктивність праці;  — зарплата;  — фондомісткість продукції;  — \% виконання норми виробітку.

Оскільки серед величин максимальне значення  = 0,9, то спочатку будуватиметься модель:  Порівнявши потім інші два коефіцієнти:

max{ = 0,03; = 0,28} = 0,28, введемо до моделі змінну :

і, нарешті,

Далі, використовуючи співвідношення (5.5), обчислимо оцінки параметрів моделі для вихідної нестандартизованої інформації.

У результаті дістанемо такі регресійні рівняння зв’язку:

1) ;

2)

3)            (5.6)