АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Качество подгонки панельных данных моделью

Читайте также:
  1. II. Расчет силы сопротивления движению поезда на каждом элементе профиля пути для всех заданных скоростях движения.
  2. IV. Расчет механической мощности, реализуемой электровозом при движении с установившимися скоростями на заданных элементах профиля пути.
  3. VI. Загрузка данных на внешние носители
  4. VI. Расчет токов, потребляемых электровозом из контактной сети при движении на заданных участках пути.
  5. А наоборот, развиваться и переходить в новое качество
  6. Администратор баз данных
  7. Анализ данных
  8. Анализ данных (для гипотезы 1)
  9. Анализ данных (для гипотезы 2)
  10. Анализ данных.
  11. Анализ документов и существующих данных
  12. Анализ и интерпретация данных

Для стандартных моделей регрессии качество подгонки (при условии, что среди регрессоров есть константа) обычно измеряет коэффициент детерминации R2 или скорректированный коэффициент детерминации .

При анализе панельных данных возникают некоторые проблемы с определением коэффициента детерминации, связанные с неопределённостью в отношении того, что считать полной суммой квадратов отклонений, подлежащей разложению на объяснённую регрессией и остаточную. Кроме того, модель со случайными эффектами оценивается с помощью обобщённого МНК, для которого коэффициент детерминации вообще не является адекватной мерой качества подгонки.

В контексте рассматриваемой проблемы полную вариацию независимой переменной yit можно записать в виде суммы внутригрупповой и межгрупповой вариаций, т.е.

(1/nT) = (1/nT) + (1/n) ,

где обозначает общее выборочное среднее. Теперь можно определить альтернативные версии меры R2 в зависимости от размерности анализируемых данных. При этом предполагается, что коэффициенты множественной детерминации определяются в терминах квадратов коэффициентов корреляции между реальными и расчётными (по соответствующей модели) значениями объясняемой переменной.

Например, в объединённой модели МНК-оценка максимизирует общую меру качества подгонки данных моделью, т.е. максимизирует общий R2, о котором говорят как о «R2-полном» или R2overall. Определяется он из соотношения

= corr2(, ,

где т .

Оценка с фиксированными эффектами выбирается, чтобы наиболее полно объяснить внутригрупповую вариацию, и поэтому максимизируется «внутригрупповой R2», заданный в виде

= corr2(),(

где - )т . Такой коэффициент называется R2within.

Межгрупповая оценка, являясь МНК-оценкой для модели в терминах индивидуальных средних, максимизирует «межгрупповой R2», который определяется как

= corr2(, ,

где т . И такой коэффициент называется R2between.

Описанные коэффициенты детерминации можно определить для любой оценки вектора параметров β, при этом естественно считать, что т , . Именно такой подход реализован в эконометрическом пакете STATA: при оценивании моделей с панельными данными вычисляются все три отмеченных коэффициента детерминации, независимо от того, какой метод оценивания применяется.

Следует отметить, что коэффициенты детерминации в моделях с панельными данными нецелесообразно использовать для того, чтобы определить, какой метод оценивания лучше. Однако эти коэффициенты можно применять для сравнения моделей, отличающихся набором регрессоров и оцениваемых одним и тем же методом.

Приведём пример анализа панельных данных на примере из Носко В. П. В нём рассматриваются три предприятия, каждое за 10 лет по двум показателям: y – объём инвестиций, x – прибыль. После структуризации информации, в рабочей области пакета EViews эти данные примут вид (рисунок 4.1).

Именно в таком виде (начиная со столбца F) эта информация и должна вноситься в базу данных пакета программ при анализе панельных данных.

Рисунок 4.1– Информация в рабочей области пакета EViews

 

Здесь F – индекс предприятия, YEAR – обозначение времени (10 лет).

Графически эта информация представлена на рисунке 4.2.

 

Рисунок 4.2 – График исходной информации

 

Здесь первые 10 наблюдений – это 1-е предприятие за 10 лет, вторые 10 наблюдений – 2-е предприятие и последние – 3-е предприятие. Видно, что у 2-го предприятия, в отличие от 1-го и 3-го прибыль выше, чем инвестиции. Количественно это выглядит следующим образом:

 

Предприятие Инвестиции Прибыль
  155,02 153,97
  150,15 165,59
  143,13 128,58

 

Существенно ли это различие – попытаемся выяснить, используя модели панельных данных.

Приведём сначала расчёты в пакете EViews. Объединённая модель (без учёта структуры панельных данных – pooled) следующая (рисунок 4.3). Здесь она приведена для сравнительного анализа.

 

Рисунок 4.3 – Объединённая модель

 

Модель с фиксированными эффектами следующая (рисунок 4.4).

 

Рисунок 4.4– Модель с фиксированными эффектами

 

Сами эффекты в этой модели не вычисляются, но в пакете EViews есть опция, позволяющая их вычислить. Применив её, получим

Если использовать модель с фиктивными переменными (без константы), то получим (рисунок 4.5). Как видим, результаты этих двух методов вычисления эффектов не совсем совпадают. Показатели точности этих уравнений совпадают. Но особенности вычислений этих двух методов в том, что эффекты на рисунке 4.4 пронормированы таким образом, что их сумма равна нулю. И если эффекты на рисунке 4.5 пронормировать аналогичным образом, то получим то же самое, что и на рисунке 4.4.

 

Рисунок 4.5 – Модель с фиктивными переменными

При этом константа в уравнении модели с фиксированными эффектами (–1,323498) – это среднее арифметическое эффектов из модели с фиктивными переменными (рисунок 4.5). Вычтя это значение из эффектов модели на рисунке 4.5, получим в точности эффекты из рисунка 4.4.

Анализировать нормированные эффекты удобнее. Так, если попытаться проинтерпретировать численные значения эффектов (рисунок 4.4), то это можно сделать следующим образом. Как было отмечено в начале этого примера, второе предприятие отличается от 1-го и 3-го тем, что у него в анализируемом периоде прибыль выше инвестиций. Это и отмечено эффектами – у 2-го предприятия эффект с отрицательным знаком в отличие от эффектов 1-го и 3-го предприятий. Причём и численное значение эффектов показывает: различие в разности прибыли и инвестиций примерно одинаковое, но с обратным знаком, что и отражено в индивидуальных эффектах (рисунок 4.4).

И тем не менее фиксированные эффекты не объясняют вариацию между объектами, они только улавливают её. Т.е., если спросить, почему 2-е предприятие имеет прибыль больше, чем инвестиции по сравнению с другими анализируемыми предприятиями, то ответ, представляемый эффектами, есть просто: «потому, что это 2-е предприятие».

Рассчитаем модель со случайными эффектами. Получим (рисунок 4.6).

 

Рисунок 4.6 – Модель со случайными эффектами

 

Параметры этой модели оценены на основе обобщённого МНК с учётом ковариационной матрицы оценок, что и отражено в заголовке отчёта. Можно рассчитать индивидуальные случайные оценки (рисунок 4.7)

Рисунок 4.7 – Случайные эффекты

 

Они тоже нормированы под нулевое суммарное значение. И их интерпретация аналогична фиксированным эффектам.

Как было отмечено, тестирование, являются ли эффекты значимыми, можно определить на основе тестов Вальда и Бреуша – Пагана. Оба эти теста асимптотические, и в силу малого объёма выборки в анализируемом примере эти тесты здесь не приводятся.

По этой же причине можно было бы не приводить тест на спецификацию модели (с фиксированными эффектами или со случайными?), тем более, как отмечалось, результаты этого теста могут различаться при разных методах оценивания дисперсии остатков моделей. Тем не менее приведём для примера тест Хаусмана, рассчитанный в пакете EViews (рисунок 4.8). Как видим из отчёта работы этого теста, вероятность для χ2-статистики меньше 0,05, следовательно, гипотеза о значимом расхождении оценок по моделям с фиксированными и случайными эффектами отклоняется и можно предпочесть из этих моделей модель с фиксированными эффектами.

 

Рисунок 4.8 –Тест Хаусмана

 

 

Для сравнения приведём отчёт об оценке модели с фиксированными эффектами в пакете STATA.

panel variable: f, 1 to 3

time variable: year, 1 to 10

. xtreg y x, fe

Fixed-effects (within) regression Number of obs = 30

Group variable (i): f Number of groups = 3

R-sq: within = 0.9542

between = 0.5537

overall = 0.9178

F(1,26) = 541.66

corr(u_i, Xb) = -0.2342 Prob > F = 0.0000

------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | 1.141378.0490418 23.27 0.000 1.040572 1.242185 cons | -2.106577.7938837 -2.65 0.013 -3.738429 -.474726

Рисунок 4.9 – Отчёт об оценке модели в пакете STATA

 

Как и отмечалось, при оценке по любому методу (объединённая модель, модель с фиксированными эффектами и др.) в этом пакете выдаются все три оценки коэффициента детерминации (R-sq: within, between и overall) (рисунок 4.9), и исследователю нужно уметь применять тот или иной коэффициент в зависимости от анализируемой модели.

Приведём пример, иллюстрирующий недостаток модели с фиксированными эффектами, заключающийся в том, что в этом случае не учитываются факторы, не меняющиеся во времени. Пусть рассматривается пример определения индивидуальной заработной платы (wage) 545 индивидуумов за 8 лет по показателям SCHOOL, EXPER, UNION, MAR, BLACK, HISP, PUB (образование, опыт работы, состоит ли в профсоюзе, семейное положение, негр, испанец, работа в индивидуальном секторе). При этом SCHOOL, BLACK, HISP не меняются во времени.

Оценка параметров модели с фиксированными эффектами (пакет STATA) имеет вид (сокращённый вариант отчёта)

------------------------------------------------------------------------------

| Coef. Std. Err. t P>|t| [95% Conf. Interval]

-----+------------------------------------------------------------------------

SCHOOL | (dropped)

EXPER |.116457.0084309 13.81 0.000.0999275.1329865

EXPER2 | -.0042886.0006054 -7.08 0.000 -.0054756 -.0031015

UNION |.081203.0193159 4.20 0.000.0433325.1190736

MAR |.0451061.0183114 2.46 0.014.009205.0810072

BLACK | (dropped)

HISP | (dropped)

PUB |.0349267.0386082 0.90 0.366 -.040768.1106214

_cons | 1.065698.0266766 39.95 0.000 1.013396 1.118

 

 

Как видим, три указанных фактора не участвуют в оценке модели (dropped – «игнорируется»). А в модели со случайными эффектами они присутствуют.

 

------------------------------------------------------------------------------

WAGE | Coef. Std. Err. z P>|z| [95% Conf. Interval]

-------------+----------------------------------------------------------------

SCHOOL |.1010237.0089219 11.32 0.000.0835372.1185103

EXPER |.1117851.0082709 13.52 0.000.0955744.1279959

EXPER2 | -.0040575.000592 -6.85 0.000 -.0052177 -.0028972

UNION |.1064134.0178669 5.96 0.000.0713949.1414319

MAR |.0625465.0167762 3.73 0.000.0296658.0954272

BLACK | -.1440026.0476439 -3.02 0.003 -.237383 -.0506223

HISP |.0197269.0426303 0.46 0.644 -.0638269.1032807

PUB |.0301555.0364671 0.83 0.408 -.0413187.1016296

_cons | -.1043113.110834 -0.94 0.347 -.3215421.1129194

 

 

В тесте Хаусмана эти факторы также не участвуют:

 

Test hausman

 

| (b) (B) Difference S.E.

--------+----------------------------------------------------------------

EXPER |.116457.1117851.0046718.0016345

EXPER2 | -.0042886 -.0040575 -.0002311.0001269

UNION |.081203.1064134 -.0252104.0073402

MAR |.0451061.0625465 -.0174403.0073395

PUB |.0349267.0301555.0047713.0126785

------------------------------------------------------------------------------

b = consistent under Ho and Ha; obtained from xtreg

B = inconsistent under Ha, efficient under Ho; obtained from xtreg

Test: Ho: difference in coefficients not systematic

chi2(5) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 31.75

Prob>chi2 = 0.0000

 

 

Тест Хаусмана показывает, что в этом случае предпочтение желательно отдать модели с фиксированными эффектами (Prob>chi2 = 0.0000).

 

 


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.014 сек.)