АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Коэффициент детерминации,его свойства эконометрика

Читайте также:
  1. A) представляет собой соотношение нормы резервирования депозитов к коэффициенту депонирования
  2. Автокорреляция уровней временного ряда. Анализ структуры временного ряда на основании коэффициентов автокорреляции
  3. АК. Структура белков, физико-химические свойства (192 вопроса)
  4. Активные минеральные добавки. Смешанные цементы, их свойства.
  5. Анализ коэффициентов ликвидности_________ за 201_-201_
  6. Анализ коэффициентов, характеризующих финансовое состояние банка
  7. Анализ свойства вязкости
  8. Анализ финансового состояния предприятия: цели, задачи, формы и методы проведения. Система аналитических коэффициентов и ее использование.
  9. Антигены, основные свойства. Антигены гистосовместимости. Процессинг антигенов.
  10. Арифметическая середина и ее свойства.
  11. Арифметические операции над последовательностями. Свойства пределов, связанные с арифметическими операциями над последовательностями.
  12. Аэродинамика зданий. Понятие аэродинамического коэффициента

Тесноту (силу) связи изучаемых показателей оценивают с помощью коэффициента корреляции Rxy, который принимает значения от -1 до +1.

В нелинейной регрессии используется индекс корреляции (0 < pху < 1):

Для оценки качества модели используют коэффициент детерминации. Долю дисперсии, которая обусловлена регрессией, в общей дисперсии показателя у характеризует коэффициент детерминации R2.

Коэффициент детерминации, как и коэффициент корреляции, принимает значения от -1 до +1. Чем ближе его значение коэффициента по модулю к 1, тем теснее связь результативного признака Y с исследуемыми факторами X.

Например, если получают коэффициент детерминации R2 = 0,9, значит уравнением регрессии объясняется 90% дисперсии результативного признака, а на долю прочих факторов приходится 10% ее дисперсии (т.е. остаточная дисперсия). Величина коэффициента детерминации служит важным критерием оценки качества линейных и нелинейных моделей. Чем значительнее доля объясненной вариации, тем меньше роль прочих факторов, и значит, модель регрессии хорошо аппроксимирует исходные данные и такой регрессионной моделью можно воспользоваться для прогноза значений результативного показателя.

 

27.НУЛЕВАЯ И КОНКР.ГИПОТИЗЫ.УРОВЕНЬ ЗНАЧ-ТИ

Статистической гипотезой называется любое предположение о виде закона распределения и (или) его параметрах. В соответствии со сказанным, статистические гипотезы делятся на непараметрические (о законе распределения) и параметрические (о его параметрах) [10–13].

Например:

1) генеральная совокупность (из которой взята выборка) распределена по закону Пуассона;

2) дисперсии двух нормальных генеральных совокупностей равны между собой (т. е. выборки равноточные);

3) генеральные совокупности, из которых взяты выборки, независимы и т. д.

Нулевой (проверяемой, основной) называют выдвинутую гипотезу Н 0. Конкурирующей (альтернативной) называют гипотезу Н 1, которая противоречит нулевой.

Пусть нулевая гипотеза состоит в том, что случайная величина принадлежит распределению 1 на рис. 4.1. Это записывается следующим образом: Н 0: Х Î(1). Конкурирующей гипотезой в этом случае может быть Н 1: Х Î(2) (случайная величина Х принадлежит распределению 2 на рис. 4.1).

 

 

Рис. 4.1. Вид конкурирующих гипотез: 1 – нулевая; 2 – конкурирующая

 

Гипотезы бывают простые и сложные. Простой называют гипотезу, которая содержит только одно предположение. В приведенном выше примере обе гипотезы простые.

Сложной называют гипотезу, которая состоит из конечного или бесконечного числа нулевых гипотез (предположений). Пример сложной конкурирующей гипотезы Н 1: Х Ï(1), т. е. Х не принадлежит распределению 1 (рис. 4.1), а принадлежит какому-то другому распределению (их много). Нулевая гипотеза должна быть по возможности простой.

Проверка гипотез осуществляется с помощью статистических критериев. Статистический критерий – это правило, по которому принимается решение по нулевой гипотезе. Для построения критерия выбирают статистику К, т. е. некоторую функцию от результатов измерений или наблюдений, находят (или заранее знают) ее распределение и (при традиционном подходе к применению статистических критериев) задаются некоторым ее значением, kкр вероятность превышения (или вероятность принятия меньшего значения) которого считается пренебрежимо малой и равной a.

Критической областью называют совокупность значений статистики, при которых нулевая гипотеза отвергается. Областью принятия гипотезы называется совокупность значений статистики, при которых гипотезу не отвергают. Если наблюденное значение статистики принадлежит критической области – гипотезу отвергают. Если значение статистики «попало» в область допустимых значений, то гипотезу не отвергают.

Критическими точками (значениями) называют точки, отделяющие область принятия гипотезы от критической области.

На рис. 4.1 в качестве статистики критерия принята сама случайная величина , принимающая в опыте значения ; через на рисунке обозначено выбранное критическое значение статистики, т.е. значение критерия.

Различают односторонние: правосторонние ( , рис. 4.2, а), левосторонние ( , рис. 4.2, б) и двусторонние критические области ( , рис. 4.2, в).

 

Рис. 4.2. Виды критических областей:
а – правосторонняя; б – левосторонняя; в – двусторонняя

 

Типичным примером критерия с двусторонней критической областью является известное «правило »: все наблюденные в опыте значения, лежащие правее и левее (здесь – математическое ожидание) отбрасываются как попадающие в критические области. При проверке статистических гипотез возможны следующие ситуации.

1. В действительности гипотеза верна, и критерий ее не отвергает.

2. Гипотеза верна, но критерий ее отвергает.

3. Верна гипотеза , и критерий отвергает .

4. Верна гипотеза , а критерий не отвергает .

В случаях 1 и 3 решение, принятое в результате выполнения статистической проверки, оказывается верным, в случаях 2 и 4 оно ошибочно. Можно точно указать вероятность ошибки в случае 2: она равна вероятности попадания статистики критерия в критическую область , где – вероятность попадания в область принятия гипотезы (в интервал вероятности). Такая ошибка называется ошибкой первого рода – она состоит в том, что будет отвергнута правильная гипотеза. Ее вероятность a называется уровнем значимости критерия.

Ошибка, которая совершается в случае 4 (неверная гипотеза не отвергнута), называется ошибкой второго рода. Ее вероятность зависит от конкурирующей гипотезы и может быть вычислена только, если она является простой. Отметим, что величина называется мощностью критерия. Чем выше мощность критерия, тем он эффективнее.

Необходимо заметить, что чем меньше вероятность ошибки 1-го рода, тем больше вероятность ошибки 2-го рода. Поэтому при традиционном подходе к применению статистических критериев выбор уровня значимости критерия надо делать с учетом этого обстоятельства.

Современный подход к применению статистических критериев состоит в том, что уровень значимости не задают заранее, а определяют по наблюденному значению статистики примененного критерия. Если этот уровень превышает 0,1, то принято считать, что нулевая гипотеза почти наверняка верна. Если этот уровень равен 0,01 или менее, то принято считать, что нулевая гипотеза почти наверняка неверна (в этом случае вероятность того, что она правильна всего лишь 1% или менее). Область значений a между 0,01 и 0,1 представляет собой область сомнений, когда желательно повторение опыта. Понятно, что оснований для сомнений тем больше, чем меньше a. Значение считается таким, когда шансы отвергнуть правильную гипотезу (отвергнуть , когда она верна) или принять неверную гипотезу (не отвергнуть , когда она неверна) приблизительно равны.

Несколько слов о методике вычисления уровня значимости наблюденного значения статистики, распределение которой известно (имеются таблицы или оно введено в компьютерные программы). Современные компьютерные программы уже реализуют описанную выше процедуру, и результат имеет вид «a = 0…». Если же используются статистические таблицы, то искомое значение находят интерполяцией, что обычно дает довольно грубый результат. Нужны достаточно подробные таблицы, либо подходящие аппроксимации. В прил. 6 даны некоторые аппроксимации используемых в статистике распределений, позволяющие с достаточной для практики точностью легко вычислять уровень значимости a.

Итак, статистическим критериям свойственны ошибки первого (отвергнуть верную гипотезу) и второго (принять неверную гипотезу) рода, это соответствует их природе. С помощью статистических критериев решается обратная задача и суждение выносится лишь предположительно, с большей или меньшей степенью уверенности. Необходимо привести высказывание Д. Химмельблау о том, что никакой статистический критерий не в состоянии доказать справедливость проверяемой гипотезы [13]. Не отвергая ее, критерий лишь признает, что она не противоречит опытным данным, как, возможно, множество иных гипотез. Так, если исследователь может допустить не одну нулевую гипотезу, а несколько (например, распределение исследуемой случайной величины может быть нормальным, но может быть и равномерным), он вправе выбрать ту из них, значимость которой больше. Хотя это не гарантирует ему правильность решения, особенно при выборках малого объема, которые могут быть совсем не похожи на генеральную совокупность, из которой они извлечены.

Итак, под обоснованием нулевой гипотезы понимается следующая процедура.

1. На основе опытных данных и конкретных условий задачи формулируются нулевая и альтернативная гипотезы.

2. Подбирается некоторая случайная функция (выборочная статистика) от выборки, закон распределения которой известен в предположении справедливости нулевой гипотезы Н 0.

3. В соответствии с заданным уровнем значимости область допустимых значений функции критерия делится на два непересекающихся подмножества: область принятия гипотезы и критическую область.

4. По выборочным данным определяется числовое значение критерия k. Если это значение принадлежит критической области, то гипотеза Н 0 отвергается, как противоречащая опытным данным. Справедливой считается альтернативная гипотеза Н 1. Если число k принадлежит области принятия гипотезы Н 0, то это предположение считается адекватным опытным данным.

 


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.)