|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Теоретические сведенияСОДЕРЖАНИЕ
ПРАКТИЧЕСКОЕ ЗАНЯТИЕ 1 Проверки гипотез о независимости и случайности исходных данных для эконометрического моделирования
Вопросы для изучения 1. Статистические выводы и проверка гипотез. Ошибки 1 и 2 рода. 2. Двух – и односторонние критерии проверки.
Контрольные вопросы 1. Что такое нулевая и альтернативная гипотезы? 2. Что такое статистический критерий, уровень значимости? 3. Какова цель проверки гипотез? 4. Приведите общую схему проверки гипотез. 5. Чем отличаются проверка гипотезы о математическом ожидании нормальной случайной величины при известной и неизвестной дисперсиях? 6. Какая случайная величина применяется в качестве критерия проверки гипотезы о величине дисперсии нормальной случайной величины? 7. Какая случайная величина применяется в качестве критерия проверки гипотезы о равенстве дисперсий двух нормальных случайных величин? 8. К проверке каких гипотез сводятся исследования среднего дохода населения и анализ разброса в уровне дохода?
Теоретические сведения Пусть X и Y – две дискретные случайные величины, причем X принимает значения x 1, x 2, …, xk с вероятностями p 1, p 2, …, pk соответственно, а Y принимает значения y 1, y 2, …, yl с вероятностями q 1, q 2,.., ql соответственно (естественно , ). Как известно из теории вероятностей, случайные величины X и Y являются независимыми тогда и только тогда, когда справедливо следующее соотношение для любых i и j: P (X = xi, Y = yj) = P (X = xi) * P (Y = yj) = pi * qj, , . Итак, пусть результатом эксперимента является двумерная выборка объема n – совокупность n пар (xi, yj). Если у случайной величины X k различных значений, а Y может принять l разных значений, то всего возможно k * l разных сочетаний вида (xi, yj). Обозначим частоту каждого сочетания через nij. Одновременно можно определить ni как частоту значения xi, а mj – частоту значения yj. Очевидно, что , , . Результаты эксперимента удобно представить в виде корреляционной таблицы размера l * k (таблица 1). Нулевая гипотеза H 0 состоит в том, что случайные величины X и Y независимы, обратная H 1 – соответственно в том, что X и Y являются зависимыми случайными величинами. Таблица 1.1 – Корреляционная таблица
Если H 0 верна, то вероятность появления каждой пары (xi, yj) равна произведению pi * qj, а математическое ожидание числа появлений пары в n независимых испытаниях равно произведению n * pi * qj. Тогда случайную величину (при условии справедливости нулевой гипотезы, причем все математические ожидания Необходимо сделать несколько замечаний. 1. Вероятности pi, qj обычно неизвестны. Поэтому они оцениваются по выборке: , . 2. Если произведения n * pi * qj < 4, то соответствующие им строки и столбцы должны быть объединены с соседними строками и столбцами. 3. Если v = (k – 1)(l – 1) ≥ 8 и n ≥ 40, то минимально допустимое значение ожидаемых частот может быть равным единице.
4. Формулу, по которой вычисляется значение статистики , можно упростить. Если вероятности pi, qj оцениваются по выборке, тогда: так как , . Можно выделить тесты проверки независимости последовательности псевдослучайных чисел.В основе этих методов лежит представление полученных псевдослучайных чисел в качестве реализации дискретного стационарного случайного процесса х (t). Для количественной оценки степени некоррелированности последовательности псевдослучайных чисел применяется способ, заключающийся в определении коэффициента корреляции ρ (εi,i) между элементом εi последовательности и его номером i: . Если при заданном уровне значимости β: , где ρ max – верхняя граница доверительного интервала, а zβ определяется через функцию Лапласа: 2Ф(zβ) = β, то считается, что имеет место корреляционная связь между псевдослучайными числами. В противном случае можно принять гипотезу об их независимости. При проверке на случайность исходных данных можно использовать совокупность тестов, а именно тесты проверки: - частот; - пар; - комбинаций; - серий; - корреляции. Тест проверки частот предполагает разбиение диапазона распределения на несколько интервалов и подсчет количества (частот или вероятностей) попаданий случайных чисел в выделенные интервалы. Тест проверки пар заключается в подсчете количества совпадений для каждого разряда всей совокупности случайных чисел. Тест проверки комбинаций сводится к подсчету совпадений в случайных числах. Тест проверки серий заключается в подсчете количества различных длин последовательностей одинаковых значений. Тест проверки корреляции заключается в определении коэффициента корреляции между последовательностями случайных чисел. Тест проверки серий предусматривает разбиение случайных цифр в исследуемой последовательности на элементы двух родов – первого и второго. Серией называется любой отрезок последовательности цифр, состоящий из следующих друг за другом элементов одного и того же рода. Например, если в последовательности цифр и , то цифры образуют серию первого рода длины k, цифры образуют серию второго рода длины l и цифры также образуют серию первого рода длины s – k – l. Иногда для удобства элементы серий первого рода обозначают знаками "–" (минус), а второго рода – знаками "+" (плюс). В этом случае рассматриваемая последовательность будет иметь такой вид: (– –…–) = k минусов, (++…+) = l плюсов, (– –…–) = s – k – l минусов. Подсчитаем количество zl серий второго рода длины l в последовательности псевдослучайных цифр . Пусть l = 1, 2,...., m и z'm +1– количество серий второго рода с l ³ m + 1 (они объединяются в одну группу). Обозначим общее количество серий через: z = z 1 + z 2 + … + zm + z'm +1. Величина с m степенями свободы вычисляется по формуле: , где . Если, с заданным уровнем значимости b, значение попадает в доверительный интервал (, ), то тест проверки серий удовлетворяется. В практике встречается также другая разновидность теста проверки серий, когда к элементам серий первого рода относят цифры, меньшие 0,5, а к элементам серий второго рода – не меньшие 0,5. При достаточно большом объеме выборки (практически при N ³ 20) и уровне значимости b = 0,95 нижний предел zН общего числа серий равен: , а нижний предел числа серий элементов первого и второго родов равен: . Максимальная длина серий не должна быть больше, чем: .
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.008 сек.) |