Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Статистические оценки

Читайте также:

Любая функция от результатов наблюдения исследуемого признака называется статистикой.

Статистика, используемая в качестве приближения неизвестного значения параметра генеральной совокупности, называется статистической оценкой.

Поскольку набор выборочных данных случаен, то и статистические оценки тоже случайны, т. е. их значения изменяются от выборки к выборке. Тем не менее, если процедура оценивания выбрана правильно, то значения статистических оценок должны концентрироваться вокруг неизвестного значения искомого параметpa. Требованиях, которые нужно предъявлять к статистическим оценкам, чтобы они в каком-то определенном смысле "хорошо" приближали неизвестные параметры случайной величины:

• несмещенность,

• эффективность,

• состоятельность.

Несмещенностью оценки называется отсутствие систематической ошибки.

Примером несмещенной оценки генеральной средней является выборочнаясредняя:

Примечательно, что выборочная дисперсия:

как оценка генеральной дисперсии таким качеством не обладает, т.е. будет смещенной. Для устранения этого недостатка в статистике используют другую, скорректированную оценку генеральной дисперсии

Такую оценку называют исправленной выборочной дисперсией. Предположим, что мы выяснили возраст 10 респондентов некоторой целевой аудитории: 26, 27, 28, 31, 33, 33, 35, 37, 46, 60.

Для того, чтобы узнать степень разброса возрастов в исследуемой аудитории, оценим дисперсию данного признака в этой генеральной совокупности. Для получения оценки дисперсии сначала рассчитаем выборочное среднее:

Оценку называют эффективней оценки , если при заданном объеме выборки разброс (дисперсия) ее значений будет меньше.

При рассмотрении выборок большого объема к оценкам предъявляют требование состоятельности.

Оценка ≡ ( х₁, х₂,..., х_п) неизвестного параметра θназывается состоятельной, если по мере роста числа наблюдений вероятность отклонений ее от истинного значения параметра θбудет близка (стремиться) к нулю.

Требование состоятельности кажется необходимым, поскольку в противном случае увеличение объема исходной информации (т.е. увеличение объема выборки) не будет приближать нас к истине. Примером состоятельной оценки генерального среднего может служить выборочное среднее. Состоятельность вытекает из отмеченной выше устойчивости выборочного среднего и означает, что чем больше объем выборки, тем ближе выборочное среднее к генеральному среднему.

Интервальное оценивание. Основные понятия.

При построении точечных оценок возникает проблема – построенная оценка является лишь приближенным значением оцениваемого параметра. Возникает вопрос – можно ли указать величину Δ, которая с заранее практической вероятностью (достоверностью, надежностью), которая будет близка к 1, гарантировала бы выполнение неравенства:

Доверительным называют интервал , который с заданной вероятностью (надежностью) (1-α) накрывает неизвестный параметр θ. При этом заранее выбираемая исследователем вероятность (1-α) называется доверительной вероятностью, а величина α – уровнем значимости (к примеру α=0,1, α=0,05 ).

- нижняя граница доверительного интервала

-верхняя граница доверительного интервала

Концы доверительного интервала случайны. Ширина доверительного интервала существенно зависит от объема выборки. При фиксированной доверительной вероятности ширина доверительного интервала уменьшается с увеличением выборки.

(Т. е. при большой выборке нет смысла использовать доверительный интервал – он будет слишком узким и будет очень близок к точечной оценке).

Рассмотрим один из подходов к построению доверительного интервала:

Статистика Z(x1, x2, …, x3) – некоторая производная функция от элементов выборки.

Пусть возможно подобрать данную статистику Z(θ1,θ2) таким образом, что:

- Закон ее распределения известен и независим от θ.

- Статистика – непрерывная и строго монотонная относительно θ.

Тогда задавши доверительную вероятность 1-α можно найти границы доверительного интервала:

Р(Zα/2<Z(θ)<Z1-α/2) = 1- α

Решая уровнение относительно θ получим границы доверительного интервала.

Проверка статистических гипотез. Основные понятия.

Статистическая гипотеза – предположение относительно параметра или типа распределения исследуемой характеристики. Для проверки таких предположений исследователь выдвигает два взаимоисключающих утверждения о параметрах или типе распределения изучаемой характеристики.

Утверждение, которое исследователь предполагает отклонить – нулевая гипотеза. Альтернативной гипотезой называют гипотезу, которая противоречит нулевой. Правило, позволяющее принять или отклонить нулевую гипотезу, называется критерием проверки гипотез.

В качестве инструмента выбора гипотезы выделяют некоторую функцию наблюдений – статистика критерия (выборочное среднее, арифметическое наблюдение…).

Область принятия решения – совокупность значений статистики критерия, при которых принимают нулевую гипотезу.

Критическая область – совокупность значений статистики критерия, при кторых нулевую гипотезу отклоняют.

Основное правило принятия статистического решения – если значение статистики критерия попадает в критическую область – отвергают Н₀, если попадает в область принятия решения - Н₀принимают.

Процедура проверки статистической гипотезы включает этапы:

1. Выбираются Н₀ или Н₁

2. Назначается уровень значимости критерия a

3. Выбирается статистика критерия для проверки гипотезыН₀, и определяется ее распределения

4. Для данного уровня значимости а строится критическая область

5. Производится выборка наблюдений и определяется значение статистикеи критерия для этой выборки

6. Принимается статистическое решение. Если значение статистики попадает в область принятия решения - Н₀, если попадает в критическую область - Н₁

6. Построение выборки. Подходы, методы.

Совокупность всех единиц исследования из числа целевой аудитории составляет генеральную совокупность (N). Если же количество исследуемых единиц (п) меньше размера генеральной совокупности, исследования называют выборочными (п < N), а саму совокупность единиц — выборкой.

Выборки можно классифицировать по разным критериям:

1. В зависимости от охвата целевой аудитории выборки бывают:

• сплошные (census •-- доел, "перепись") — размер выборки равен размеру генеральной совокупности. Такие выборки формируют, когда размер генеральной совокупности невелик.

• выборочные наблюдения — размер выборки меньше размера генеральной совокупности.

2. По этапности формирования:

• одноступенчатые — выборка формируется из числа единиц, относящихся к одному типу. Например, из студенческой группы для опроса берут 10 человек;

• многоступенчатые — иерархическая выборка, когда сначала формируют выборку на более высоком уровне отбора, потом на более низком и так далее. Например, вначале для исследования отбираются вузы, потом факультеты, потом группы.

3. По характеру случайности отбора выборки бывают:

• случайные — все единицы имеют известную, ненулевую вероятность попасть в выборочную совокупность.

• детерминированные — единицы выборки отбираются по неслучайному принципу, исходя из определенного критерия.

Случайные выборки, в свою очередь, подразделяют на такие виды:

• простые случайные. Такой вид выборки предполагает, что каждый член генеральной совокупности имеет равную вероятность быть отобранным для наблюдения.

• стратифицированные (типовые) выборки. Используются при условии, что в исходной совокупности существуют подгруппы (страты), которые по своим характеристикам существенно отличаются одна от другой.

• групповые (кластерные) выборки подобны стратифицированной с том отличием, что если в рамках стратифицированной выборки производится случайный отбор элементов в рамках страты, то в групповых выборках производится случайный отбор подмножеств (групп или кластеров). Например, в рамках одного факультета имеется 25 групп и для исследования необходимо сформировать выборочную совокупность, состоящую из 5 групп. В этом случае выбор этих 5 групп осуществляется случайным образом.

Групповые выборки могут быть одноступенчатыми и многоступенчатыми.

Детерминированные, или неслучайные, выборки можно разделить:

• на удобные — являются нерепрезентативными выборками, т. к. отбор производится исходя из доступности респондентов.

• преднамеренные — отбираются по заранее установленным исследователем критериям.

• квотированные выборки — элементы выборки отбираются неслучайным образом по заранее определенным критериям в соответствии с установленными квотами, пропорциональными характеристикам генеральной совокупности

4. Случайные выборки могут формироваться различными способами. В общем случае применяются несколько типов процедур отбора.

• С помощью датчика случайных чисел. В этом случае используется датчик случайных чисел, реализованный программно или аппаратно и имеющийся во всех современных моделях компьютеров, программного обеспечения к ним.

• Механистический отбор. В этом случае процедура состоит из тех же этапов, но случайность обеспечивается не датчиком случайных чисел, а за счет некоторой механистической процедуры. Наиболее применяемая процедура — это процедура систематического отбора.

Определение объема выборки

Существует три подхода к определению объема выборки.

• Исходя из бюджета исследований. В этом случае исходят из величины выделенных финансовых ресурсов. Из этой суммы вычитают постоянные издержки (стоимость аренды помещения, оборудования и т. п.) и оставшуюся сумму долят на стоимость сбора одной анкеты.

• По методу "большого пальца". При большом размере генеральной совокупности (объем больше 10 000 единиц), как показывает практика, достаточным является объем выборки в размере 5 % от генеральной совокупности.

• Исходя из заданной точности. Считается, что для того, чтобы на основе результатов маркетингового исследования можно было принять решение, ошибка в оценке исследуемых параметров не должна превышать 5 %. Решение этой проблемы является достаточно сложным. В общепринятой практике для этого расчет производят исходя из того, что средняя ошибка по анкете имеет нормальный закон распределения. И исходя из заданной точности с некоторой доверительной вероятностью с помощью расчетных формул или номограммы определяется размер выборки

1 | 2 | 3 | 4 |
Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.044 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница