|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Статистические оценкиЛюбая функция от результатов наблюдения исследуемого признака называется статистикой. Статистика, используемая в качестве приближения неизвестного значения параметра генеральной совокупности, называется статистической оценкой. Поскольку набор выборочных данных случаен, то и статистические оценки тоже случайны, т. е. их значения изменяются от выборки к выборке. Тем не менее, если процедура оценивания выбрана правильно, то значения статистических оценок должны концентрироваться вокруг неизвестного значения искомого параметpa. Требованиях, которые нужно предъявлять к статистическим оценкам, чтобы они в каком-то определенном смысле "хорошо" приближали неизвестные параметры случайной величины: • несмещенность, • эффективность, • состоятельность. Несмещенностью оценки называется отсутствие систематической ошибки. Примером несмещенной оценки генеральной средней является выборочнаясредняя:
Примечательно, что выборочная дисперсия:
как оценка генеральной дисперсии таким качеством не обладает, т.е. будет смещенной. Для устранения этого недостатка в статистике используют другую, скорректированную оценку генеральной дисперсии Такую оценку называют исправленной выборочной дисперсией. Предположим, что мы выяснили возраст 10 респондентов некоторой целевой аудитории: 26, 27, 28, 31, 33, 33, 35, 37, 46, 60. Для того, чтобы узнать степень разброса возрастов в исследуемой аудитории, оценим дисперсию данного признака в этой генеральной совокупности. Для получения оценки дисперсии сначала рассчитаем выборочное среднее: Оценку называют эффективней оценки , если при заданном объеме выборки разброс (дисперсия) ее значений будет меньше. При рассмотрении выборок большого объема к оценкам предъявляют требование состоятельности. Оценка ≡ ( х1, х2,..., хп) неизвестного параметра θназывается состоятельной, если по мере роста числа наблюдений вероятность отклонений ее от истинного значения параметра θбудет близка (стремиться) к нулю. Требование состоятельности кажется необходимым, поскольку в противном случае увеличение объема исходной информации (т.е. увеличение объема выборки) не будет приближать нас к истине. Примером состоятельной оценки генерального среднего может служить выборочное среднее. Состоятельность вытекает из отмеченной выше устойчивости выборочного среднего и означает, что чем больше объем выборки, тем ближе выборочное среднее к генеральному среднему. Интервальное оценивание. Основные понятия. При построении точечных оценок возникает проблема – построенная оценка является лишь приближенным значением оцениваемого параметра. Возникает вопрос – можно ли указать величину Δ, которая с заранее практической вероятностью (достоверностью, надежностью), которая будет близка к 1, гарантировала бы выполнение неравенства: Доверительным называют интервал , который с заданной вероятностью (надежностью) (1-α) накрывает неизвестный параметр θ. При этом заранее выбираемая исследователем вероятность (1-α) называется доверительной вероятностью, а величина α – уровнем значимости (к примеру α=0,1, α=0,05 ). - нижняя граница доверительного интервала -верхняя граница доверительного интервала Концы доверительного интервала случайны. Ширина доверительного интервала существенно зависит от объема выборки. При фиксированной доверительной вероятности ширина доверительного интервала уменьшается с увеличением выборки. (Т. е. при большой выборке нет смысла использовать доверительный интервал – он будет слишком узким и будет очень близок к точечной оценке). Рассмотрим один из подходов к построению доверительного интервала: Статистика Z(x1, x2, …, x3) – некоторая производная функция от элементов выборки. Пусть возможно подобрать данную статистику Z(θ1,θ2) таким образом, что: - Закон ее распределения известен и независим от θ. - Статистика – непрерывная и строго монотонная относительно θ. Тогда задавши доверительную вероятность 1-α можно найти границы доверительного интервала: Р(Zα/2<Z(θ)<Z1-α/2) = 1- α Решая уровнение относительно θ получим границы доверительного интервала.
Проверка статистических гипотез. Основные понятия. Статистическая гипотеза – предположение относительно параметра или типа распределения исследуемой характеристики. Для проверки таких предположений исследователь выдвигает два взаимоисключающих утверждения о параметрах или типе распределения изучаемой характеристики. Утверждение, которое исследователь предполагает отклонить – нулевая гипотеза. Альтернативной гипотезой называют гипотезу, которая противоречит нулевой. Правило, позволяющее принять или отклонить нулевую гипотезу, называется критерием проверки гипотез. В качестве инструмента выбора гипотезы выделяют некоторую функцию наблюдений – статистика критерия (выборочное среднее, арифметическое наблюдение…). Область принятия решения – совокупность значений статистики критерия, при которых принимают нулевую гипотезу. Критическая область – совокупность значений статистики критерия, при кторых нулевую гипотезу отклоняют. Основное правило принятия статистического решения – если значение статистики критерия попадает в критическую область – отвергают Н0, если попадает в область принятия решения - Н0 принимают. Процедура проверки статистической гипотезы включает этапы: 1. Выбираются Н0 или Н1 2. Назначается уровень значимости критерия a 3. Выбирается статистика критерия для проверки гипотезыН0, и определяется ее распределения 4. Для данного уровня значимости а строится критическая область 5. Производится выборка наблюдений и определяется значение статистикеи критерия для этой выборки 6. Принимается статистическое решение. Если значение статистики попадает в область принятия решения - Н0, если попадает в критическую область - Н1
6. Построение выборки. Подходы, методы. Совокупность всех единиц исследования из числа целевой аудитории составляет генеральную совокупность (N). Если же количество исследуемых единиц (п) меньше размера генеральной совокупности, исследования называют выборочными (п < N), а саму совокупность единиц — выборкой.
Выборки можно классифицировать по разным критериям: 1. В зависимости от охвата целевой аудитории выборки бывают: • сплошные (census •-- доел, "перепись") — размер выборки равен размеру генеральной совокупности. Такие выборки формируют, когда размер генеральной совокупности невелик. • выборочные наблюдения — размер выборки меньше размера генеральной совокупности. 2. По этапности формирования: • одноступенчатые — выборка формируется из числа единиц, относящихся к одному типу. Например, из студенческой группы для опроса берут 10 человек; • многоступенчатые — иерархическая выборка, когда сначала формируют выборку на более высоком уровне отбора, потом на более низком и так далее. Например, вначале для исследования отбираются вузы, потом факультеты, потом группы.
3. По характеру случайности отбора выборки бывают: • случайные — все единицы имеют известную, ненулевую вероятность попасть в выборочную совокупность. • детерминированные — единицы выборки отбираются по неслучайному принципу, исходя из определенного критерия. Случайные выборки, в свою очередь, подразделяют на такие виды: • простые случайные. Такой вид выборки предполагает, что каждый член генеральной совокупности имеет равную вероятность быть отобранным для наблюдения. • стратифицированные (типовые) выборки. Используются при условии, что в исходной совокупности существуют подгруппы (страты), которые по своим характеристикам существенно отличаются одна от другой. • групповые (кластерные) выборки подобны стратифицированной с том отличием, что если в рамках стратифицированной выборки производится случайный отбор элементов в рамках страты, то в групповых выборках производится случайный отбор подмножеств (групп или кластеров). Например, в рамках одного факультета имеется 25 групп и для исследования необходимо сформировать выборочную совокупность, состоящую из 5 групп. В этом случае выбор этих 5 групп осуществляется случайным образом. Групповые выборки могут быть одноступенчатыми и многоступенчатыми. Детерминированные, или неслучайные, выборки можно разделить: • на удобные — являются нерепрезентативными выборками, т. к. отбор производится исходя из доступности респондентов. • преднамеренные — отбираются по заранее установленным исследователем критериям. • квотированные выборки — элементы выборки отбираются неслучайным образом по заранее определенным критериям в соответствии с установленными квотами, пропорциональными характеристикам генеральной совокупности
4. Случайные выборки могут формироваться различными способами. В общем случае применяются несколько типов процедур отбора. • С помощью датчика случайных чисел. В этом случае используется датчик случайных чисел, реализованный программно или аппаратно и имеющийся во всех современных моделях компьютеров, программного обеспечения к ним. • Механистический отбор. В этом случае процедура состоит из тех же этапов, но случайность обеспечивается не датчиком случайных чисел, а за счет некоторой механистической процедуры. Наиболее применяемая процедура — это процедура систематического отбора. Определение объема выборки Существует три подхода к определению объема выборки. • Исходя из бюджета исследований. В этом случае исходят из величины выделенных финансовых ресурсов. Из этой суммы вычитают постоянные издержки (стоимость аренды помещения, оборудования и т. п.) и оставшуюся сумму долят на стоимость сбора одной анкеты. • По методу "большого пальца". При большом размере генеральной совокупности (объем больше 10 000 единиц), как показывает практика, достаточным является объем выборки в размере 5 % от генеральной совокупности. • Исходя из заданной точности. Считается, что для того, чтобы на основе результатов маркетингового исследования можно было принять решение, ошибка в оценке исследуемых параметров не должна превышать 5 %. Решение этой проблемы является достаточно сложным. В общепринятой практике для этого расчет производят исходя из того, что средняя ошибка по анкете имеет нормальный закон распределения. И исходя из заданной точности с некоторой доверительной вероятностью с помощью расчетных формул или номограммы определяется размер выборки
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.007 сек.) |