АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Расчет характеристик простой случайной выборки

Читайте также:
  1. D. Акустический расчет
  2. I Тип Простейшие. Характеристика. Классификация.
  3. I. Расчет номинального значения величины тока якоря.
  4. I. Расчет режимов резания на фрезерование поверхности шатуна и его крышки.
  5. I. Расчет тяговых характеристик электровоза при регулировании напряжения питания ТЭД.
  6. I. Электрофильтры. Характеристика процесса электрической очистки газов.
  7. I: Кинематический расчет привода
  8. II. Расчет и выбор электропривода.
  9. II. Расчет номинального значения величины магнитного потока.
  10. II. Расчет силы сопротивления движению поезда на каждом элементе профиля пути для всех заданных скоростях движения.
  11. II.2 Стилистическая характеристика рекламного текста
  12. II: Расчет клиноременной передачи

Цель любого выборочного исследования состоит в том, чтобы, сформировав вы­борку, собрать по ней информацию и на основе этой информации оценить искомые характеристики генеральной совокупности.

Наиболее распространенной в социологических исследованиях задачей является оценка среднего значения признака (или доли в случае качественного признака) в генеральной совокупности.

Проиллюстрируем на примере нахождение выборочной оценки среднего генеральной совокупности. Предположим, что оценивается среднее число газет и общественно-политических журналов, выпи­сываемых сотрудниками некоторого производственного коллектива. Рассмотрим по порядку все необходимые операции и их результаты.

Составляется основа выборки, т. е. список всех единиц отбора. В качестве такой основы может быть взят алфавитный список всех сотрудников, пронумерованных последовательно (табл. 15). В целях наглядности вместе с основой выборки приводятся и все истинные значения единиц отбора, еще неизвестные исследователю. В дальнейшем сопоставим истинное значение искомого параметра и выборочную оценку.

Общая сумма выписываемых газет и журналов равна 150. Среднее число выписываемых газет и журналов на каждого сотрудника равно = 150/50 = 3.

Среднее квадратическое отклонение для генеральной совокупности равно

Сумма квадратов отклонений равна 146 при условии, что одно значение квадрата отклонения, а именно от единицы отбора 28, было исключено из суммы. Это значение, равное 49, резко увели­чивает сумму, будучи нетипичным для генеральной совокупности.

Такое «исключение» экстремального отклонения нередко применя­ется при обработке первичной социальной информации в том случае, когда предусмотрено возведение в квадрат, а само отклонение в 2—3 раза превышает среднее значение параметра.

Однако ни среднее значение параметра, ни среднее квадратическое отклонение перед началом исследования не известны. В про­тивном случае само исследование было бы излишним.

Естественно предположить при анализе вышеприведенного примера, что каждый респондент (единица отбора и единица наблюде­ния) выписывает несколько газет и журналов и что количество выписываемых газет и журналов не слишком сильно варьирует (если бы путем выборочного исследования потребовалось определить, скажем, объем личных библиотек, положение исследователя ослож­нилось бы). Исходя из этих соображений, полагаем достаточной вы­борку, состоящую из пяти респондентов. Проверить правильность определения объема выборки можно только после обработки резуль­татов пилотажного исследования.

Предположим, что случайный выбор из табл., 15 дал следующие результаты: выбраны номера 18, 4, 28, 39, 22; они соответствуют Значениям признаков 4, 0, 10, 4, 4.

Среднее арифметическое но выборке х = 22/5 = 4,4, дисперсия

Такое значительное отклонение от истинного значения средней объясняется тем, что в выборку попал респондент № 28, исключен­ный при подсчете дисперсии для генеральной совокупности как нетипичный. Однако при формировании выборки еще неизвестно, что данный респондент нетипичен. Но сам факт, что среднее квадратическое отклонение приближается по величине к средней, дол­жен насторожить исследователей.

Для большей наглядности выразим s в процентах от величины средней: (3,5:4,4) • 100%= 79%, т. е. среднее отклонение значений признака от выборочной средней арифметической величины «оставляет 79%. В таких случаях целесообразно увеличить объем выборки, например, в 2 раза. В результате были отобраны номера: 44, 2, 12, 26, 14, 27, 35, 9, 8, 49; значения признака 5, 2, 4, б, 1, -3,2,5,3, 4.

Среднее арифметическое — 3,6, дисперсия s2 = 2,26, среднее квадратическое отклонение s = 1,5. Теперь оно составляет прибли­зительно 40% от величины средней. При больших дисперсиях объем выборки увеличивают с учетом практических возможностей до тех пор, пока дисперсия не перестает уменьшаться. Дальнейшее увеличение объема выборки является нецелесообразным. Обычно исследователь приходит к некоторому компромиссному решению от­носительно объема выборки в зависимости от требуемой точности, атакже средств и времени, которыми он располагает.

Сводка необходимых формул для простой случайной выборки. В рассмотренном гипотетическом примере легко было оценить ка­чество выборочной оценки среднего (перед глазами была информация дня обо всей генеральной совокупности). Но как провести его оценку в реальном исследовании, когда имеется только информация, полученная из выборки?

На помощь приходит статистическая теория выборочного метода. Она позволяет при условии реализации случайного отбора достичь, по крайней мере, следующих двух целей:

1. По заданной априори необходимой степени точности выводов (формализуемой с помощью понятия доверительной вероятности) найти возможные интервалы, изменения характеристик генеральной; совокупности (доверительные интервалы). И наоборот, рассчитать доверительную вероятность отклонения характеристики генеральной совокупности от выборочной по заданной величине доверительного интервала.

2. Найти объем планируемой выборки, позволяющей достигнуть в пределах требуемой точности расчета выборочных характеристик необходимую доверительную вероятность.

Дадим сводку необходимых для достижения этих целей формул3. Чтобы уметь применять приведенные формулы при планирова­нии выборки в эмпирическом социологическом исследовании, позна­комимся несколько подробнее с основными понятиями выборочного метода— «доверительная вероятность» и «доверительный интервал».

Теоретико-вероятностные теоремы, восходящие к закону больших чисел, позволяют с определенной вероятностью, обозначаемой (1 —а), утверждать, что для изучаемого признака отклонения вы­борочной средней от генеральной не превысят некоторой величины D, называемой предельной ошибкой выборки.

В одной из формулировок это утверждение записывается сле­дующим образом:

Смысл приведенного соотношения следующий: с доверительной вероятностью (1-a) можно утверждать, что генеральное среднее лежит в интервале

 

который и называется доверительным интервалом, а определяет как бы степень доверия к данным, получаемым по рассчитанным с его помощью выборочным характеристикам. Отсюда и название а — уровень значимости.

Принятие того или иного уровня значимости, например 5%-ного (a = 0,05), зависит от целей данного социологического исследования, требований к степени гарантии его результатов. Социолог должен четко понимать, что, выбрав, скажем, уровень значимости, равный 5 %, и, рассчитав на основе его выборочные характеристики, мы будем утверждать наличие некоторого эффекта, который на самом деле может оказаться несправедливым приблизительно в пяти про­центах случаев.

Пример. При обследовании 900 человек — лиц трудоспособного возраста — определен их средний возраст. Для вероятности (1 — a) =0,90 необходимо найти доверительный интервал, в котором содер­жится генеральное среднее. Поскольку дисперсия признака неиз­вестна, оценим ее приблизительно по значению размаха для гене­ральной совокупности.

С этой целью воспользуемся соотношением связи среднего квад­ратичного отклонения с размахом

справедливым в предположении нормального характера распреде­ления. Здесь Хmax — Хmin — вариационный размах генеральной сово­купности, а V— величина, зависящая от объема выборки, значения которой можно найти в табл. 17.

Так как по всей генеральной совокупности верхняя граница трудоспособности в СССР — 60 лет, а нижняя — 16, то хmax — хmin =60—16 = 44, следовательно (для п> 100 — последний столбец

табл. 17), получим приближенное значение среднеквадратичного отклонения s=44:5= 8,8.

Величина Z находится по табл. А приложения при a/2. Таким образом, если 1 — a = 0,9, то Z = 1,64,

Подставляя найденные значения М и Z в формулу предельной ошибки, получаем D = ZM = 1,64 • 0,29 = 0,48.

Таким образом, округляя значение ошибки до половины года (0,5), можно утверждать, что с вероятностью 0,9 генеральное сред­нее не выйдет за пределы интервала х — 0,5 < М < х + 0,5, т. е. точность выборочной оценки среднего, рассчитанной по нашей вы­борке (если она организована методом простого случайного повтор­ного отбора), оказывается равной половине года. Утверждать это мы можем с вероятностью 0,9. Интервал (х — 0,5, х + 0,5) и задает доверительный, интервагй, рассчитанный по доверительной вероятности, равной 0,9.

Теперь рассмотрим методику нахождения доверительного интер­вала по заданной доверительной вероятности для качественного Признака.

Пример. Выборочное обследование 900 человек, организованное до способу простого случайного повторного отбора, показало, что 18 человек не информированы о крупном событии в стране. Для Доверительной вероятности 0,95 нужно найти доверительный интервал.

Пользуясь выражением для формулы средней ошибки (см.

табл. 16)

получаем

 

Далее по табл. А приложения, как уже описывалось выше, для a/2 находим Z= 1,96.

Теперь можно определить величину предельной ошибки (см табл. 16):

Таким образом, доверительные границы для доли не информированных в генеральной совокупности равны 0,02 ± 0,009, или от 1,1 до 2,9%.

Приведем иллюстративный пример определения объема простой повторной случайной выборки. Как видно из формул, чтобы опре­делить объем (см. табл. 16), для его оценки необходимо знать дис­персии генеральной средней или хотя бы ее оценки.

Для применения соответствующей формулы необходимо оценить значение дисперсии, что можно сделать (при отсутствии информа­ции о ней и о размахе значений признака в генеральной совокупно­сти) путем проведения одной-двух пилотажных (пробных) выборок.

Допустим, что в результате пилотажа выборочная оценка дис­персии равна 12,24. Определим каким должен быть объем выборки чтобы с вероятностью 0,95 предельное отклонение выборочной средней от генеральной не превышало одного экземпляра газет. При этих условиях получаем численность планируемой выборки

Таким образом, объем выборки должен составлять 24 человека.

 

3. 3.Систематическая и серийная выборки.

 


1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.)