АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Математико-статистическая обработка данных

Читайте также:
  1. Access. Базы данных. Определение ключей и составление запросов.
  2. Cкоростная автоматическая обработка
  3. Decide which answer А, В, С or D best fits each space. Подумайте, какие из предложенных ответов лучше подходят для данных выражений.
  4. Decide which answer А, В, С or D best fits each space. Подумайте, какие из предложенных ответов лучше подходят для данных выражений.
  5. I. Разработка структуры базы данных.
  6. I.5.3. Подготовка данных для задачи линейного программирования
  7. I.5.7. Mодификация (изменение) данных задачи
  8. III. Векторное произведение векторов, заданных координатами
  9. III. Создание и обработка комплексного информационного объекта в виде презентации с использованием шаблонов.
  10. ODBC - открытый интерфейс к базам данных на платформе Microsoft Windows — до 15 мин.
  11. А Порядок работы на станции при тахеометрической съемке. Вычислительная и графическая обработка результатов съемки.
  12. А. Термическая обработка

Использование статистических программ в компьютерной обработке на несколько порядков ускоряет обработку материала и предоставляет в распоряжение исследователя такие методы анализа, которые в ручной обработке не могут быть реализованы. Однако в полной мере эти преимущества могут быть использованы, если исследователь имеет необходимый уровень подготовки в этой области. Обычно, чем мощнее компьютерная программ (чем более широкие у неё возможности), тем больше времени она требует для освоения. Таким образом, затрачивать время на её изучение при редких обращениях к мощному статистическому аппарату не совсем эффективно. Очень часто использование таких программ для решения даже несложных задач также требует определённой суммы умений.

Для того, чтобы избежать лишних сложностей и временных затрат, гораздо эффективнее обратиться к профессионалам. Они качественно и профессионально проведут всю необходимую математико-статистическую обработку данных вашего исследования: анализ первичных статистик, оценку достоверности различий, нормирование данных, корреляционный и факторный анализ и т.п. Подробнее с услугами, которые предлагает АГ «СтатЭксперт» вы можете ознакомиться тут.

Литература: 1. Куликов Л.В. Психологической исследование: методические рекомендаци

Статистическая обработка эмпирической информации (количественные методы анализа данных) [5]

Выше уже упоминалось об использовании статистических методов в социологическом исследовании.

Количественная первичная информация, полученная в процессе исследований, должна быть сгруппирована для дальнейшего анализа. Группировка данных – один из методов обработки первичной информации, представляющий процесс образования групп единиц совокупности, однородных в каком-нибудь отношении, а также имеющих одинаковые или близкие значения изучаемого признака. Вопросам выбора метода и признаков группировки следует уделять особое внимание, так как именно они во многом определяют успешность выполняемого исследования. Технологию группировки необходимо разрабатывать уже на этапе составления программы исследования.

Числовые значения анализируемой характеристики, сгруппированные по одному признаку, называются статистическим рядом.

Повышение наглядности собранных данных, то есть приведение их в более компактное состояние, в наибольшей степени подходящее для аналитических обобщений, осуществляется различными способами:

1) ранжированием данных;

2) применением простых, групповых, комбинационныхи других видов таблиц;

3) использованием графического отображения информации в виде диаграмм, полигонов распределения и т. п.;

4) вычислением средней величины и других статистических параметров, позволяющих «сжимать» информацию и выделять наиболее типичные, характерные для исследуемых явлений, результаты;

5) оценкой уровня связи между рассматриваемыми характеристиками (вычисление коэффициентов корреляции между ними).

Кратко рассмотрим эти методы.

Ряды распределения. Например, в результате опроса молодежи получен неупорядоченный ряд значений ответов на вопрос: «В каком возрасте Вы впервые попробовали алкоголь?»: 13, 10, 11, 13, 9, 12, 12, 15, 14, 14, 12, 10, 12 (лет). Располагая перечисленные значения в порядке возрастания исследуемого признака, получаем ранжированныйряд: 9, 10, 10, 11, 12, 12, 12, 12, 13, 13, 14, 14, 15. Очевидно, что статистический ряд, представленный в такой форме, трудно анализировать.

Удобнее представить полученную информацию в виде вариационного ряда. Для получения вариационного ряда подсчитывается повторяемость значений признака в общей совокупности ответов.

Для приводимого примера вариационный ряд выглядит следующим образом:

 

Значения признака (возраст)              
Частота              
Объем совокупности, чел.              

 

Количество повторяющихся значений в составе вариационного ряда называют его частотой. Сумма частот вариационного ряда равна общему числу наблюдений. Доля частоты некоторого значения в общем числе наблюдений называется частостью. Например, в приведенном вариационном ряду частота первого значения признака (9 лет) составляет 1, частость – 1/13 = 0,0769 или 7,69 %.

Изменения исследуемого признака могут иметь дискретный или непрерывный характер.

При дискретных изменениях отдельные значения признака отличаются друг от друга на некоторую конечную величину. В качестве примера дискретных изменений можно привести рассмотренный ранее пример опроса молодежи – интервалом изменения признака является целое число, равное 1.

При непрерывных изменениях значения признака могут отличаться друг от друга на сколь угодно малую величину. Поэтому для этих изменений частотное распределение обычно задается по интервалам – частоты определяются по ряду значений, попадающих в определенный интервал. Например, распределение респондентов по среднедушевому доходу, представленное в виде интервального вариационного ряда, выглядит следующим образом:

 

Значения признака (среднедушевого дохода), руб. до 2500 2500–4999 5000–9999 10 000 и более
Частость, % 42,4 33,1 15,1 9,4

 

Наиболее часто применяются равные интервалы, но при неравномерном распределении частот группировочного признака для выделения качественно отличных типов явлений можно применять интервалы различной величины.

Таблицы. Их применяют в целях лучшей наглядности представляемой информации и удобства сравнения показателей.

Простые таблицы представляют собой перечень отдельных значений данных с количественной (или качественной) характеристикой каждого из них в отдельности. К простым таблицам относятся и таблицы, характеризующие динамику некоторых показателей (табл. 5.1).

 

Таблица 5.1

Показатели работы отдела социальной защиты
в первом квартале года

 

Месяц Январь Февраль Март
Количество посетителей, чел      
Количество жалоб, ед.      

 

В групповых таблицах данные группируются по одному признаку. Например, опрос 38 семей показал, что на вопрос: «Сколько детей вы желаете иметь?», ответы распределились следующим образом: пять –
2 семьи, четверо – 4 семьи, трое – 5 семей, двое – 18 семей, одного –
6 семей, ни одного – 3 семьи. Эта информация может быть представлена в виде групповой таблицы (табл. 5.2).

Таблица 5.2

Распределение респондентов
по желаемому числу детей в семье

 

Варианты ответов Частота (количество семей)
Пять  
Четверо  
Трое  
Двое  
Одного  
Ни одного  

 

В комбинационных таблицах данные группируются по двум и более признакам (табл. 5.3).

Комбинационные таблицы позволяют более детально проанализировать исследуемое социальное явление. В частности, на основе информации, приводимой в табл. 5.3, можно сделать вывод, что отсутствие желания иметь детей в семье определяется, в первую очередь, не качеством жилищных условий опрошенных семей, а другими факторами. В то же время очевидна закономерность – улучшение жилищных условий семьи приводит к увеличению желаемого количества детей.

 

Таблица 5.3

Распределение респондентов
по желаемому числу детей в семье

 

Жилищные условия Варианты ответов
пять четверо трое двое одного ни одного
Отдельная квартира            
Общежитие            
Снимаемое жилье            

 

При изложении информации в табличной форме следует обращать внимание на правильность оформления. Основные требования к табличной информации:

1) таблица должна иметь нумерационный заголовок (номер таблицы – арабскими цифрами).

2) тематический заголовок, при его наличии, должен отражать ее содержание, быть кратким и точным;

3) тематический заголовок (название) следует помещать над таблицей;

4) таблицу следует располагать непосредственно после текста, в котором она упоминается впервые, или на следующей странице;

5) на все таблицы должны быть ссылки в тексте. При ссылке следует писать слово «таблица» с указанием ее номера;

6) таблицу с большим количеством строк допускается переносить на другой лист (страницу);

Графическое отображение информации. Для повышения наглядности результатов количественного анализа данных их удобно представлять в графической форме в виде различных диаграмм, гистограмм, полигонов частот дискретных рядов и т. д. (рис. 5.1).

 

Рис. 1. Конфликты в семьях,

связанные с жилищными условиями, %

 

Одномерные распределения принято изображать в виде гистограмм. Гистограмма представляет собой графическое изображение интервального ряда. По горизонтальной оси графика откладываются границы интервалов, на которых при равных интервалах строят прямоугольники с высотой, пропорциональной частотам. На рис. 5.2 представлена гистограмма, построенная по данным табл. 5.2. Если интервалы различны по величине, высота прямоугольников уменьшается или увеличивается.

Полигоны распределения представляют собой графики, построенные по точкам значений частот или частостей, соответствующих серединам интервалов интервальных рядов или значениям дискретных рядов (рис. 5.3).

 

Рис. 5.2. Гистограмма распределения респондентов
по желаемому числу детей в семье

 

Рис. 5.3. Полигон распределения респондентов
по желаемому числу детей в семье

 

Для графического изображения вариационных рядов преимущественно используют кумулятивные кривые. При их построении, как и для полигонов распределения, по оси абсцисс откладываются середины интервалов интервальных рядов или значения дискретных рядов, а по оси ординат – накопленные суммы частот или частостей (рис. 5.4).

С помощью кумуляты можно легко определять процент респондентов, находящихся ниже или выше заданной величины исследуемого признака. Например, по рис. 5.4 можно определить, что количество семей, считающих оптимальным количество детей от трех и более, составляет 29 % от общего числа опрошенных.

 

Рис. 5.4. Кумулята распределения респондентов
по желаемому числу детей в семье

 

Кривые распределения, построенные по эмпирическим данным, могут иметь разнообразную форму. Анализ формы кривых иногда позволяет оценить внутреннюю структуру исследуемых данных.

Вычисление статистических характеристик. Основными статистическими показателями, используемыми при обобщении полученных данных, являются среднее арифметическое, среднее квадратическое, дисперсия, коэффициент вариации, мода и медиана.

Наиболее часто применяют средние арифметические значения (средние величины). В зависимости от исходных данных средние арифметические значения могут рассчитываться различными способами.

Если известны значения признака у отдельных единиц совокупности, то среднее арифметическое значение можно вычислить в виде частного от деления суммы всех значений признака на число членов ряда:

 

(5.1)

 

или

(5.2)

где – среднее арифметическое; – значения данных; – количество членов ряда.

Проанализируем сведения о количестве членов семей, проживающих в городе и в сельской местности:

 

Город                                
Сельская местность                                

 

Каждый из рядов состоит из 16 членов. Среднее арифметическое значение количества членов семей, проживающих в городе и в сельской местности, рассчитанные по формулам (5.1) или (5.2), составляют 2,8 и 3,8 человек соответственно.

Если данные сгруппированы и представлены в виде вариационного ряда, необходимо рассчитывать средние взвешенные, которые вычисляются с учетом весов каждой варианты:

 

, (5.3)

 

где – среднее арифметическое; – значения вариант в -м интервале; – вес -й варианты; – количество интервалов.

Рассчитаем средний месячный доход на одного члена семьи по данным табл. 5.4. Обратите внимание, что величина интервалов различна, а середина каждого интервала вычисляется приближенно.

 

Таблица 5.4


1 | 2 | 3 | 4 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.01 сек.)