|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Глава 9. Измерение и шкалирование: методы несравнительного шкалированияПосле изучения материала этой главы вы должны уметь... 1. Дать характеристику методов несравнительного шкалирования; различать непрерывные и детализированные рейтинговые шкалы и объяснить шкалы Лайкерта, семантического дифференциала и Стэпела. 2. Комментировать решения, связанные с составлением детализированных рейтинговых шкал по числу категорий шкал, в зависимости от сбалансированности или несбалансированно- сти шкал, четности или нечетности количества категорий, принужденности или неприну- жденности выбора, степени вербального описания и вида шкалы. 3. Комментировать критерии для оценки шкалы и характеризовать способы определения на- дежности, достоверности и применимости. 4. Дать характеристику особенностей использования несравнительных шкал в международ- ных исследованиях. 5. Понимать этические аспекты разработки несравнительных шкал. 6. Обсуждать использование Internet и компьютеров при применении непрерывного и дета- лизированного рейтингового шкалирования. КРАТКИЙ ОБЗОР Как указывалось в главе 8, методы шкалирования разделяются на сравнительные и несрав- нительные. Сравнительные методы — попарного сравнения, упорядочения, постоянной сум- мы и Q-сортировки — обсуждались в предыдущей главе. В данной главе рассматривается метод несравнительного шкалирования, включающий непрерывные и детализированные рейтинго- вые шкалы, в том числе следующие известные детализированные шкалы: шкала Лайкерта, се- мантический дифференциал, шкала Стэпела. Мы рассмотрим также разработку многомерных рейтинговых шкал. Продемонстрированы техника проверки надежности и достоверности ме- тодов шкалирования, процесс выбора исследователем необходимого метода. Представлены также шкалы, полученные с помощью математических методов. Обсуждаются факторы, свя- занные с применением несравнительных шкал на международных рынках, Определен ряд эти- ческих проблем, связанных с созданием рейтинговых шкал. Глава завершается обсуждением возможностей использования Internet и компьютеров при разработке интервальных и пунк- тирных рейтинговых шкал. Глава начинается с рассмотрения некоторых примеров методов не- сравнительного шкалирования. I ПРИМЕР. Измерение эмоциональных пиков РЕАС Media Research, компания из Торонто, разработала компьютер для упрощения ре-; 1 гистрации эмоций участников фокус-группы (Program Evaluation Analysis Computer — j РЕАС). Это портативный прибор с набором клавиш или циферблатом, регистрирующим от- 338 Часть II. Разработка плана исследования веты от негативных до нейтральных и положительных. При просмотре рекламных шоу рес- понденты нажимают соответствующие клавиши. Прибор позволяет записывать непрерыв- ные и неискаженные оценки эмоциональных реакций членов фокус-группы. Прибор ис- пользовался для измерения реакций на серию рекламных роликов McDonalds, и исследова- тели обнаружили, что матери и их дочери по-разному реагировали на различные образы из рекламы. Поскольку McDonalds пытается разрабатывать ролики как "срез жизни", которые положительно воспринимаются всеми сегментами рынка, исследователи использовали РЕАС, чтобы определить, на какие сегменты влияют отдельные аспекты рекламных роли- ков. Для кампании отобрали ролики с наибольшей эмоциональной привлекательностью для большинства сегментов [ I ]. \ ПРИМЕР: Нью-йоркский транспорт Компания New York City Transit (NYCT), вопреки бытующему мнению, не имеет постоян- ных пассажиров. Многие люди, если у них есть выбор, не пользуются автобусными маршру- тами или линиями метро, входящими в состав данной компании. Для выявления способов увеличения привлекательности общественного транспорта маркетологи провели специаль- ное исследование. При проведении телефонного опроса респондентов просили оценить различные аспекты данной системы общественного транспорта по пятибалльной шкале Лайкерта. Ее выбрали благодаря легкости применения при телефонных опросах и возможности респондентов дос- таточно просто оценивать степень своего согласия (1 — абсолютно не согласен, 5 — полно- стью согласен). Результаты показали, что личная безопасность имеет наибольшее значение при исполь- зовании метро. Жители Нью-Йорка боялись использовать станции метро, находящиеся по соседству. Особенно пассажиров волновал недостаток средств связи с персоналом или поли- цией при возникновении проблем. NYCT отреагировала на запросы пассажиров усилением полицейской охраны, созданием отличительных знаков сотрудников NYCT, увеличением освещенности, изменением расположения стен, колонн и лестниц для улучшения видимо- сти на станциях. Телефонные исследования также показали, что чистота станций метро и вагонов напря- мую связана с ощущением безопасности. В ответ NYCT увеличила усилия по поддержанию чистоты. Бездомных и нищих у входа в метро и на станциях попросили уйти, в некоторых случаях их отправили в специальные приюты. Мероприятия, проведенные по результатам маркетинговых исследований, помогли NYCT улучшить отношение к общественному транспорту. Увеличение числа пассажиров в течение пятилетнего периода также является следствием этих усилий [2]. ПРИМЕР. Супермаркеты В исследовании сферы услуг, проведенном Gallup Organization, участников попросили по десятибалльной шкале Лайкерта оценить качество предлагаемых услуг. 1 означает наихуд- шее, а 10— наилучшее качество. Примерно половина респондентов оценили супермаркеты восьмеркой и более высоким баллом. Хорошую оценку получила также работа ресторанов и банков. Гостиницы, универмаги, страховые компании, фирмы по ремонту автомобилей и авиалинии оказались в середине рейтинга. Наихудшие оценки получили местные админи- страции, общественный транспорт и услуги, связанные с недвижимостью. Следовательно, согласно общественному мнению, местные администрации, общественный транспорт и агентства по недвижимости должны улучшить качество представляемых услуг для избирате- лей и покупателей [3]. Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 339 Пример РЕАС иллюстрирует измерение эмоций с помощью непрерывной рейтинговой шкалы, в исследованиях NYCT и Gallup для измерения ощущений применяется детализиро- ванная рейтинговая шкала. МЕТОДЫ НЕСРАВНИТЕЛЬНОГО ШКАЛИРОВАНИЯ Несравнительное шкалирование (noncomparative scale) Один из методов шкалирования, когда рассматриваемый объект оценивается независимо от других объектов в исследуемой группе. При использовании несравнительных шкал {noncomparative scale) респонденты применяют любые стандарты оценки, с их точки зрения наиболее подходящие. Они не сравнивают оцени- ваемый объект ни с каким другим объектом или определенным стандартом, например "идеальной торговой маркой". Респонденты оценивают отдельный объект, и поэтому несрав- нительные шкалы еще иногда называют монадическими, или однопредметньши (monadic). Не- сравнительные методы включают непрерывные (или графические) и детализированные рей- тинговые шкалы, представленные в табл. 9.1 и обсуждаемые в этой главе. НЕПРЕРЫВНАЯ РЕЙТИНГОВАЯ ШКАЛА При использовании непрерывной рейтинговой шкалы (continuous rating scale), называемой также графической шкалой, респонденты оценивают объекты, ставя отметки в соответствующей точке отрезка, соединяющего крайние значения критерия. Таким образом респондентов не ог- раничивают в выборе оценок из используемых исследователем. Непрерывная рейтинговая шкала (continuous rating scale) При использовании данной измерительной шкалы респонденты оценивают объекты, ставя отметки в соответствующей точке отрезка, соединяющего крайние значения критерия. Шка- ла может иметь различные формы. Таблица 9.1. Основные виды несравнительных шкал Шкала Основные характеристики Примеры Преимущества Недостатки Отметки на непрерывной линии Непрерывная рейтинговая шкала Детализированные рейтинговые шкалы Шкала Лайкер- Степень согласия от 1 та (абсолютно не согласен) до 5 (полностью согласен) Семантический Семибалльная шкала с би- дифференциал полярными метками Шкала Стэпела Униполярная десятибалль- ная шкала без точки нача- ла отсчета Реакция на телеви- Легко составляются Сложность подсчета бал- зионные рекламные лов без компьютера ролики Измерение отноше- Легко составляют- Занимает больше времени ний ся, обрабатываются и понимаются Имидж компании, Гибкость Может дать противоречи- марки, продукта вые данные в случае ис- пользования интервальных данных Измерение отноше- Легко составляют- Запутана и сложна в при- ний и образов ся, осуществляются менении по телефону Форма непрерывной шкалы может существенно изменяться. Например, линия может быть вертикальной или горизонтальной; баллы — в форме чисел или коротких характеристик; при 340 Часть II. Разработка плана исследования использовании чисел для оценки допустимы много или несколько баллов. Рассмотрим три ви- да непрерывных рейтинговых шкал. После оценки респондента исследователь разделяет линию на любое количество категорий и присваивает баллы в зависимости от той категории, куда попала отметка оценки. В примере с исследовательским проектом "Выбор универмага" респондент выражает негативное отношение к Sears. Эти данные обычно рассматриваются как интервальные. СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА Непрерывные рейтинговые шкалы Как бы Вы оценили универмаг Sears i Вариант I Вероятно наихудший I Вариант 2 Вероятно наихудший 1 Вариант 3 Очень плохой Средний Очень хороший Вероятно наихудший -- —I— —Вероятно наилучший О 10 20 30 40 50 60 70 80 -Вероятно наилучший -Вероятно наилучший Врезка 9.1. Практика маркетинговых исследований Система RATE Сравнительно новым инструментом исследования является анализатор восприятия, позволяющий осуществлять немедленную оценку "непосредственной реакции". Группе из 400 респондентов представляют рекламные телевизионные и радиоролики. Измерительный прибор состоит из шкалы со ста делениями. Такая шкала выдается каждому участнику, и он должен постоянно вводить свою реакцию на тестируемый материал. Когда опрашиваемый отмечает деление на шкале, информация передается на компьютер, сводящий ежесекундно поступающие данные по реакциям в графики. Одновременно с поступлением на компьютер данные выводятся на монитор, позволяя исследователю сразу увидеть реакцию респонден- тов. Данные также записываются в отдельный файл для последующего анализа. Полученные оценки можно сгруппировать по категориям, таким как возраст, доход, пол или использо- вание продукта. Преимущество непрерывных шкал — легкость их построения [4]. Однако расчеты по ним громоздки и ненадежны. Более того, непрерывные шкалы дают ограниченное количество но- вой информации. Поэтому их использование в маркетинговых исследованиях ограничено. Однако в последнее время с ростом популярности личного опроса с помощью компьютера и других технологий непрерывные шкалы стали использоваться чаще, как описано во врезке 9.1. "Практика маркетинговых исследований" [5]. ДЕТАЛИЗИРОВАННЫЕ РЕЙТИНГОВЫЕ ШКАЛЫ Детализированная рейтинговая шкала (itemized rating scale) Измерительная шкала, содержащая числа и/или краткое описание, связанное с каждой ка- тегорией отношения к объекту исследования. Расположение категорий на шкале определен- ным образом упорядочено. Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 341 При использовании детализированной рейтинговой шкалы (itemized rating scales) респонден- там предлагается шкала, на которой отмечены числа или краткие описания, связанные с опре- деленной категорией отношения к объекту исследования, Категории определенным образом расположены по шкале; респондентов просят выбрать отдельную категорию, наилучшим об- разом описывающую оцениваемый объект. Детализированные рейтинговые шкалы широко используются в маркетинговых исследованиях и формируют основные компоненты более сложных шкал, таких как многомерные рейтинговые шкалы. Ниже описываются наиболее распространенные детализированные рейтинговые шкалы: шкала Лайкерта, семантический дифференциал, шкала Стэпела, а затем рассматриваются основные сопутствующие проблемы, связанные с использованием детализированных рейтинговых шкал. Шкала Лайкерта Названная в честь своего разработчика, Ренсиса Лайкерта (Rensis Likert), шкала Лайкерта (Likert scale) широко распространена. При ее применении от респондентов требуется опреде- лить степень согласия или несогласия для каждого набора утверждений о рассматриваемых объектах [6]. Обычно каждый пункт шкалы имеет пять категорий для ответа от "абсолютного несогласия" до "полного согласия". В контексте исследовательского проекта "Выбор универ- мага" проиллюстрировано применение шкалы Лайкерта для оценки отношения к Sears. Для проведения анализа каждому утверждению присваивается количество баллов от —2 до +2, или от 1 до 5. Анализируются оценки по отдельным пунктам (профильный анализ) или общая (итоговая) оценка, рассчитанная для каждого респондента суммированием оценок по отдельным пунктам. Предположим, что в примере с универмагом шкала Лайкерта использует- ся для измерения отношения покупателей к Sears и J.C.Penney. В рамках профильного анализа сравнивается два магазина по средним оценкам респодентов для каждого пункта, такого как качество товаров, торговое обслуживание и ассортимент. Методика итоговой оценки наиболее распространена, поэтому шкалу Лайкерта часто называют итоговой шкалой (summated scale) [7]. При этом подходе для определения общего количества баллов, постааченного каждым респон- дентом для каждого магазина, важно использовать последовательную процедуру оценки, чтобы высокий (или низкий) балл последовательно соответствовал благоприятному ответу. Для этого присваиваемые отрицательным ответам баллы должны подсчитываться после "переворачива- ния" шкалы. Необходимо отметить, что при отрицательном утверждении согласие отражает неблагоприятный ответ, а при позитивном — благоприятный. Соответственно "полному со- гласию" с положительным утверждением и "полному несогласию" с негативным утверждени- ем присваивается по пять баллов [8]. В представленной ниже шкале, при условии, что большее количество баллов свидетельствует о более благоприятном отношении респондентов к объекту исследования, баллы, поставленные за вопросы 2, 4, 5 и 7, должны трансформироваться в про- тивоположные. Респондент в примере со сквозным проектом проставил всего 22 балла. Под- считывается общее количество баллов, проставленных каждым респондентом каждому уни- вермагу. Респондент наиболее благоприятно относится к универмагу, набравшему наибольшее количество баллов. Процедура разработки итоговых шкал Лайкерта описывается в разделе, по- священном многомерным шкалам. СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА (Шкала Лайкерта , Инструкция I Ниже перечислены различные мнения о Sears. Определите, пожалуйста, насколько вы со- I гласны или не согласны с каждым из них, используя следующую шкалу: I 1 — абсолютно не согласен I 2 — не согласен | 3 — затрудняюсь ответить I 4 — согласен I 5 — полностью согласен 342 Часть II. Разработка плана исследования Абсолютно Несогласен Затрудняюсь Согласен. Полностью не согласен ответить согласен 1. Sears продает товары 1 2Х 3 4 5 высокого качества 2. В Sears плохое торге- 1 2Х 3 4 ') вое обслуживание 3. Мне нравится делать 1 2 ЗХ 4 5 покупки в Sears 4. В Sears ограничен- 1 2 3 4Х 5 ный ассортимент това- ров по отдельным кате- гориям 5. Кредитная политика 1 2 3 4Х 5 Sears ужасна 6. Sears — место, где IX 2 3 4 5 американцы делают покупки 7. Мне не нравится 1 2 3 4Х 5 реклама Sears 8. Sears предлагает ши- 1 2 3 4Х 5 рокий ассортимент продукции 9. Sears устанавливает 1 2Х 3 4 5 разумные цены Шкала Лайкерта имеет несколько преимуществ. Ее легко составлять и использовать. Рес- понденты быстро схватывают принцип ее заполнения, что позволяет использовать ее по поч- те, телефону или при личных опросах. Основной недостатк данной шкалы — больший про- межуток времени, требуемый для ее заполнения, по сравнению с другими детализирован- ными шкалами, поскольку респондентам приходится читать каждое утверждение. Следующий пример демонстрирует другой способ применения шкалы Лайкерта в маркетин- говом исследовании. ПРИМЕР. Удовлетворенность работой В ходе маркетингового исследования проверялась гипотеза о том, что внутреннее удовлетворение от работы, получаемое продавцами, имеет положительную корреляцию со временем, в течение которого они работают в компании. Внутреннее удовлетворение от работы измерялось по стандартной шкале Лайкерта [9]. Рассмотрим один из пунктов из- мерения этого удовлетворения. Абсолютно Несогласен Затрудняюсь Согласен Полностью не согласен ответить согласен Во время работы у меня | возникает чувство дос- 1 2 3 4 5 ! тижения цели 1 Полученные эмпирические данные подтвердили гипотезу. Был сделан вывод, что ме- неджеры по продажам должны уделять больше внимания процессу подбора, тренировки и поощрения продавцов для увеличения внутренней удовлетворенности от исполняемой ра- i боты и, следовательно, уменьшения текучести кадров. Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 343 Семантический дифференциал Семантический дифференциал, семантическая дифференциальная шкала (semantic differencial) Семибалльная ш<ала с противоположными отметками в крайних точках. Семантическая дифференциальная шкала, или семантический дифференциал (semantic differential)— семибалльная шкала с крайними точками, являющимися противоположными отметками. Как правило, респонденты оценивают объекты по нескольким пунктам с помощью семибалльных шкал, ограниченных по краям противоположными прилагательными, такими как "холодный" или "теплый" [10]. Применение этой шкалы иллюстрирует пример оценки респондентами Sears по пяти характеристикам. СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА (Семантический дифференциал Инструкция \ Эта часть исследования определяет значение каждого универмага для вас их оценкой с по- ! мощью рядов шкал, ограниченных противоположными прилагательными. Используя знак "X", обозначьте то место на шкале между противоположными по значению прилагательны- | ми, которое наилучшим образом описывает ваше мнение о магазине. Пожалуйста, сделайте отметки на каждой шкале, не пропуская ни одной. Форма Sears это: Мощный:-:-:-;-:Х:-:-: Слабый Ненадежный:-:-:-:-:-:Х:-: Надежный Современный:-:-:-:-:-:-:Х: Старомодный I Холодный;-:-:-:-:-;Х:-: Теплый ! Заботливый:-:Х:-:-:-:-:-: Безразличный Респонденты делают отметки на шкале в тех местах, которые лучше всего отражают их мне- ние об оцениваемом объекте [11]. Таким образом, в нашем примере Sears был оценен как сла- бый, надежный, очень старомодный, теплый и заботливый. Негативное прилагательное или фраза могут стоять как справа, так и слева шкалы. Это позволяет контролировать склонность некоторых опрашиваемых, относящихся слишком позитивно или негативно к рассматривае- мому объекту, ставить отметки только с правой или левой стороны без чтения описаний к пунктам. Ранее автор описал методы выбора категорий шкалы и составление семантической дифференциальной шкалы. На основе этого материала автор разработал семантическую диф- ференциальную шкалу для измерения представлений о людях и продуктах (врезка 9.2. "Практика маркетинговых исследований"). [12] Отдельные пункты семантического дифференциала могут принимать значения от —3 до +3 или от 1 до 7. Полученные данные обычно анализируются с помощью профильного ана- лиза, когда для каждой рейтинговой шкалы рассчитываются средние или медианные значе- ния и затем сравниваются с помощью построения графиков или статистического анализа. Это помогает определять общие черты различия и сходства объектов. Для оценки различий между сегментами респондентов исследователь сравнивает средние ответы различных сег- ментов. Хотя среднее значение часто используется как итоговое, вопрос обработки получен- ных данных как интервальных значений, остается дискуссионным [13]. С другой стороны, в тех случаях, когда исследователю необходимо сделать общее сравнение объектов, например при определении предпочтений магазинов, баллы по отдельным пунктам суммируются для получения общей оценки объекта. 344 Часть II. Разработка плана исследования Врезка 9.2. Практика маркетинговых исследований Семантическая дифференциальная шкала для 1. Грубый:-:-:-:-:-:-:-: 2. Восхищающий х-:-:-:-:-:-: 3. Неудобный:-:-:-:-:-:-:-: 4. Доминирующий:-:-:-:-:-:-:-: 5. Бережливый I-:-:-;-:-:-:-: 6. Приятный:-:-:-;-:-:-:-: 7. Современный:-:-:-:-:-:->: 8. Организованный:-:-:-:-:-:-:-: 9. Рациональный:-:-:-:-:-:-:-: 10. Ранний:-:-:-:-:-:-:-: 11. Формальный:-:-:-:-:-:-:-; 12. Консервативный;-:-:-:-:-:-:-: 13. Комплексный:-:-:-:-:->:-: 14. Бесцветный:-»:-:-:-:-: 15. Скромный >:-:-:-:-:-:-: измерения представлений о людях и продуктах Утонченный Спокойный Удобный Второстепенный Расточительный Неприятный Несовременный Неорганизованный Эмоциональный Зрелый Неформальный Либеральный Простой Красочный Тщеславный Универсальность семантической дифференциальной шкалы сделала ее очень популяр- ной в маркетинговых исследованиях. Она широко используется для сравнения торговых ма- рок, продуктов, имиджа компаний, используется для разработки стратегий рекламы и про- движения, а также для разработки новых видов продуктов [14]. Существует несколько видов основной шкалы. Шкала Стэпела Шкала Стэпела (Stapel scale), названная именем ее создателя (Jan Stapel), исключительно по- пулярная десятибалльная шкала, использующая значения от —5 до 5 без нейтральной (нулевой) точки [15]. Шкала обычно изображается вертикально. Респондентов просят определить, насколь- ко верно или неверно каждый термин описывает объект, выбирая соответствующее число на шка- ле ответов. Чем выше число, тем ближе термин по описанию к объекту, как это показано в приме- ре "Выбор универмага". В этом примере Sears оценивается как магазин, предлагающий товары не очень высокого качества с посредственным торговым обслуживанием. Шкала Стэпела (Stapel scale) Шкала, предназначенная для измерения отношений и состоящая из одной характеристики в середине шкалы с диапазоном противоположных числовых значений. СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА Инструкция Пожалуйста, оцените, насколько точно каждое слово или фраза описывает каждый универ- маг. Выберите одно из положительных чисел, если вы считаете, что фраза довольно точно описывает магазин. Чем точнее, по вашему мнению, фраза описывает магазин, тем большее положительное число вы должны выбрать. Выбирайте отрицательные числа для оценки фраз, неправильно, по вашему мнению, описывающих универмаги. Чем менее точно фраза Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 345 описывает магазин, тем меньшее число вам следует выбрать. Вы можете выбирать любое число от +5, если фраза наиболее точно описывает магазин, до -5, если фраза описывает ма- газин абсолютно неточно. Форма Sears +5 +5 +4 +4 +3 +3 +2 +2 +1 +1 Высокое качество Плохой сервис _] _1 -2 -2 -3 -3 -4 -4 -5 -5 Данные, полученные с помощью шкалы Стэпела, анализируются аналогично данным се- мантической дифференциальной шкалы. Преимущество шкалы Стэпела в том. что нет необхо- димости предварительно тестировать прилагательные или фразы для подтверждения их бипо- лярности. Шкала может использоваться и при телефонных опросах. Однако, по мнению неко- торых исследователей, шкала Стэпела довольно запутана и трудна в применении. Из трех детализированных рейтинговых шкал шкала Стэпела используется реже всего. В то же время данная шкала заслуживает большего внимания, поскольку ее недостатки преувеличены [16]. ПРОБЛЕМЫ РАЗРАБОТКИ НЕСРАВНИТЕЛЬНЫХ ДЕТАЛИЗИРОВАННЫХ РЕЙТИНГОВЫХ ШКАЛ Из вышеизложенного материала можно сделать вывод, что несравнительные детализиро- ванные рейтинговые шкалы необязательно должны использоваться в формате, установленном раз и навсегда, напротив, они могут принимать много различных форм. При составлении шкал такого вида исследователь должен ответить на следующие основные вопросы. 1. Количество используемых в шкале категорий. 2. Сбалансированность или несбалансированность шкалы. 3. Четное или нечетное количество категорий. 4. Допустимость неопределенного ответа. 5. Характер и степень вербального описания. 6. Формат шкалы, Количество категорий в шкале При выборе количества категорий шкалы принимаются во внимание два противоречивых фактора. Чем больше количество категорий в шкале, тем больше степень дифферениируемости между объектами. С другой стороны, большинство респондентов способны справиться всего с несколькими категориями при опросе. Традиционно считается, что количество категорий должно равняться семи, плюс-минус две: между пятью и девятью [17]. Хотя следует отметить, что не существует единственного оптимального числа категорий. В каждом случае при выборе их количества нужно принимать во внимание целый ряд различных факторов. 346 Часть II. Разработка плана исследования Если респонденты заинтересованы в процессе оценки и достаточно осведомлены об объекте оценки, то можно применять больше категорий. С другой стороны, если респонденты не очень осведомлены о характеристиках объекта или не заинтересованы в выполнении задания, следует использовать меньшее количество категорий. Важна также природа рассматриваемых объектов. Для некоторых объектов невозможно выделить много характеристик, поэтому более эффектив- ным будет небольшое количество категорий. Другой важный фактор — способ сбора данных. При использовании телефонных интервью слишком много категорий приводят опрашиваемых в замешательство. Ограничения в размерах анкеты могут ограничивать количество категорий при проведении почтовых опросов. Методы анализа данных также влияют на выбор количества категорий. В случаях, когда не- сколько пунктов шкалы суммируются для получения общего балла для каждого респондента, лучше всего использовать пять категорий. Этот же принцип используется и при необходимости масштабных обобщений или сравнений групп. Если существует заинтересованность в индиви- дуальных ответах или данные анализируются с помощью сложных статистических методик, следует использовать семь и больше категорий. Величина коэффициента корреляции и обще- принятая мера связи между переменными (глава 17) зависят от количества категорий. Коэф- фициент корреляции уменьшается с уменьшением числа категорий. Это, в свою очередь, влия- ет на весь статистический анализ, базирующийся на коэффициенте корреляции [18]. Сбалансированность или несбалансированность шкалы В сбалансированной шкале (balanced scale) количество благоприятных и неблагоприятных категорий одинаково; в несбалансированной шкале их количество различно [19]. Примеры сбалансированной и несбалансированной шкал показаны на рис. 9.1. В общем, для получения объективных данных шкалы должны быть сбалансированы. Однако, если велика вероятность смешения распределения в положительную или отрицательную сторону, для исследования больше подходит шкала с большим числом категорий в сторону предполагаемого смещения. При использовании несбалансированной шкалы сущность и степень несбалансированности должны приниматься во внимание при анализе данных. Сбалансированная шкала (balanced scale) Шкала с равным количеством благоприятных и неблагоприятных категорий. Сбалансированная шкала Несбалансированная шкала Косметическое средство Косметическое средство Jovan Musk for Men Jovan Musk for Men Превосходное Превосходное Очень хорошее Очень хорошее Хорошее Довольно хорошее Плохое Хорошее Очень плохое Очень плохое Одно их худших Плохое Рис, 9.1. Сбалансированные и несбалансированные шкалы Четное или нечетное количество категорий При нечетном количестве категорий центральное положение в шкале отображает нейтраль- ность характеристики или безразличие респондента. Наличие, обозначение и размещение ней- Глава 9, Измерение и шкалирование: методы несравнительного шкалирования 347 тральной категории может существенно влиять на ответ. Шкала Лайкерта, например, сбалан- сирована, имеет нечетное количество категорий и нейтральную категорию [20]. Использование шкалы с четным или нечетным количеством категорий зависит также от возможности нейтрального отношения респондента к отдельному пункту опроса. Если воз- можно нейтральное или безразличное отношение по крайней мере одного респондента, следует использовать шкалу с нечетным количеством категорий. Если, с другой стороны, исследователь хочет заставить респондента выразить отрицательное либо положительное мнение или сам со- ставитель опроса убежден, что по данному вопросу не может быть нейтрального мнения, то лучше применять шкалу с четным количеством категорий. Вопрос о целесообразности давле- ния на опрашиваемого остается открытым. Шкалы с обязательными и добровольными ответами Рейтинговая шкала с обязательными ответами (forced rating scale) Шкала, принуждающая респондента выразить определенное мнение, так как пункты "не оп- ределился" и "не знаю" отсутствуют. При использовании рейтинговых шкал с обязательными ответами (forced rating scale) рес- понденты обязательно должны выражать свое мнение, так как ответ "не определился" отсутст- вует, В этом случае респонденты, не имеющие определенного мнения, могут сделать отметку в середине шкалы. Если существенная часть респондентов не имеют определенного мнения по заданной теме, большое количество серединных оценок исказит измерение общей тенденции и вариации. В ситуациях, когда респонденты могут не выражать определенного мнения, напри- мер, просто сопротивляясь принудительности ответа, точность данных можно улучшить с по- мощью шкалы с добровольными ответами, включающей категорию "не определился" [21]. Характер и степень вербального описания Характер и степень вербального описания, используемые для обозначения категорий шка- лы, могут значительно повлиять на ответы. Категории шкалы могут иметь вербальные, число- вые или даже графические описания. Кроме того, исследователь должен определить, выделять отметками каждую категорию шкалы, только некоторые категории или отмечать только край- ние точки. Удивительно, но словесное описание каждой категории шкалы может не увеличить точности или надежности данных. Аргументом в пользу большого числа отметок или разметки всех категорий может служить уменьшаемая в этом случае неопределенность шкалы. Описания категорий должны размешаться как можно ближе к категориям ответов. Сила характеристик, используемых в шкале, может повлиять на распределение ответов. При сильном акцентировании на негативном или позитивном отношении (I — абсолютно не согласен, 7 — полностью согласен), респонденты склонны реже выражать свое мнения через крайние точки шкалы. Это приводит к менее вариативному и более компактному распределе- нию ответов. Слабые акценты (1 — в общем согласен, 7 — в общем не согласен), напротив, дают более равномерное и рассеянное распределение. Для получения сбалансированных или равных интервальных шкал разработаны специальные процедуры присвоения количественных значе- ний категориальным описаниям [22]. Форма шкалы Существует несколько вариантов формы шкал. Шкалы можно представлять вертикально или горизонтально. Категории могут отображаться прямоугольниками, размечаться линиями или делениями на последовательном ряде, иметь или не иметь числовых значений. Исполь- зуемые числовые значения могут быть положительными, отрицательными или и теми, и дру- гими. Некоторые возможные конфигурации шкал представлены на рис. 9.2. 348 Часть II. Разработка плана исследования Для оценки мягкости моющего средства Cheer могут быть использованы различные шка- лы. Далее представлены некоторые примеры; 1. 2. 3. 4. 5. Моющее средство Cheer. Очень жесткое Очень жесткое! 2 D Очень жесткое D П D Ни жесткое, ни мягкое а а D Очень мягкое Очень же- Жесткое Немного сткое жесткое -3 -2 -1 Очень же- сткое Очень мягкое 3 4 5 6 7 Очень мягкое Ни жесткое, Немного Мягкое Очень мягкое ни мягкое мягкое 0 +1 +2 +3 Ни жесткое, Очень мягкое ни мягкое Рис. 9.2. Формы рейтинговых шкал Шкала термометра и шкала выражения лица — две уникальные в своем роде шкалы, при- меняемые в маркетинговых исследованиях. При использовании шкалы термометра чем выше температура, тем более положительную оценку она означает, Точно так же и улыбающиеся ро- жицы отражают позитивное отношение. Эти шкалы особенно полезны при опросе детей [23]. Примеры данных шкал приведены на рис. 9.3, в табл. 9.2 обобщен процесс принятия шести решений, необходимых для составления рейтинговой шкалы. Таблица 9.2. Процесс принятия решения при составлении детализированной рейтинго- вой шкалы 1. Число категорий Хотя не существует единственного оптимального числа, наиболее распространено количество от пяти до девяти категорий 2. Сбалансирован-ность и не- В общем, для получения объективных данных необходимо сбалансировать шкалу сбалансированность 3. Четное или нечетное число Если возможен нейтральный или безразличный ответ по крайней мере от некоторых категорий респондентов, следует использовать нечетное количество категорий 4. Обязательность выражения В ситуациях, когда от респондентов не ожидается ответа на определенный вопрос, определенного мнения точность данных можно улучшить, используя шкалу с неопределенными ответами 5. Вербальное описание Существует ряд причин для разметки всех или большинства категорий. Описания ка- тегорий нужно как можно ближе располагать к категориям ответов 6. Форма Следует протестировать несколько вариантов, чтобы выбрать наилучший Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 349 Шкала термометра Инструкция Пожалуйста, определите, насколько вам нравятся гамбургеры McDonald's, закрашивая изо- бражение термометра шариковой ручкой. Начните снизу и закрашивайте до отметки, которая наилучшим образом отражает ваше отношение к гамбургерам McDonald's Форма Очень нравятся Совсем не нравятся Шкала "выражениелица" Инструкция Пожалуйста, определите, насколько вам нравится кукла Barbie, указав выражение лица, которое наилучшим образом отражает ваше отношение. Если кукла вам не нравится, выберите выраже- ние лица 1. Если она вам очень нравится, выберите выражение лица под номером 5. Форма Рис. 9.3. Некоторые особенные формы рейтинговых шкал Многомерные шкалы Разработка многомерных шкал требует специальной подготовки [24]. На рис. 9.4 изображен алгоритм для построения многомерных шкал. Измеряемая характеристика часто называется кон- струкцией (construct). Разработка шкалы начинается с теоретического представления о том, что со- бой представляет данная конструкция, что необходимо не только для составления шкалы, но и для интерпретации результатов. Следующий шаг заключается в предложении маркетологом пер- воначального варианта всех возможных пунктов шкалы. Обычно это делается на базе теоретиче- ских положений, анализа вторичных данных и результатов качественного исследования. Из этого "котла" маркетолог отбирает ограниченное количество потенциальных пунктов шкалы. Для отбо- ра используется определенный качественный критерий. Количество пунктов все еще достаточно велико для составления шкалы. Поэтому в дальнейшем их количество уменьшается. Затем проводится сбор информации из достаточно большой предварительной выборки рес- пондентов с использованием шкалы с сокращенным числом пунктов. Данные анализируются с помощью таких методов, как корреляция, факторный анализ, кластерный анализ, дискрими- нантный анализ и статистические критерии, обсуждаемые в этой книге. По результатам этого статистического анализа устраняются еще несколько пунктов, после чего остаются пункты, не- посредственно используемые при составлении шкалы (в следующем разделе). На основе этих оценок разрабатывается окончательный набор пунктов шкалы. Как видно из рис. 9.4, процесс разработки содержит последовательность действий, отдельные элементы которой повторяются несколько раз [25]. 350 Часть II. Разработка плана исследования Общий исходный набор элементов; теория, вторичные данные, качественное исследование Выберите ограниченный набор измеряемых характеристик, исходя из результатов качественного анализа Разработайте окончательный вариант шкалы Оцените надежность, достоверность и применимость шкалы Подготовьте окончательный вариант шкалы Рис. 9.4, Разработка многомерной шкалы Ниже представлен пример шкалы, разработанной для промышленного маркетингового ис- следования. РРИМЕР. Технические параметры продуктовой линии Приведенная многомерная шкала измеряет техническую сложность продуктовой линии (26]. 1. Технически сложная 2. Низкий уровень ин- женерной разработки 3. Быстро изменяющаяся 1 4. Несложная 5. Массовая ! ! ! < -1 Технически несложная Высокий уровень инже- нерной разработки Медленно изменяющаяся Сложная Единичная Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 351 6. Уникальная 7. Сложная 1 2 3 4 5 6 7 Распространенная 1 2 3 4 5 6 7 Простая Пункты 1, 3, 6 и 7 при подсчете баллов переворачиваются. Шкала применяется в про- мышленном маркетинге для измерения технической сложности продуктовых линий и предлагает возможные варианты улучшения ее технических характеристик. Оценка шкалы При использовании многомерной шкалы нужно проверить ее точность и примени- мость [27]. Как показано на рис. 9,5, этот процесс включает оценку надежности, достоверности и обобщенности шкалы. Среди различных подходов к оценке надежности отметим следующие: двойное тестирование, проверка надежности с помощью альтернативных форм и проверка внутренней согласованности. Достоверность можно оценить через рассмотрение достоверности содержания, достоверности критерия и конструкции. Конвергенция Рис. 9.5. Оценка шкалы Дискриминант Номологичность Перед оценкой надежности и достоверности следует рассмотреть точность измерения как основу оценки шкалы. Точность измерения Ошибка измерения (measurement error) Отклонение информации, которую ищет маркетолог, от информации, получаемой с помо- щью заданного процесса измерения. Модель истинной оценки (true score model) Математическая модель, дающая представление о точности измерений. Как уже указывалось в главе 8, измеряя некий объект, мы с помошью чисел (показателей) определяем его отдельные характеристики. Показатель является не истинным значением ха- 352 Часть II. Разработка плана исследования рактеристики, а результатом наблюдения. Действие различных факторов может вызвать ошибку измерения (measurement error), которая проявляется в отклонении показателя, т.е. полученного значения характеристики, от ее истинного значения (рис. 9.6). Модель истинной оценки (true score model) содержит основы для понимания точности измерения. Согласно этой модели, X0=XT+Xs+XRTj& XQ__ измеренное фактическое значение Хт_ истинное значение характеристики AV_ систематическая ошибка XR_ случайная ошибка Систематическая ошибка (systematic error) Систематическая ошибка постоянно влияет на измерение, отображает действие стабильных факторов, влияющих на полученный результат при каждом отдельном измерении. Случайная ошибка (random error) Ошибка измерения, появляющаяся вследствие случайных изменений или различий между респондентами или условиями, в которых проводится опрос. Примечательно, что общая ошибка измерения включает систематическую ошибку (systematic error) — Xs_ и случайную ошибку — Х„. Влияние систематической ошибки на про- цесс измерения носит постоянный характер. Она отображает действие стабильных факторов, влияющих на полученный результат при каждом отдельном измерении, например механиче- ские факторы (рис. 9.6). Случайная ошибка (random variable), напротив, непостоянна. Она ото- бражает действие временных факторов, их разному влиянию на результат при каждом отдель- ном измерении. К таким факторам относятся индивидуальные и ситуационные факторы. Раз- граничение между систематической и случайной ошибкой очень важно для понимания надежности и достоверности. 1. Относительно стабильные характеристики индивида, влияющие на оценку при тесте, как, например, интеллект, уровень образования, 2. Краткосрочные или временные факторы, такие как здоровье, эмоции, усталость 3. Ситуационные факторы, такие как присутствие других людей, шум и факторы, отвле- кающие внимание. 4. Набор пунктов шкалы: добавление, удаление или изменения в пунктах шкалы, 5. Неясность шкалы, инструкций или самих пунктов. 6. Механические факторы, такие как плохое качество печати, перенасыщенность пунктами в анкете, плохой дизайн. 7. Различия между интервьюерами. Рис. 9.6. Потенциальные источники ошибки в измерении Надежность Надежность (reliability) характеризуется тем, насколько устойчивые результаты дает приме- нение шкалы при повторных измерениях [28]. Систематические источники ошибок не влияют на надежность, они постоянно воздействуют на измерение и не приводят к противоречивости ее результатов. Случайная ошибка, напротив, может приводить к противоречивым результатам и соответственно — к уменьшению надежности. Надежность, таким образом, можно опреде- лить как степень отсутствия при измерении случайной ошибки — Хк. Если XR = 0, измерение абсолютно надежное. Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 353 Надежность (reliability) Насколько применение шкалы дает согласующиеся результаты при повторных измерениях характеристик объекта. Надежность оценивается определением доли систематической вариации в шкале. Это осу- ществляется установлением связи между оценками, полученными при использовании различ- ных методик расчета. Если связь достаточно сильна, шкала дает согласующиеся и, следователь- но, достаточно надежные результаты. К методам оценки надежности относятся повторное тес- тирование, метод альтернативных форм и внутренней согласованности. Повторное тестирование надежности (test-retest reliability) Метод оценки надежности, при котором идентичные опросы при как можно более сходных условиях проводятся дважды. Повторное тестирование надежности. При повторном тестировании надежности (testretest reliability) опрос респондентов проводится дважды с помощью двух идентичных шкал и при как можно более сходных условиях. Интервал между тестированиями обычно составляет от двух до четырех недель. Степень схожести результатов двух измерений определяется ко- эффициентом корреляции (подробности — в главе 17). Чем выше коэффициент корреля- ции, тем выше надежность. С определением надежности при применении метода повторного тестирования связано не- сколько проблем. Во-первых, данный метод сильно зависит от промежутка времени между тес- тированиями. При прочих равных условиях, чем дольше интервал, тем ниже надежность. Во- вторых, первоначальное измерение может изменить рассматриваемые характеристики. Напри- мер, измерение отношений респондентов к молоку с низкой жирностью может заставить оп- рашиваемых задуматься о его полезности для здоровья и в результате привести к повышению оценки данного продукта. В-третьих, иногда невозможно провести повторное тестирование (например, при измерении первоначальной реакции на новый продукт). В-четвертых, первое измерение может иметь эффект автоматического переноса высказанного мнения на второе и последующие измерения. В-пятых, измеряемые характеристики могут изменяться за промежу- ток времени между опросами. Например, благоприятная информация об объекте может улуч- шить отношение к объекту. Наконец, коэффициент корреляции может быть завышен из-за ав- токорреляции отдельных пунктов шкалы. Из-за перечисленных выше недостатков метод двойного тестирования применяется в соче- тании с другими подходами, одним из них которых является метод альтернативных форм [29]. Проверка надежности с помощью альтернативных форм (alternative-forms reliability) Метод проверки надежности, при котором составляются две формы шкалы, эквивалентные по своей сути, а затем одна и та же группа респондентов опрашивается дважды. Проверка надежности с помощью альтернативных форм. При проверке надежности с помо- щью альтернативных форм (alternative-forms reliability) составляются две эквивалентные по сути формы шкалы. Одни и те же респонденты опрашиваются дважды, обычно с перерывом от двух до четырех недель. Для проверки надежности рассчитывается корреляция между результатами по двум шкалам [30|. С данным подходом связано две основные проблемы. Во-первых, составление двух шкал отнимает достаточно много времени и требует дополнительных финансовых ресурсов. Во- вторых, существуют сложности с составлением двух эквивалентных шкал. Формы должны быть эквивалентны по содержанию. В строгом смысле это означает, что альтернативные шкалы должны иметь одинаковые средние, вариации и внутренними корреляциями. Даже при со- блюдении этих двух условий формы не всегда эквивалентны по содержанию. Таким образом низкий коэффициент корреляции будет свидетельствовать либо о ненадежности шкалы, либо о неэквивалентности форм. 354 Часть II. Разработка плана исследования Проверка надежности через тестирование внутренней согласованности (internal consistency reliability) Метод оценки внутренней согласованности набора пунктов, при котором подсчитывается сумма количества баллов для получения общего итога. Проверка надежности через тестирование внутренней согласованности. Для проверки на- дежности итоговой шкалы, в которой результаты по отдельным пунктам суммируются для по- лучения общего балла, применяется проверка надежности через тестирование внутренней согла- сованности (internal consistency reliability). В подобных шкалах отдельные пункты измеряют ка- кой-либо аспект конструкции, рассматриваемой с помощью всей шкалы, поэтому результаты по пунктам должны согласовываться между собой. Данная методика проверки согласованности фокусируется на внутренней согласованности набора пунктов, составляющих шкалу. Проверка надежности делением данных на половины (split-half reliability) Метод проверки внутренней согласованности, при котором пункты, составляющие шкалу, раз- деляются на половины с последующим расчетом коэффициента корреляции между ними. Наиболее простой способ измерения внутренней согласованности — это проверка надежно- сти делением данных на половины (split-half reliability). Пункты шкалы разделяются на две поло- вины и затем рассчитывается корреляция между ними. Высокое значение корреляции между половинами свидетельствует о высокой внутренней согласованности. Пункты шкалы разбива- ются на две части в зависимости от четности, нечетности или случайным образом. Проблема в том, что результаты будут зависеть от выбора способа разбивки. Популярное решение этой про- блемы — расчет коэффициента "альфа". Коэффициент "альфа" (coefficient alpha) Показатель внутренней согласованности, рассчитывающийся как средняя всех возможных половинных коэффициентов различных разделений шкалы. Коэффициент "альфа" (coefficient alpha), или альфа Кронбаха (Cronbach's alpha) является средним из всех возможных половинных коэффициентов при различных делениях шкалы. Ко- эффициент принимает значения от 0 до 1, при значении коэффициента 0,6 и меньше внут- ренняя согласованность неудовлетворительная. Важное свойство коэффициента "альфа" — это увеличение его значения при увеличении количества пунктов шкалы. Таким образом, коэф- фициент может быть искусственно завышен за счет чрезмерно большого количества пунк- тов [31]. Коэффициент ''альфа" дополняет коэффициент "бета", который оценивает наличие несогласованных пунктов в процессе усреднения с помощью коэффициента альфа. Некоторые многомерные шкалы включают несколько наборов пунктов для измерения раз- личных аспектов многомерной конструкции. Например, имидж магазина является многомер- ной конструкцией, включающей качество товаров, разнообразие и ассортимент продукции, политику возврата и урегулирования конфликтов, торговое обслуживание, цены, удобство рас- положения, внешний вид магазина, политику оплаты и продажи в рассрочку. Следовательно, шкала, разработанная для оценки имиджа магазина, включает пункты для измерения каждого из этих показателей. Поскольку измеряемые показатели в некоторой степени не зависят один от другого, расчет внутренней согласованности даст недостоверные результаты. Если же для измерения одного показателя используется несколько пунктов, возможен расчет коэффициен- та согласованности для отдельного показателя, как в случае с совокупностью эмоциональных кри- териев Бюмонта (Beaumont emotion battery)- • ПРИМЕР. Критерии Бюмонта Совокупность эмоциональных критериев Бюмонта разработана Beaumont Organization, \ Ltd. для измерения эмоциональных реакций на рекламу. Респонденты оценивали про- \ смотренные рекламные ролики по совокупности показателей, описывающих восемь ос- Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 355 новных видов эмоций: одобрение, страх, удивление, печаль, отвращение, злость, ожида- ние и удовольствие. По каждой из основных эмоций с помощью коэффициента "альфа" Кронбаха измерялась внутренняя согласованность. Для перечисленных эмоций коэффи- циенты составили соответственно 0,73, 0,66, 0,63, 0,75, 0,72, 0,81, 0,79 и 0,85. Эти резуль- таты показывают удовлетворительную внутреннюю согласованность для совокупности критериев Бюмонта [32]. Достоверность Достоверность (validity) Насколько различия между оценками, полученными по шкале, отражают истинные различия между измеряемыми характеристиками объектов, а не обусловлены случайными и систе- матическими ошибками. Достоверность (validity) шкалы можно определить как степень, в которой различия между оценками, полученными по шкале, отражают истинные различия между измеряемыми харак- теристиками объектов, а не обусловлены случайными и систематическими ошибками. Полная достоверность предусматривает отсутствие ошибок измерения (Х0= Х-^ XR= О, XS= 0). Исследо- ватели оценивают содержательную достоверность, критериальную и конструкционную [33]. Содержательная достоверность (content validity) Тип достоверности, иногда называемый лицевой достоверностью (face validity), для опреде- ления которого проводится субъективная систематическая оценка того, насколько хорошо содержание шкалы соответствует поставленной цели измерения. Содержательная достоверность. Содержательная достоверность (content validity), иногда называемая лицевой достоверностью (face validity), субъективная систематическая оценка то- го, насколько хорошо содержание шкалы соответствует поставленной цели измерения. Ис- следователь, или кто-либо еше, проверяет, насколько пункты шкалы адекватно покрывают всю область измерений. Таким образом, шкала, разработанная для измерения имиджа ма- газина, считается неадекватной, если будет опущена одна из существенных характеристик объекта (качество, разнообразие, ассортимент предлагаемой продукции). Учитывая субъек- тивную природу данного показателя, оценки содержательной достоверности будет недоста- точно при измерении достоверности шкалы, однако она помогает правильно интерпретиро- вать полученные результаты. Более того, формальную оценку можно получить с помощью проверки достоверности критерия. Критериальная достоверность (criterion validity) Тип достоверности, отражающий соответствие используемой шкалы переменным, которые выбраны как значимые. Критериальная достоверность. Критериальная достоверность (criterion validity) отражает, насколько используемая шкала соответствуют выбранным значимым критериальным пере- менным. Последние могут включать демографические и психологические характеристики, из- мерения отношений и поведений, оценки, полученные на основании использования других шкал. В зависимости от временных рамок критериальная достоверность может принимать две формы — текущую или прогнозную достоверность. Текущая достоверность определяется, когда данные, полученные на основе использования шкалы, и сведения о критериальных переменных собираются одновременно. Для оценки те- кущей достоверности разработаны краткие формы для определения характеристик личности, как, например, совокупность критериев Бюмонта. Данные по исходным опросам и по кратким формам обрабатываются параллельно и затем сравниваются. 356 Часть II. Разработка плана исследования Для оценки прогнозной достоверности исследователь собирает данные оценок по шкале в один период времени, а по критериальным переменным — в другой. Например, отношение к различным маркам сухих завтраков может использоваться для прогноза будущих объемов про- даж сухих завтраков представителям сканернои панели. У членов панели получают информа- цию об их отношении к продукту, а затем их будущие закупки проверяются по данным иссле- дования. Прогнозные и фактические данные по покупкам сравниваются для оценки прогноз- ной достоверности шкалы отношения. Конструктивная достоверность (construct validity) Тип достоверности, оценка которого предполагает ответ на вопрос, конструкцию или ха- рактеристику чего именно измеряет шкала. При оценке конструктивной достоверности пы- таются ответить на теоретические вопросы: почему шкала эффективна и какие дедуктивные выводы можно сделать из лежащей в ее основе теории. Конструктивная достоверность. Конструктивная достоверность (construct validity) связана с ответом на вопрос, конструкцию или характеристику чего именно измеряет шкала. При оценке конструктивной достоверности исследователь попытается ответить на теоретические вопросы: почему должна использоваться эта шкала и какие выводы можно сделать из лежащей в ее осно- ве теории. Таким образом, для оценки конструктивной достоверности необходима основатель- ная теоретическая разработка сути конструкций и их соотношения с другими конструкциями. Конструктивная достоверность наиболее сложна в определении. Как показано на рис. 9.5, дос- товерность конструкции включает конвергенционную, дискриминантную и помологическую достоверности. Конвергенционная достоверность (convergent validity) Способ оценки конструктивной достоверности; измеряет, насколько шкала положительно коррелирует с другими измерителями той же конструкции. Дискриминантная достоверность (discriminant validity) Один из вариантов конструктивной достоверности, показывающий, насколько значения не коррелируют с другими конструкциями, от которых они предположительно отличаются. Помологическая достоверность (nomological validity) Один из вариантов оценки достоверности, определяемый степенью корреляции значений конструкций, вытекающих из теории. Конвергенцнонная (сходящаяся) достоверность (convergent validity) — степень, в которой шкала положительно коррелирует с другими измерителями той же конструкции. При этом не обязательно получить все значения с помощью методов обычного шкалирования. Дискрнмн- нантная достоверность (discriminant validity) показывает, насколько значения шкалы не корре- лируют с другими конструкциями, от которых они предположительно отличаются. Это связано с уменьшением корреляции между различающимися конструкциями. Дискриминантную дос- товерность также иногда называют дифференцированной. Помологическая достоверность (nomological validity) определяется степенью корреляции значений конструкций, вытекающих из теории. Маркетологом формулируется теоретическая модель с последующими выводами и проверкой. В результате составляется номологическая сеть из нескольких систематически взаимосвязанных конструкций, Иллюстрация конструктивной достоверности приведена ниже в контексте оценки многомерной шкалы [34]. ПРИМЕР. Будь честен с самим собой Следующие положения помогут оценить достоверность многомерной шкалы само- оценки. • Высокая корреляция с другими шкалами самооценки и с результатами опроса друзей (конвергенционная достоверность). Глава 9. Измерение и шкалирование: методы несравнительного шкалирования 357 Низкая корреляция с несвязанными конструкциями приверженности к определен- ным торговым маркам или поиском разнообразия (дискриминантная достоверность). Торговые марки, которые соответствуют самооценке индивида, предпочитаются им больше, как это теоретически возможно и постулируются (помологическая достоверность). Высокий уровень надежности. Примечательно, что высокий уровень надежности в этом примере приведен как доказатель- ство конструкционной достоверности. Взаимосвязь между надежностью и достоверностью Механизм взаимосвязи между надежностью и достоверностью понятнее при рассмотрении его с помощью модели истинной оценки. Если измерение абсолютно достоверно, то оно одно- временно абсолютно надежно. В этом случае Х0 = Хт, XR = Q,XS = 0. Таким образом, достовер- ность подразумевает надежность. Если измерение ненадежно, оно не может быть достоверным, так как даже минимально Х0 = Хт + Хк. Кроме того, может быть систематическая ошибка, тогда Xs # 0. Ненадежность подразумевает недостоверность. Если измерение абсолютно надежно, оно Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.21 сек.) |