|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Глава 16. Дисперсионный и ковариационный анализПосле изучения материала этой главы вы должны уметь... 1. Трактовать диапазон применения дисперсионного анализа (ANOVA) и его связь с (-критерием и регрессионным анализом. 2. Описывать однофакторный дисперсионный анализ, включая разложение полной вариа- ции, измерение эффектов, проверку значимости и интерпретацию результатов. 3. Рассматривать многофакторный дисперсионный анализ и проверять значимость полного эффекта, эффекта взаимодействия и главный эффект каждого фактора. 4. Проводить анализ ковариации и показывать, каким образом он учитывает влияние не- управляемых независимых переменных. 5. Объяснять ключевые факторы, относящиеся к интерпретации результатов, делая акцент на взаимодействии факторов, их относительной важности и множественных сравнениях. 6. Обсуждать специальные методы дисперсионного анализа, используемые в маркетинге, та- кие как повторные измерения в дисперсионном анализе, неметрический дисперсионный анализ и многомерный дисперсионный анализ (MANOVA). КРАТКИЙ ОБЗОР В главе 15 мы изучали методы проверки различий между двумя средними или двумя ме- дианами разных выборок. В этой главе мы рассмотрим что делать в том случае, если маркетолог имеет дело с большим числом средних или медиан. Такого рода методы называют дисперсион- ным анализом и ковариационным анализом. Несмотря на то, что обычно их используют для ана- лиза экспериментальных данных, они также полезны для анализа результатов опроса или дан- ных наблюдений. Опишем методы выполнения дисперсионного и ковариационного анализа и обсудим их соотношение с другими методами проверки связей. Затем опишем однофакторный диспер- сионный анализ, самый простой из этих методов, следом за ним — многофакторный дис- персионный и ковариационный анализ. Особое внимание мы уделим вопросам интерпрета- ции результатов, а именно, взаимодействию факторов, их относительной важности и мно- жественным сравнениям. Мы широко осветим некоторые специальные темы, такие как повторные измерения в дисперсионном анализе, неметрический дисперсионный анализ и многомерный дисперсионный анализ. Рассмотрим примеры, иллюстрирующих применение дисперсионного анализа. СКВОЗНОЙ ПРИМЕР. ВЫБОР УНИВЕРМАГА """""I Дисперсионный анализ В проекте "Выбор универмага" несколько независимых переменных относились к числу ка- тегориальных, имеющих больше двух категорий (уровней) значения. Например, степень ос-! ведомленности об универсальных магазинах маркетологи разделили на высокую, среднюю: и низкую. С помощью дисперсионного анализа они выявили влияние этих независимых 1 604 Часть III. Сбор, подготовка и анализ данных переменных на метрические зависимые переменные. Таким образом маркетологи получили общее представление об этой проблеме, что послужило основанием для последующего ана- лиза данных. Так, использование трех категорий применительно к степени осведомленно- сти о магазине не позволило получить статистически значимые результаты, тогда как разде- ление степени осведомленности на два уровня (высокая и низкая степень) привело к зна- чимым результатам. Таким образом маркетологи увидели, что в данном случае лучше всего подходит рассмотрение степени осведомленности о магазине как переменной, имеющей только две категории. ПРИМЕР. Риски электронной коммерции Для проверки различий в предпочтениях приобретения через Internet товаров с различ- ными уровнями экономического и социального риска маркетологи использовали дисперси- онный анализ. Экономический и социальный риск имел два значения (высокий и низкий риск). Предпочтение к приобретению товаров через Internet выступало зависимой перемен- ной. Результаты выявили существенное взаимодействие социального и экономического риска. Приобретение товаров через Internet не является предпочтительным для продуктов с высоким социальным риском (например, модной одежды), независимо от уровня экономи- ческого риска товара, но зато предпочтительно для продуктов с низким экономическим риском по сравнению с продуктами с высоким экономическим риском при низком уровне социального риска [1]. ПРИМЕР. Лекарства с точки зрения ANOVA Анализируя эффективность различных форматов рекламных обращений для продавае- мого без рецепта средства от изжоги, маркетологи изучили роль содержания рекламного об- ращения и относительной новизны торговой марки. Зависимой переменной выступало от- ношение к рекламируемой торговой марке. Независимыми переменными служили три фак- тора, каждый из которых имел две категории: формат рекламы, содержание и относительная новизна. Категории формата рекламы были следующие; реклама со сравнением и реклама без сравнения. В первом случае для сравнения использовались широко известные торговые марки Rolaids и Turns. Категрии относительной новизны получали, изменяя производителя лекарства. Название Alka-Seltzer использовалось в качестве твердо устоявшейся торговой марки, вто время как Acid-off выступало новой маркой. Название Acid-off выбрано на осно- ве предварительного тестирования. Категориями содержания рекламного обращения высту- пали фактическое и ценностное содержания. Респондентов набрали в торговом центре и случайным образом распределили по разным 1 группам. Из 207 полученных ответов 200 признали годными для анализа. 25 респондентов | вошли в каждую из восьми (2 x 2 x 2) групп для проведения эксперимента. Затем был выполнен трехфакторный дисперсионный анализ, где зависимой переменной служило отношение респондента к торговой марке. Общие результаты оказались статистиче- ски значимыми. Взаимодействие трех факторов также оказалось существенным. Из имею- щихся двухфакторных взаимодействий статистически значимым было только взаимодейст- вие между форматом рекламного ролика и относительной новизной. На основании этих ре- зультатов маркетологи сделали вывод, что сравнительный формат рекламы, который подчеркивал фактическую информацию, оказался наиболее подходящим для выхода на ры- нок нового товара [2]. В примере с универсальным магазином, где осведомленность была представлена тремя ка- тегориями (уровнями), /-критерий не подходил для изучения различий выборочных средних, поэтому применили дисперсионный анализ. Изучение приобретения товаров через Internet Глава 16. Дисперсионный и ковариационный анализ 605 включало сравнение средних при наличии двух факторов (независимых переменных), у каждо- го из которых было два уровня. Более сложное исследование сравнительной эффективности рекламы лекарства включало три фактора, у каждого из которых было два уровня. В последних двух примерах /-критерии также оказались неподходящими, поскольку влияние каждого фак- тора зависело от действия других факторов (взаимодействия факторов были существенными), В следующем разделе этой главы рассматривается связь дисперсионного анализа с /-критерием и другими методами проверки. ВЗАИМОСВЯЗЬ МЕТОДОВ Дисперсионный и ковариационный анализ используется маркетологами для изучения различий средних значений зависимых переменных, вызванных влиянием контролируе- мых независимых переменных, при условии, что учтено влияние неконтролируемых не- зависимых переменных. По сути, дисперсионный анализ (analysis of variance — ANOVA) применяют как проверку статистической значимости различий выборочных средних для двух или больше совокупностей. Обычно нулевая гипотеза утверждает, что все выбороч- ные средние равны. Например, предположим, что исследователю интересно узнать, дей- ствительно ли люди с различным уровнем потребления сухих завтраков (едят много, средне, слабо и вообще не едят) различаются предпочтением к Total cereal, измеренным по девятибалльной шкале Лайкерта. Проверку нулевой гипотезы, утверждающей, что четыре группы потребителей не различаются предпочтением к Total, можно выполнить, исполь- зуя дисперсионный анализ. Дисперсионный анализ (analysis of variance — ANOVA) Статистический метод изучения различий между выборочными средними для двух или больше совокупностей. В своей простейшей форме дисперсионный анализ должен иметь зависимую переменную (предпочтение к сухому завтраку Total cereal), которая является метрической (измеренной с по- мощью интервальной или относительной шкалы). Кроме того, должна быть одна или больше независимых переменных (потребление продукта: сильное, среднее, слабое и отсутствие по- требления). Все независимые переменные должны быть категориальными (неметрическими), их еще называют факторами (factors). Фактор (factors) Категориальная независимая переменная. Чтобы использовать дисперсионный анализ, не- зависимые переменные должны все быть категориальными (неметрическими). Конкретная комбинация уровней факторов называется факторным экспериментом (условиями испытаний) (treatment). Факторный эксперимент (условия испытаний) (treatment) В дисперсионном анализе конкретная комбинация категорий (уровней) факторов. Однофакторный дисперсионный анализ (one-way analysis of variance) включает только одну категориальную переменную или единственный фактор. Однофакторный дисперсионный анализ (one-way analysis of variance) Метод дисперсионного анализа, при котором используется только один фактор. 606 Часть III. Сбор, подготовка и анализ данных Различия в предпочтениях потребителей с сильным, средним, слабым и нулевым уровнями потребления можно изучить с помощью однофакторного дисперсионного анализа, в котором факторный эксперимент представлен определенным уровнем фактора (пользователи со сред- ним уровнем потребления как раз и составляют факторный эксперимент). Если существует два или больше факторов, то анализ называют многофакторным дисперсионным анализом (n-way analysis of variance). (Если в дополнение к фактору использования продукта исследователь так- же хочет узнать отношение к Tola! cereal потребителей с разным уровнем лояльности (новый фактор), то для этого подходит многофакторный дисперсионный анализ). Многофакторный дисперсионный анализ (n-way analysis of variance) Модель дисперсионного анализа, которая включает два или больше факторов. Если набор независимых переменных состоит из категориальных и метрических перемен- ных, то их изучают методом ковариационного анализа (analysis of covariance — ANCOVA). Ковариационный анализ, ANCOVA (analysis of covariance — ANCOVA) Специальный метод анализа дисперсий, в котором эффекты одной или больше сторонних переменных, выраженных в метрической шкале, удаляют из зависимой переменной перед выполнением дисперсионного анализа. Например, ковариационный анализ необходим, если исследователь хочет изучить предпоч- тения пользователей в группах с различным уровнем потребления и уровнем лояльности, при- няв во внимание отношение респондентов к составу продуктов питания и к значению завтрака, как способу приема пищи. Две последние переменные измеряются по девятибалльной шкале Лайкерта. В этом случае категориальные независимые переменные (потребление продукта и лояльность к торговой марке) по-прежнему называются факторами, в то время как метрические независимые переменные (отношение к составу продуктов питания и значение, придаваемое завтраку) — ковариатами (covariates). Ковариата (covariates) Метрическая независимая переменная, используемая в ковариационном анализе {ANCOVA). Взаимосвязь дисперсионного анализа с f-критерием и другими методами анализа, такими как регрессионный анализ (глава 17), показана на рис. 16.1. Во всех этих методах анализа используется метрическая зависимая переменная. Дис- персионный и ковариационный анализ может включать несколько независимых пере- менных (степень использования продукта, лояльность к торговой марке, отношение, важ- ность). Более того, одна из независимых переменных должна быть категориальной и кате- гориальные переменные могут иметь больше двух уровней (в нашем примере степень использования продукта имеет четыре уровня). С другой стороны, /-критерий предназна- чен для использования в случае с единственной бинарной независимой переменной. На- пример, различие в предпочтениях товара у лояльных и нелояльных респондентов можно узнать, выполнив проверку с помощью /-критерия. Регрессионный анализ, подобный дисперсионному и ковариационному, также может включать несколько независимых пе- ременных. Однако все независимые переменные, в основном, измеряются интервальной шкалой, хотя бинарные или категориальные переменные могут приспосабливаться к ана- лизу за счет введения фиктивных (dummy) переменных. Например, связь между предпоч- тением продукта Total cereal, отношением к составу продукта и важностью завтрака можно изучить с помощью регрессионного анализа. Глава 16. Дисперсионный и ковариационный анализ 607 Одна или несколько независимых переменных .. Категориальная Категориальная ьинарнавпеременная <лЯ1Гтпг.няо1 и интмюяпииа Дисперсионный Ковариационный Однофакторный ..анализ Многофакторный .дисперсионный анализ Рис. 16.1. Взаимосвязь между t-критерием, дисперсионным и ковариационным анализом и регрессией ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ Довольно часто у маркетологов возникает необходимость установить различия в средних значениях зависимой переменной для нескольких категорий одной независимой перемен- ной (фактора). • Различаются ли разные сегменты рынка с точки зрения объема потребления товара? • Действительно ли различаются оценки торговой марки группами респондентов, кото- рые посмотрели разные рекламные ролики? • Различается ли отношение розничных, оптовых торговцев и торговых агентов к полити- ке распределения, проводимой фирмой? • Зависит ли намерение потребителей приобрести товар данной торговой марки от разни- цы в уровнях цен? • Влияет ли осведомленность потребителей о магазине (высокая, средняя и низкая) на предпочтение данного магазина? Ответ на эти и другие вопросы можно получить, выполнив однофакторный дисперсион- ный анализ. Перед описанием процедуры мы определим основные статистики, используемые в однофакторном дисперсионном анализе [3]. 608 Часть III. Сбор, подготовка и анализ данных СТАТИСТИКИ, ИСПОЛЬЗУЕМЫЕ В ОДНОФАКТОРНОМ ДИСПЕРСИОННОМ АНАЛИЗЕ Эта-квадрат (п.2) — корреляционное отношение. С ее помощью выражают степень влияния или силу эффекта А1 (независимой переменной, фактора) на У (зависимую переменную). Зна- чение п2 лежит в интервале от 0 до 1. F-статистика (F-statistic). Нулевую гипотезу о том, что категориальные средние в двух вы- борочных совокупностях равны, проверяют с помощью f-статистики, представляющей собой отношение межгрупповой дисперсии к дисперсии ошибки (отношение среднего квадрата X к среднему квадрату ошибки). Средний квадрат (mean square). Сумма квадратов отклонений наблюдений, деленная на со- ответствующее ей число степеней свободы. SSmx^, вариация переменной Y, обусловленная различием средних между группами (межгрупповая дисперсия) (SS^^^ SSf). Вариация переменной К, связанная с вариацией сред- них значений категорий переменной X. Она представляет собой вариацию между уровнями пе- ременной X или долю в сумме квадратов переменной Y, связанную с переменной X. SSeHympu> вариация переменной Y, обусловленная вариацией внутри каждой группы категорий (внутригрунповая дисперсия) (SSvilhin Ssfmr). Это вариация переменной Y, обусловленная изме- нением внутри каждой из групп переменной X. Она осуществляется за счет всех факторов, кро- ме АЧпри исключенном X). Общая сумма квадратов SSy. Полная дисперсия переменной Y. ВЫПОЛНЕНИЕ ОДНОФАКТОРНОГО ДИСПЕРСИОННОГО АНАЛИЗА Процедура выполнения однофакторного дисперсионного анализа представлена на рис. 16.2. ...Определение зависимой и независимой переменных Рис. 16.2. Однофакторный дисперсионный анализ Она включает: определение зависимых и независимых переменных, разложение общей ва- риации, измерение эффектов, проверку значимости и интерпретацию результатов. Мы под- робно рассмотрим эти стадии и их применение. Глава 16. Дисперсионный и ковариационный анализ 609 Определение зависимой и независимой переменных Пусть Y — зависимая переменная, а X — независимая переменная. К— это категориаль- ная переменная, имеющая с категорий (уровней, групп). Для каждой группы Л"существует п наблюдений Y, как это показано в табл. 16.1. Из данных таблицы видно, что размер выборки в каждой группе ЛТ равен п, а размер общей выборки N = п х с. Для упрощения допускают, что размеры выборок в группах переменной ЛТ(групповые размеры) равны, но это допущение необязательно. Таблица 16.1. Разложение полной вариации: однофакторный дисперсионный анализ Независимая переменная X Внутригрупповая вариация = 55анутр( Группы Уг Полная выборка Полная вариация = SSy Y- Yfl Групповые средние Y2 Y, Межгрупповая вариация = SSMaw Разложение полной вариации Для изучения различий между средними однофакторный дисперсионный анализ исполь- зует разложение полной вариации (decomposition of the total variation), наблюдаемой в зависи- мой переменной. Разложение полной вариации (decomposition of the total variation) 8 однофакторном дисперсионном анализе разделение вариации, зависимой переменной, на вариацию, обусловленную различием средних внутри групп плюс вариацию, обуслов- ленную внутригрупповой изменчивостью. Эту вариацию вычисляют как сумму квадратов с поправкой на среднее (на число степеней свободы) (SS). Дисперсионный анализ называют так потому, что он изучает изменчивость или дисперсию выборки (применительно к зависимым переменным) и, исходя из этой изменчиво- сти, определяет, действительно ли выборочные средние равны между собой. Полную вариацию У, обозначаемую SS, можно разложить на два компонента: Ь&у ЬЬцнокду """ ^внутри где нижние индексы между (between) и внутри (within) относятся к группам переменной X. SSMf*cay~ это вариация переменной Y, связанная с различием средних между группами пере- менной X. Она представляет вариацию между категориями переменной X (межгрупповая из- менчивость). Другими словами, 53„ежду -~ это доля в сумме квадратов переменной Y, обуслов- ленная действием независимой переменной или фактором X. Поэтому 55жжАу также обозначают как SB*. SSMHympu — это вариация переменной У, связанная с вариацией внутри каждой группы 610 Часть III. Сбор, подготовка и анализ данных переменной X, ее вычисляют, не учитывая фактор X. Поэтому SSmympu также называют диспер- сией ОШИбкИ 55ОШиб№ SS = SS + SS yj — отдельное наблюдение Y} —среднее для группы/ Y — среднее для всей выборки или общая средняя Yij — i-наблюдение в/-группе Смысл разложения полной вариации в переменной Y, SSy на компоненты SS^^ и SSeHympli в том, чтобы наглядно представить и затем изучить различия в групповых средних. Вспомним из главы 15, если вариация переменной в совокупности известна, то можно определить, насколь- ко сильно изменение выборочного среднего обусловлено только случайной вариацией. В дис- персионном анализе рассматривают несколько различных групп (например, сильное, среднее, слабое использование, отсутствие использования товара). Если нулевая гипотеза верна, и все группы имеют одно и то же среднее значение совокупности, то можно оценить, насколько сильно отличаются выборочные средние вследствие только выборочной (случайной) вариации. Если наблюдаемое различие в выборочных средних больше ожидаемого, то логично заключить, что эта дополнительная вариация связана с различиями в групповых средних в совокупности. В дисперсионном анализе мы определяем два показателя вариации: внутри групп (SS,,Hymi,a) (внутригрупповая изменчивость) и между группами (SSHejfdy) (межгрупповая изменчивость). Внутри групповая вариация показывает, насколько сильно кодеблятся значения переменной Y внутри группы. Поэтому ее используют для оценки дисперсии внутри группы. Предполагает- ся, что все группы в рассматриваемой совокупности имеют одну и ту же вариацию. Однако из- за того, что неизвестно, имеют ли все группы одно и то же значение средней, мы не может вы- числить дисперсию всех объединенных вместе наблюдений. Дисперсия для каждой группы рассчитывается отдельно, и затем эти дисперсии следует объединить в "среднюю" или "общую". Аналогично, можно получить другую оценку дисперсии значений Y, изучив вариа- ции между средними- (Этот процесс обратный процессу определения вариации в средних.) Ес- ли среднее совокупности одно и то же во всех группах, то для оценки дисперсии К используем вариацию в выборочных средних и размеры выборочных групп. Приемлемость этой оценки дисперсии Узависит от истинности нулевой гипотезы. Если нулевая гипотеза верна и средние совокупности равны, то оценка дисперсии на основе межгрупповой изменчивости корректна. С другой стороны, если группы имеют различные средние в совокупности, то оценка диспер- сии на основе межгрупповой изменчивости слишком большая. Таким образом, сравнивая оценки дисперсии на основе межгрупповой и внутригрупповой изменчивости (вариации), мы можем проверить нулевую гипотезу [4]. Разложение полной вариации также позволяет изме- рить влияние переменной ЛГ на Y. Измерение эффекта Сила влияния переменной А1 на У измеряется с помощью SSf. Поскольку SSt связана с ва- риацией средних значений групп X, то относительное значение SS^ растет с увеличением раз- личий между средними значениями У в группах X. Относительное значение SSX также увели- чивается при уменьшении вариаций Y внутри групп X. Эффект влияния переменной X на Y вычисляют по формуле: Глава 16. Дисперсионный и ковариационный анализ 611 JiJ tJj Значение корреляционного отношения п2 лежит в пределах от 0 до 1. Оно равно нулю, когда все групповые средние равны, т.е. переменная X не влияет на Y. Значение г\2 равно 1, когда внутри каждой из групп переменной X изменчивость отсутствует, но имеется некоторая измен- чивость между группами. Таким образом, г\2 представляет собой меру вариации Y, которая объ- ясняется влиянием независимой переменной X. Мы не только можем измерить влияние Хна Y, но и проверить его значимость. Проверка значимости В однофакторном дисперсионном анализе проверяют нулевую гипотезу, утверждающую, что групповые средние в рассматриваемой совокупности равны [5]. Другими словами, В соответствии с нулевой гипотезой значения 55V и SSoiauSllu зависят от одного источника ва- риации. В таком случае оценка дисперсии совокупности К может определяться межгрупповой или внутри групповой вариацией. Иначе говоря, оценка дисперсии совокупности Y „;_ SS, у ~ (с-\] = средний квадрат, обусловленный действием X = MSX или S,1 = ' (УУ-с) = средний квадрат, обусловленный действием всех факторов, кроме X = М5ошибки. Нулевую гипотезу можно проверить с помощью /"-статистики, рассчитываемой как отно- шение между этими двумя оценками дисперсий: SSJ(c~\) MS, SSuua^J(N-c) Шои,„й„ Эта статистика подчиняется /"-распределению с числом степеней свободы (d0, равным (с — 1) и (N — с). Таблица распределения /'-статистики приведена в табл. 5 Статистического приложе- ния. Как упоминалось в главе 15, /"-распределение представляет собой распределение вероят- ностей отношений выборочных дисперсий. Значение F зависит от числа степеней свободы в числителе и знаменателе [6]. Интерпретация результатов Если нулевую гипотезу о равенстве групповых средних не отклоняют, то независимая пере- менная не оказывает статистически значимого влияния на зависимую переменную. С другой стороны, если нулевую гипотезу отклонить, то эффект независимой переменной на зависимую трактуется как статистически значимый. Другими словами, среднее значение зависимой пере- менной различно для различных групп независимой переменной. Сравнение значений груп- повых средних показывает характер влияния независимой переменной. Другие важные вопро- сы интерпретации результатов, такие как изучение различий между конкретными средними, обсуждаются ниже. Проиллюстрируем применение од кофактор ного дисперсионного анализа и других связанных с ним методов. Иллюстрация. Рассмотрим изложенный материал на основе данных табл. 16.2, полученных в ходе эксперимента в сети крупных универмагов. Цель эксперемента — изучить влияние 612 Часть III. Сбор, подготовка и анализ данных уровня рекламы товаров непосредственно в самом магазине и купонной распродажи на объем продаж. Маркетологи использовали три уровня рекламы товаров в магазине: высокий, средний и низкий. У купонной распродажи было два уровня. Купон на 20-долларовую скидку либо да- вали потенциальным покупателям (уровень в этом случае обозначали номером 1), либо не да- вали (этот уровень обозначали номером 2 в табл. 16.2). Результаты экспериментов с рекламой и купоном объединили в таблицу размером 3 х2 с шестью ячейками. Тридцать магазинов были выбраны случайным образом, и для каждой комбинации условий эксперимента случайным образом взяли по пять магазинов, как показано в табл. 16,2. Эксперимент продолжался два ме- сяца. Определили объем продаж в каждом магазине, нормализовали его, приняв во внимание посторонние факторы (размер магазина, товарооборот и т.д.) и пересчитали по десятибалльной шкале. В дополнение была получена качественная оценка относительного числа постоянных покупателей для каждого магазина, также с использованием десятибалльной шкалы. Получен- ные данные приведены в табл. 16.2 Таблица 16.2, Уровень купонной распродажи, реклама товаров на месте купли-продажи; продажи и постоянные покупатели Номер магазина 1? Уровень купонной распродажи 1,00 1.00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 2,00 2,00 2,00 2,00 2,00 2.00 2,00 2,00 2,00 2,00 2,00 2,00 Внутримэгазинная реклама 1,00 1,00 1,00 1,00 1,00 2,00 2,00 2,00 2,00 2,00 3,00 3,00 3,00 3,00 3,00 1,00 1,00 1,00 1,00 !,(!(] 2,00 2,00 2,00 2,00 2,00 3,00 3,00 Продажи 10,00 9,00 10,00 8,00 9,00 8,00 8,00 7,00 9,00 6,00 5,00 г,оо 6,00 4 (10 5,00 8,00 9,00 7,00 7,00 6,00 4,00 5,00 Ei.OQ 6,00 4,00 2,00 3,00 Постоянные покупатели 9,00 10,00 8,00 4,00 6,00 8,00 4,00 10,00 6,00 9,00 8,00 9,00 6,00 10,00 4,00 10,00 6,00 8,00 4,00 9,00 6,00 8,00 10,00 4,00 9,00 4,00 6,00 Глава 16, Дисперсионный и ковариационный анализ 613 Окончание табл. 16.2 Номер магазина Уровень купонной распродажи Внугримагазинная реклама Продажи Постоянные покупатели 2,00 2,00 2,00 3,00 3,00 3,00 2,00 1,00 2,00 10,00 9,00 8,00 ПРИМЕНЕНИЕ ОДНОФАКТОРНОГО ДИСПЕРСИОННОГО АНАЛИЗА Проиллюстрируем применение од кофактор но го анализа вначале с вычислениями, сделан- ными вручную, а затем с использованием компьютера. Предположим, что мы оперировали только одним фактором, а именно, рекламой на месте торговли, т.е. чтобы показать процесс вычисления, проигнорируем второй фактор — купонную распродажу. Маркетологи пытались определить влияние внутримагазинной рекламы товаров (X) на продажи (Y). Чтобы показать процесс вычисления с помощью ручного калькулятора, данные табл. 16.2 преобразованы в табл, 16.3, где приведены продажи (У?) для каждого уровня рекламы. Нулевая гипотеза утвер- ждает, что групповые средние равны: Н0\ ji, = ц2 = ц3 y (JO - 6,067) +(9 - 6,067) +(7 - 6,067) +(6 - 6,067) +(5 - 6,067) = (3,933)2 + +(0,933)2+( +(- 1,067)2- +(- 2,067)2 • =185,867 2 + (9-6,067)2 + (10-6,067)2 2 + (7 - 6,067)2 + (7 - 6,067)2 2 + (9 - 6,067)2 + (6 - 6,067)2 2 + (4 - 6,067)2 + (5 - 6,067)2 2 + (2 - 6,067)2 + (3 - 6,067)2 (2,933)2 + (3,933)2 + (1,933)2 -0,067)2 + (l,933)2+(l,933)2-f f- (- 1,067)2 + (- 0,067)2 + (- 2 M-l,067)2+(-4,067)2 + (-3 + (8 - 6,067)2 + (9 - + (6 - 6,067)2 + (8 - -b (4 - 6,067)2 + (5 - •f (7 - 6,067)2 + (6 - + (2 - 6,067)2 + (1 - + (2,933)2 + (1,933)2 -(0,933)2+(2,933)2 + ,067)2 + (- 1,067)2 + | ,067)2 + (- 4,067)2 + ( 6,067)2 4- 6,067)2 + 6,067)2 + 6,067)2 + 6,067)2 + + (2,933) (- 0,067)2 - 0,067)2 - 5,067)2 (8 (8 (5 (4 (2 :.. - 6,067)2 + - 6,067)2 + - 6,067)2 + - 6,067)2 + - 6,067): = - (0,933)2 + (- 2,067)2 + (- 0,067)2 + (- 4,067)2 = SSX = 10(8,3 - 6,067)2 + 10(6,2 - 6,067)2 + 10(3,7 - 6,067)2 = 10(2,223)2 + Ю(ОДЗЗ)2 + 10(- 2,367)2 = =106,067 ^ащ^ы= (Ю - 8,3)2 + (9 - 8,3)2 + (10 - 8,3)2 + (8 - 8,3)2 + (9 - 8,3): + (8 - 8,3)2 + (9 - 8,3)2 + +(7 - 8,3)2 + (7 - 8.3)2 + (6 - 8,3)2 + (8 - 6,2)2 + (8 - 6,2)2 + (7 - 6,2)2 + (9 - 6,2)2 + +(6 - 6,2)2 + (4 - 6,2)2 + (5 - 6,2)2 + (5 - 6,2): + (6 - 6,2)2 + (4 - 6,2)2 + (5 - 3,7)2 + +(7 - 3,7)2 + (6 - 3,7)2 + (4 - 3,7)2 + (5 - 3,7)2 + (2 - 3,7)2 + (3 - 3,7)2 + (2 - 3,7)2 + +(1 - 3,7)2 + (2 - 3,7)2 = (1,7)2 + (0,7)2 + (1,7)г +(-0,3)2 + (0,7)2 + (~0,3)2 + (0,7)2 + +(-1,3)2 + (-1.3)2 + (-2,3)2 + (1,8)2 + (1,8)2 + (0,8)2 + (2,8)2 + (-0,2)2 + <-2,2)2 + (-1.2)1 + +(-1,2)2 + (-0,2)2+ (-2,2)г+ (1,3)2+ (3,3)2+ (2,3)2+ (0,3)2+ (1,3)2+ (- 1,7)2+ (- 0,7)2 + +(- 1,7)2+ (- 2,7)2+ (- 1,7)2= 79,80 Можно утверждать, что SSy = SSt + ДУвииДи и 185,867=106,067 + 79,80 Степень влияния (эффекта) А" на Увычисляют по формуле: Л2 = SS,/SSy= 106,067/185,867 = 0,571 Другими словами, 57,1% вариации в продажах (У) обусловлено влиянием внутримагазин- ной рекламы, что указывает на умеренный эффект. Теперь проверим нулевую гипотезу. 614 Часть III. Сбор, подготовка и анализ данных SS1IW,lflKUf(N-c) 106,Q67/(3-l) 79,800/(30-3) = 17,944 Таблица 16.3. Влияние уровня вкутримагазинной рекламы на продажи Номер магазина Уровень внутримагазинной рекламы Высокий Средний Нормированные продажи Низкий 1!) Суммы по колонкам Групповые средние: К, ^ = 8,3 S ^=6,2 10 — = 3,7 - (83 + 62 + 37) Общее среднее, У = - = 6,067 По табл. 5 Статистического приложения находим, что для 2 и 27 степеней свободы критическое значение ^-статистики равно 3,35 при уровне значимости а = 0,05. Посколь- ку вычисленное значение /'-статистики больше критического, мы отклоняем нулевую ги- потезу. Заключаем, что средние значения совокупностей для трех уровней внутримага- зинной рекламы товаров действительно различаются между собой. Сравнение средних для трех категорий показывает, что высокий уровень рекламы ведет к существенно более вы- соким продажам. Теперь проиллюстрируем процедуру выполнения дисперсионного анализа с помощью компьютерной программы. Результаты выполнения анализа на компьютере приведены в табл. 16,4. Таблица 16.4. Однофакторный дисперсионный анализ (ANOVA) Источник дисперсии Между группами (внутримагазинная реклама) Внутри групп (дисперсия ошибки) Итого Сумма квадратов 106,067 79,800 185,867 Степени свободы Средний квадрат 53,033 2,956 6,409 F-статистика Вероятность F 17,944 0,000 Глава 16. Дисперсионный и ковариационный анализ 615 Окончание табл. 16.4 Средние ячеек Уровень рекламы Количество (наблюдений) Среднее Высокий (1) 10 8,300 Средний (2) 10 6,200 Низкий (3) 10 3,700 Итого 30 6,067 Значение SSX,, указывающее на главные эффекты (систематические), равно 106,067 для двух степеней свободы; значение SS^^ указывающее на остаточные эффекты, равно 79,80 для 27 степеней свободы. Следовательно, значения средних квадратов соответственно равны MS = 106,067/2 = 53,033 и MSautu6KU = 79,80/27 = 2,956. Значение F= 53,033/2,956 = 17,944 при 2 и 27 степенях свободы приводит к вероятности, равной 0,000. Так как соответствующая вероят- ность меньше, чем уровень значимости, равный 0,05, то нулевую гипотезу о равенстве средних в совокупности отклоняют. Альтернативно, из табл. 5 Статистического приложения видно, что критическое значение ^для 2 и 27 степеней свободы равно 3,35. Поскольку вычисленное зна- чение /(17,944) больше критического, то нулевую гипотезу отклоняют. Данные табл. 16.4 по- казывают, что выборочные средние, равные 8,3; 6,2 и 3,7, совершенно различны, Процедура однофакторного дисперсионного анализа и его применения помогут понять до- пущения данного анализа. ДОПУЩЕНИЯ В ДИСПЕРСИОННОМ АНАЛИЗЕ Обобщим допущения дисперсионного анализа: 1. Обычно считается, что уровни независимой переменной фиксированные. Статистический вывод касается только рассматриваемых конкретных уровней. Это называется моделью с фиксированным влиянием уровней фактора (fixed-effects model). Существуют и другие модели. Для модели со случайным влиянием уровней фактора (random-effects model) считают, что фак- торы представляют собой случайные выборки из генеральной совокупности факторного эксперимента. Статистические выводы делают в отношении других уровней, не изучаемых в анализе. Модель со смешанными уровнями (mixed-effects model) получают, если некоторые факторы (условия эксперимента) фиксированные, а некоторые — случайные [7]. 2. Остаточный член в дисперсионной модели, определяющей значение зависимой перемен- ной Y, имеет нормальное распределение; его математическое ожидание равно нулю, а дис- персия является постоянной1. Остаточный член не связан ни с одним уровнем переменной X. Умеренное отклонение от этих допущений серьезно не влияет на достоверность анализа. Более того, данные можно преобразовать таким образом, чтобы они удовлетворяли допуще- нию о нормальности распределения или постоянству дисперсий. 3. Остаточные члены не коррелируют. Если остаточные члены взаимосвязаны (т.е. наблюде- ния зависимые), то отношение дисперсий /может быть сильно искажено. 1 Однофа к торная дисперсионная модель имеет вид Xii = u+F< + s,jf где Ху — значение исследуемой переменной, полученной на i-м уровне фактора (I = 1,2,...т) cj-м порядковым но- мером (I = 1,2,...п); fj — общая средняя; FI — эффект, обусловленный влиянием i-гоуровня фактора; £%• — остаточный член, или возмущение, вызванное влиянием неконтролируемых факторов, т.е. вариацией переменной внутри отдельного уровня. (Прим, научн. ред. Подробнее см. Н. Ш. Кремер. Теория вероятностей и математическая статистика. — М.: ЮНИТИ-ДАНА. — 2000. — С. 375) 616 Часть III. Сбор, подготовка и анализ данных Часто при анализе ситуаций данные соответствуют описанным выше допущениям, Поэтому дисперсионный анализ достаточно распространен, что и подтверждают следую- щие примеры. ПРИМЕР. Торговля по видеокаталогу Хотя применение видео каталогов для покупки товаров на дому недостаточно рас- пространено, многие компании, практикующие прямой маркетиинг, проявили заинте- ресованность их использования. Spiegel и Neiman Marcus предлагают видеокаталоги по- требителям. Маркетологи исследовали с помощью видеокаталогов эффективность розничной торгов- ли как формы прямого маркетинга. Участники эксперимента были случайным образом включены в один из трех вариантов эксперимента, когда они использовали: только видеока- талог; видеокаталог и обычный каталог или только обычный каталог. Анализировались за- висимые переменные, представляющие собой отношения и мнения: оценки характеристик товара (одежды); оценки компании-рекламодателя видеокаталога/каталога; оценки инфор- мации о ценах; намерение сделать покупку. Для каждой зависимой переменной выполнен самостоятельный однофакторный дис- персионный анализ. Результаты показали, что респонденты отнеслись к покупкам по ви- деокаталогам или видеокаталогам и каталогам более позитивно, чем к покупкам только по обычному каталогу. Хотя факторный эксперимент "только видеокаталог' повысил вос- приятие компании-рекламодателя, результаты не были такими впечатляющими, как в случае восприятий товара (одежды). Не обнаружено существенных различий в воспри- ятии цены и намерений сделать покупки. Кроме того, среднее число наименований това- ров, которые, по словам респондентов, они бы купили, больше среди познакомившихся с видеокаталогом и с обычным каталогом, чем среди тех, кто посмотрел только видеоката- лог, или только обычный каталог. Хотя это исследование и было пробной попыткой изучить влияние некоторых факторов на продажи, позитивные результаты оценки товаров (одежды), по видеокаталогу, предпола- гают, что такой метод маркетинга представляет собой потенциальный интерес для продав- цов, использующих прямой маркетинг [8]. МНОГОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ При проведении маркетинговых исследований часто приходится иметь дело с одновремен- ным влиянием нескольких факторов [9]. • Как меняется намерение потребителей купить товар данной торговой марки при раз- личных уровнях цены и распределения? • Как уровень рекламы и уровень цен (высокий, средний, низкий) одновременно влияют на продажи товара данной торговой марки? • Влияет ли на выбор потребителем данной торговой марки уровень образования (ниже среднего, среднее, колледж, высшее) и возраст? • Как осведомленность об универмаге (высокая, средняя, низкая) и представление о нем (позитивное, нейтральное, негативное) влияют на предпочтение потребителем этого магазина? При определении влияния на зависимую переменную нескольких факторов можно ис- пользовать многофакторный дисперсионный анализ. Главное преимущество этого метода в том, что он позволяет исследователю изучать взаимодействие факторов. Взаимодействия (interaction) имеют место, когда эффекты одного фактора на зависимую переменную зависят от уровня других факторов. Глава 16. Дисперсионный и ковариационный анализ 617 Взаимодействие (interaction) При оценке зависимости между двумя переменными взаимодействие имеет место, если влияние Х\ зависит от уровня Хг, и наоборот. Процедура многофакторного дисперсионного анализа аналогична процедуре однофактор- ного дисперсионного анализа. Статистики, соответствующие многофакторному дисперсион- ному анализу, также определяются аналогично определению статистик в однофакторном дис- персионном анализе. Рассмотрим простой пример, в который входят факторы Х}нХ2с уровня- ми с, и ^соответственно. В этом случае полная вариация раскладывается следующим образом: 55„шиаи = SS за счет X, + SS за счет Х2 + SS за счет взаимодействия X, и Х2 или 55 = SS + 55 + 55 Большее влияние X, будет отражаться в большем отличии среднего в уровнях Х}к более вы- соком значении 55,. Это же касается и фактора Х2. Чем сильнее взаимодействие между факто- рами X, и Х21 тем больше значение 55,^,. С другой стороны, если Л^иЛ^не зависят один от дру- гого, то значение 55,,,, приближается к нулю [10]. Степень объединенного влияния (эффекта) двух факторов называют полным эффектом, или множественной корреляцией r\2 (multiple л2), вычисляемой по формуле: (55, +55, +55„) V Множественная корреляция r)2 (multiple т]2) Степень объединенного влияния двух (или более) факторов, или полный эффект. Значимость полного эффекта (significance of the overall effect) проверим с помощью /-"-критерия, используя формулу: _ (55Д| +55,: +SS,i3: }ldfn _ SSXi^v, /dfa _ MS, где dfn — число степеней свободы для числителя = (с, - 1) + <с2 - 1) + (с, - 1) (с2 - 1) = Cic2 - 1 dfd — число степеней свободы для знаменателя = N - с,с2 MS — средний квадрат. Значимость полного эффекта (significance of the overall effect) Проверка наличия различий между некоторыми из групп факторного эксперимента. Если полный эффект статистически значимый, то на следующем этапе изучают значимость эффекта взаимодействия (significance of the interaction effect) [11]. Если нулевая гипотеза утвер- ждает, что взаимодействие между факторами отсутствует, то соответствующий /•'-критерий вы- числяют по формуле: ^ n _ Д1„ 'sS^/dfj'MS^ ' где dfn = (c,-l) + (c2-l) dfd = N - с,с2 618 Часть III. Сбор, подготовка и анализ данных Значимость эффекта взаимодействия (significance of the interaction effect) Проверка значимости взаимодействия между двумя или больше независимыми переменными. Если окажется, что эффект взаимодействия статистически значимый, значит, эффект А/ за- висит отЛ"^ и наоборот. Поскольку эффект (влияние) одного фактора неоднородный, а зависит от уровня другого фактора, то вообще бессмысленно проверять значимость главных эффектов, Однако имеет смысл проверить значимость главного эффекта каждого фактора, если эффект взаимодействия статистически незначимый [12]. Значимость главного эффекта каждого фактора (significance of the main effect of each factor) можно проверить следующим образом (для X,): Idf MSX L J l\ K, ' где MS,, dfd=N-c,c2 Значимость главного эффекта каждого фактора (significance of the main effect of each factor) Проверка значимости главного эффекта для каждого отдельного фактора. При анализе предполагалось, что план эксперимента сбалансированный (число случаев в каждой ячейке одинаково). Если это не так, то анализ становится сложнее. Приведенный ниже пример иллюстрирует применение многофакторного дисперсионного анализа. Иллюстрация применения многофакторного дисперсионного анализа. Возвратившись к дан- ным табл. 16.4, изучим эффекты, обусловленные влиянием уровня внутримагазинной рекламы и уровня купонной распродажи на продажи магазина. Результаты выполненного на компьюте- ре обсчета дисперсионного анализа 3 x 2 приведены в табл. 16.5. Для главного эффекта, вы- званного влиянием уровня внутримагазинной рекламы, сумма квадратов SSV, число степеней свободы и средний квадрат MSV те же, что и в табл. 16.4. Сумма квадратов для эффекта, обу- словленного уровнем купонной распродажи $5Ж= 53,333 с одной степенью свободы, что при- водит к значению среднего квадрата MS^, равного сумме квадратов. Объединенный эффект оп- ределяют, сложив суммы квадратов, обусловленные двумя главными эффектами (SS^ + SS^. = = 106,067 + 53,333 = 159,400). Так же поступаем и со степенями свободы (2 + 1) = 3. Для эф- фекта взаимодействия внутримагазинной рекламы и купонной распродажи сумма квадратов равна SSxpxe = 3,267 с (3 - 1) х (2 — I) = 2 степенями свободы, и значит, средний квадрат равен MS-quf — 3,267/2 = 1,633. Для полного эффекта сумма квадратов состоит из суммы квадратов для главного эффекта рекламы, главного эффекта купонной распродажи и эффекта взаимодейст- вия = 106,067 + 52,333 + 3,267 = 162,667 с 2 + 1 + 2 = 5 степенями свободы, и значит, средний квадрат равен 162,667/5 = 32,533. Однако обратите внимание, что статистики ошибки отличаются от приведенных в табл. 16.4. Это обусловлено тем, что сейчас у нас два фактора вместо одного: SSoulu6KU = 23,2c (30 — 3x2) или 24 степенями свободы, отсюда средний квадрат М$аашбки= 0,967. Таблица 16.5. Двухфакторный дисперсионный анализ Источник вариации Главные эффекты Вкутришгазинная реклама Купонная распродажа Сумма квадратов 106,067 53,333 Степени свободы Средний квадрат 53,033 53,333 F 54,862 55,172 Значимость F 0,000 0,000 of 0,557 0,280 Глава 16. Дисперсионный и ковариационный анализ 619 Окончание табл. 16.5 Источник вариации Объединенный Двухфакгорное взаимодействие Модель Остаточный компонент (ошибка) Итого Сумма квадратов 159,400 3,267 162,667 23,200 185,867 Степени свободы •! Средний F Значимость F of квадрат 53,133 54,966 0,000 1,633 1,690 0,206 32,533 33,655 0,000 0,967 6,409 Средние ячеек Уровень внугримагазиннои рекламы Высокий Высокий Средний Средний Низкий Низкий Купонная распродажа Да Нет fc Нет Да Нет Количество {наблюдений) Среднее 9,200 7,400 7,600 4,800 5,400 2,000 Средние факторного уровня Уровень внутримагазинной Купонная Количество рекламы распродажа (наблюдений Среднее Высокий Средний Низкий Общее среднее Нет 8,300 6,200 3,700 7,400 4,733 6,067 F- критерий для проверки значимости полного эффекта равен: 0,967 с 5 и 24 степенями свободы. Полный эффект статистически значимый при уровне значимости, равном 0,05. /-критерий для проверки значимости эффекта взаимодействия равен: 1,633 т- _ 0,967 = 1,690 с 2 и 24 степенями свободы. Эффект взаимодействия статистически незначимый при уровне значимости, равном 0,05. Поскольку эффект взаимодействия статистически незначимый, оценим значимость глав- ных эффектов, /-критерий для проверки значимости главного эффекта внутримагазинной рекламы равен: 0,967 с 2 и 24 степенями свободы. Главный эффект рекламы статистически значимый при уровне значимости, равном 0,05, 620 Часть III. Сбор, подготовка и анализ данных /"-критерия для проверки значимости главного эффекта купонной распродажи равен; 53,333 ™ 0,967 с 1 и 24 степенями свободы. Главный эффект купонной распродажи статистически значимый при уровне значимости, равном 0,05. Таким образом, чем выше уровень рекламы, тем выше продажи. Распространение премиальных купонов также повышает продажи. Эффект влияния каждого фактора не зависит от эффекта другого фактора. Рассмотрим использование многофакторного дисперсионного анализа. ПРИМЕР. Где делают качественные телевизоры? Маркетологи исследовали эффекты, обусловленные влиянием страны-производителя телевизора на доверие людей к его качественным характеристикам: хороший звук, безотказ- ность (надежность), четкое изображение и современный дизайн. Независимые переменные включали цену, страну-изготовителя и каналы распределения телевизоров. Использовался следующий план пересечения факторов: 2 x 2 x 2. Установили два уровня цен: 349,95 долла- ров (нижний) и 449,95 долларов (высший), взяли две страны-изготовителя— Корею и Со- единенные Штаты Америки, и два уровня каналов распределения — в магазинах компании Hudson и в других магазинах. Данные собирали в двух крупных пригородных торговых центрах в большом городе. 30 респондентов были отобраны случайным образом для каждой из восьми ячеек факторного эксперимента, таким образом было привлечено 240 людей. В табл. 1 представлены результа- ты обработки комбинаций переменных, которые оказали значимые эффекты на каждую из зависимых переменных. Таблица 1. Анализ значимости комбинаций независимых переменных (факторов) Эффект, обусловленный Зависимая Одномерный Степени Вероятность, р влиянием следующих факторов: переменная критерий, F свободы (df) Страна х цена Хороший звук 7,57 1,232 0,006 Странах цена Безотказность 6,57 1,232 0,011 Страна х распределение Четкость изображения 6,17 1,232 0,014 Страна х распределение Безотказность 6,57 1,232 0,011 Страна х распределение Современный дизайн 10,31 1,232 0,002 Направления эффектов взаимодействия "страна-распределение" для трех зависимых пе- ременных показаны в табл. 2. Таблица 2, Средние значения зависимых переменных для эффекта взаимодействия "страна-распределение" Странахраспределение Четкое изображение Безотказность Модный дизайн Корея Hudson 3,67 3,42 3,82 Другие магазины 3,18 2,88 3,15 Соединенные Штаты Америки Hudson 3,60 3,47 3,53 Другие магазины 3,77 3,65 3,75 В то время как рейтинг доверия к таким характеристикам, как четкость изображения, I безотказность и современный дизайн повышался при распределении южнокорейских теле- \ визоров через магазины Hudson больше, чем при продаже через других дистрибьюторов, это I Глава 16. Дисперсионный и ковариационный анализ 621 оказалось неверным для телевизоров производства США. Аналогично, направления эффек- тов взаимодействия "страна-распределение" для двух зависимых переменных показаны в табл. 3. При цене 449,95 долларов рейтинги доверия для "хорошего звука" и "безотказности" были выше для американских телевизоров, по сравнению с южно корейскими, но совсем незначительное различие наблюдалось в отношении страны изготовления при стоимости телевизора 349,95 доллара. Таблица 3. Средние значения зависимых переменных для эффекта взаимодействия "страна-цена" Страна ж цена Хороший звук Безотказность $349,95 Корея 3,75 3,40 Соединенные Штаты Америки 3,53 3,45 $449,95 Корея 3,15 2,90 Соединенные Штаты Америки 3,73 3,67 Это исследование показывает, что доверие к характеристикам изделия для товаров, традиционно экспортируемых в Соединенные Штаты Америки компанией из быстро раз- вивающейся индустриальной страны, можно существенно повысить, если компания рас- пределяет свой товар через магазины известной розничной сети в США. В частности, ха- рактеристики изделия (четкость изображения, безотказность и модный дизайн) заслужи- вают доверия, если телевизоры сделаны в Южной Корее и распространяются через известную торговую сеть Соединенных Штатов Америки. Аналогично, такие характери- стики телевизоров, как "хороший звук" и "безотказность" заслуживают доверия, если те- левизоры сделаны в Соединенных Штатах Америки и продаются по более высокой цене, возможно, компенсируя потенциальный недостаток высоких производственных затрат в Соединенных Штатах Америки [13]. КОВАРИАЦИОННЫЙ АНАЛИЗ При проверке различий в средних значениях зависимой переменной, связанных с влияни- ем контролируемых независимых переменных, часто необходимо учитывать неконтролируе- мые независимые переменные. • При определении намерений потребителей относительно приобретения товара извест- ной фирмы в зависимости от цены необходимо учесть отношение к торговой марке. • Для того чтобы определить, как различные группы под влиянием разных видов рекла- мы, оценивают торговую марку, необходимо проконтролировать, какой информацией априорно обладают члены этих групп. • При определении влияния различных иен на потребление в семьях сухих завтраков мо- жет оказаться существенным такой фактор, как размер семьи. В приведенных выше ситуациях следует использовать дисперсионный анализ, который включает, по крайней мере, одну категориальную независимую переменную и одну интерваль- ную или метрическую независимую переменную. Категориальную независимую переменную называют фактором, а метрическую — ковариатой. Чаше всего ковариату используют для уда- ления посторонней вариации из зависимой переменной, поскольку самыми важными являют- ся эффекты факторов. Вариацию в зависимой переменной, обусловленную ковариатой, удаля- ют корректировкой среднего значения зависимой переменной в пределах каждого условия экс- перимента. Затем, исходя из скорректированных оценок, выполняют дисперсионный анализ [14]. Значимость суммарного эффекта ковариат, как и эффект каждой ковариаты, про- 622 Часть III. Сбор, подготовка и анализ данных веряют с помощью соответствующих /- критериев. Коэффициенты ковариат позволяют понять влияние, оказываемое на зависимую переменную. Ковариационный анализ наиболее полезен, когда ковариата линейно связана с зависимой переменной и не связана с факторами [15]. Для иллюстрации ковариационного анализа мы снова используем данные табл. 16.2. Пред- положим, что мы хотели бы определить эффекты, обусловленные влиянием внутри магазинной рекламы и купонной распродажи, на продажи, при наличии такой ковариаты> как принадлеж- ность покупателя к числу постоянных клиентов магазина. Предполагается, что принадлеж- ность к числу постоянных покупателей может также влиять на продажи универмага. Зависимая переменная представляла собой продажи. Как и ранее, реклама имела три уровня, а купонная распродажа — два. Степень приверженности магазину, измеренная по интервальной шкале, служила ковариатой. Результаты приведены в табл. 16.6. Таблица 16.6. Ковариационный анализ Источник вариации Сумма квадратов Степени Средний свободы квадрат Значимость F Ковариаты Степень приверженности магазину Главные эффекты Реклама Купонная распродажа Объединенный Двухфакторное взаимодействие рекламационная распродажа Модель Остаточный компонент (ошибка) Итого Ковариата -постоянный покупатель 0,838 1 0,838 0,868 0,363 106,067 2 53,033 54,546 0,000 53,333 1 53,333 54,855 0,000 159,400 3 53,133 54,649 0,000 3,267 2 1,633 1,680 0,208 163,505 6 27,251 28,028 0,000 22,362 23 0,972 185,867 29 6,409 Коэффициент корреляции - 0,078 Как видно, сумма квадратов, связанная с ковариатой, незначительна (0,838) и имеет одну степень свободы, поэтому значение среднего квадрата идентично сумме квадратов. Соответст- вующий /"-критерий равен 0,838/0,972 = 0,862 с 1 и 23 степенями свободы, незначимый при уровне— 0,05. Таким образом, можно сделать следующее заключение: наличие постоянных покупателей не влияет на объем продаж универмага. Если же эффект ковариаты статистически значимый, то можно использовать знак групповового коэффициента, чтобы определить на- правление эффекта на зависимую переменную (прямая или обратная связь). ВОПРОСЫ ПРИ ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ Важные вопросы, возникающие при интерпретации результатов дисперсионного анализа, включают взаимодействия, относительную важность факторов и множественные сравнения. Взаимодействие Различные взаимодействия, которые могут возникнуть при проведении ANOVA по двум или больше факторам, показаны на рис. 16.3. Одним из результатов является то, что AN OVA может указать на отсутствие взаимодействий (эффекты взаимодействий считаются незначимыми). Другая возможность заключается в том, что взаимодействие — значимое. Эффект в результате взаимодействия имеет место тогда, когда Глава 16. Дисперсионный и ковариационный анализ 623 эффект, обусловленный действием независимой переменной на зависимую, различен для раз- личных уровней другой независимой переменной. При упорядоченном взаимодействии (ordinal interaction) ранжированный порядок эффектов, связанных с одним фактором, не меняется вдоль уровней второго фактора. 1озможные эффекты взаимодеж Взаимодействие отсутствует Наличие взаимодействия (случай 1) Г Упорядоченное взаимодействие (случай 2) Неупорядоченное взаимодействие Взаимодействие Взаимодействие непересекающегося типа пересекающегося типа (случай 3} (случай 4) Рис. 16.3. Классификация эффектов в результате взаимодействий Упорядоченное взаимодействие (ordinal interaction) Ранжированный порядок эффектов, связанных с одним фактором, не меняется вдоль уров- ней второго фактора. Неупорядоченное взаимодействие (disordinal interaction), напротив, характеризуется измене- нием ранжированного порядка эффектов одного фактора вдоль уровней другого. Неупорядоченное взаимодействие (disordinal interaction) Изменение ранжированного порядка эффектов одного фактора вдоль уровней другого. Если взаимодействие неупорядоченное, то оно может быть непересекающимся или пересе- кающимся [16]. Случаи взаимодействий приведены на рис. 16.4, где принимается, что имеется два фактора: А", с тремя уровнями (Х,,,Х]21лХ,3) и Х2 с двумя уровнями (Х2„Х22). Случай 1 указывает на отсутствие взаимодействия, Отрезки прямой, отражающие эффекты, обусловленные влиянием X, на Y, параллельны отрезкам прямой, отражающим эффекты, обу- словленные влиянием Х2, при двух уровнях. Наблюдается некоторое отклонение от параллель- ности, но оно не выше предполагаемого в данной ситуации. Параллельность подразумевает, что итоговое влияние Х22 по сравнению с Х2, одинаково на всех трех уровнях Х}. При отсутствии взаимодействия совместный эффект Х{ и Х2 равен просто сумме их индивидуальных главных эффектов. Случай 2 относится к упорядоченному взаимодействию. Отрезки прямой, отражающие влияние X, и Х2, непараллельны. Разность ординат между Х22 и Х21 увеличивается по мере дви- жения от Хп к Х12 и от Х]2 к X,-,, но порядок рангов эффектов X, одинаков на двух уровнях Х2. Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.271 сек.) |