|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Работа 6Кластерный анализ (выполняется с применением программ «Hierarchical cluster analysis» и «K-Means cluster» пакета SPSS). Задача. Изучается система из пяти признаков x(1), x(2), x(3), x(4), x(5) по числовым данным, собранным на n = 52 объектах. Требуется: 1. Используя в качестве исходных данных матрицу (52 х 5) значений признаков x(1), x(2), x(3), x(4), x(5) на объектах, провести вычисления по программе «Hierarchical cluster analysis», выбрав для классификации все пять признаков, и реализовать метод ближайшего соседа (nearest neighbor) с выбором евклидовой метрики расстояний (eudidean distance), предварительно стандартизовав исходные данные (standardize); построить дендрограмму (dendrogram); сохранить протокол объединения (agglomeration schedule) и матрицу расстояний (proximity matrix), 2. В окне результатов иерархического кластерного анализа: а) просмотрев матрицу расстояний, выписать расстояние между первым и двадцатым объектами и привести формулу его расчета; б) выписать первые пять строк протокола объединения, объяснить их смысл и привести алгоритм пересчета матрицы расстояний между объектами на каждом, шаге объединения; в) проанализировав по дендрограмме иерархию объединения кластеров (первые пять шагов сопоставить с протоколом объединения), предложить (если это возможно) разбиение исходных 20 объектов на два кластера — класса и указать объекты, относящиеся к каждому классу. 3. Выполнить пп. 1 - 2 для методов дальнего соседа (furthest neighbor) и средней связи (between-groups linkage), 4. Провести вычисления по программе «K-Means cluster», выбрав для классификации пять признаков x(1), x(2), x(3), x(4), x(5) (с предварительной стандартизацией) и указав в качестве количества кластеров число 2. 5. Выполнить пп. 1 - 4, выбрав для классификации не исходные признаки x(1), x(2), x(3), x(4), x(5), а главные компоненты, на долю которых приходится не менее 70% общей дисперсии исходных признаков, (полученные в работе 5), 6. Выполнить пп. 1 — 4, выбрав для классификации не исходные признаки x(1), x(2), x(3), x(4), x(5), а общие факторы (полученные в работе 5). 7. По результатам пп. 1 — 6 для каждого варианта разбиения вычислить внутриклассовые средние значения признаков x(1), x(2), x(3), x(4), x(5) и их выборочные дисперсии, после чего выбрать вариант разбиения 20 объектов на два кластера — класса, руководствуясь критерием минимума суммы внутриклассовых дисперсий. 8. Для выбранного варианта разбиения проверить гипотезы о равенстве математических ожиданий каждого из пяти признаков в кластерах и на основании результатов проверки этих гипотез провести содержательную интерпретацию структуры изучаемой совокупности из 20 объектов и предложить названия для построенных кластеров. 9. Провести регрессионный анализ признака У на признаки x(1), x(2), x(3), x(4), x(5) отдельно для каждого кластера. Сравнить его результаты с результатами регрессионного анализа признака У на признаки x(1), x(2), x(3), x(4), x(5), полученными в работе 4. Исходные данные:
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.) |