Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Работа 6

Читайте также:

Кластерный анализ (выполняется с применением программ «Hierarchical cluster analysis» и «K-Means cluster» пакета SPSS).

Задача. Изучается система из пяти признаков x⁽¹⁾, x⁽²⁾, x⁽³⁾, x⁽⁴⁾, x⁽⁵⁾ по числовым данным, собранным на n = 52 объектах. Требуется:

1. Используя в качестве исходных данных матрицу (52 х 5) значений признаков x⁽¹⁾, x⁽²⁾, x⁽³⁾, x⁽⁴⁾, x⁽⁵⁾ на объектах, провести вычисления по программе «Hierarchical cluster analysis», выбрав для классификации все пять признаков, и реализовать метод ближайшего соседа (nearest neighbor) с выбором евклидовой метрики расстояний (eudidean distance), предварительно стандартизовав исходные данные (standardize); построить дендрограмму (dendrogram); сохранить протокол объединения (agglomeration schedule) и матрицу расстояний (proximity matrix),

2. В окне результатов иерархического кластерного анализа:

а) просмотрев матрицу расстояний, выписать расстояние между первым и двадцатым объектами и привести формулу его расчета;

б) выписать первые пять строк протокола объединения, объяснить их смысл и привести алгоритм пересчета матрицы расстояний между объектами на каждом, шаге объединения;

в) проанализировав по дендрограмме иерархию объединения кластеров (первые пять шагов сопоставить с протоколом объединения), предложить (если это возможно) разбиение исходных 20 объектов на два кластера — класса и указать объекты, относящиеся к каждому классу.

3. Выполнить пп. 1 - 2 для методов дальнего соседа (furthest neighbor) и средней связи (between-groups linkage),

4. Провести вычисления по программе «K-Means cluster», выбрав для классификации пять признаков x⁽¹⁾, x⁽²⁾, x⁽³⁾, x⁽⁴⁾, x⁽⁵⁾ (с предварительной стандартизацией) и указав в качестве количества кластеров число 2.

5. Выполнить пп. 1 - 4, выбрав для классификации не исходные признаки x⁽¹⁾, x⁽²⁾, x⁽³⁾, x⁽⁴⁾, x⁽⁵⁾, а главные компоненты, на долю которых приходится не менее 70% общей дисперсии исходных признаков, (полученные в работе 5),

6. Выполнить пп. 1 — 4, выбрав для классификации не исходные признаки x⁽¹⁾, x⁽²⁾, x⁽³⁾, x⁽⁴⁾, x⁽⁵⁾, а общие факторы (полученные в работе 5).

7. По результатам пп. 1 — 6 для каждого варианта разбиения вычислить внутриклассовые средние значения признаков x⁽¹⁾, x⁽²⁾, x⁽³⁾, x⁽⁴⁾, x⁽⁵⁾ и их выборочные дисперсии, после чего выбрать вариант разбиения 20 объектов на два кластера — класса, руководствуясь критерием минимума суммы внутриклассовых дисперсий.

8. Для выбранного варианта разбиения проверить гипотезы о равенстве математических ожиданий каждого из пяти признаков в кластерах и на основании результатов проверки этих гипотез провести содержательную интерпретацию структуры изучаемой совокупности из 20 объектов и предложить названия для построенных кластеров.

9. Провести регрессионный анализ признака У на признаки x⁽¹⁾, x⁽²⁾, x⁽³⁾, x⁽⁴⁾, x⁽⁵⁾ отдельно для каждого кластера. Сравнить его результаты с результатами регрессионного анализа признака У на признаки x⁽¹⁾, x⁽²⁾, x⁽³⁾, x⁽⁴⁾, x⁽⁵⁾, полученными в работе 4.

Исходные данные:

№ п/п	Страна	(результативный признак) Y	Регрессоры
х⁽¹⁾	х⁽²⁾	х⁽³⁾	х⁽⁸⁾	х⁽¹¹⁾
х1	х2	х3	х4	х5
	Беларусь
	Бельгия
	Бразилия
	Буркина-Фасо
	Великобритания
	Вьетнам
	Гаити
	Германия
	Гондурас
	Гонконг
	Египет
	Замбия
	Индия
	Ирландия
	Испания
	Италия
	Канада
	Китай
	Колумбия
	Коста-Рика

1 | 2 | 3 | 4 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.139 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница