АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Работа 6

Читайте также:
  1. T-FACTORY HRM - управление персоналом и работами
  2. V. САМОСТОЯТЕЛЬНАЯ РАБОТА
  3. V. САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ
  4. V. Самостоятельная работа студентов с больными.
  5. V2: Работа и энергия
  6. Window - работа с окнами.
  7. Аналитическая работа при выборе и обосновании стратегии развития предприятии
  8. Б) работа врачей поликлиники (амбулатории), диспансера, консультации
  9. В 72-х дневном цикле подвиг длится 8 суток, из которых 2 суток – голод, а 6 – очистительные процедуры и работа над собой. В 12-ти летнем цикле подвиг длится 1 год.
  10. В работах В. Джеймса
  11. В) профилактическая работа
  12. В). Работа с посредниками.

Кластерный анализ (выполняется с применением программ «Hierarchical cluster analysis» и «K-Means cluster» пакета SPSS).

Задача. Изучается система из пяти признаков x(1), x(2), x(3), x(4), x(5) по числовым данным, собранным на n = 52 объектах. Требуется:

1. Используя в качестве исходных данных матрицу (52 х 5) значений признаков x(1), x(2), x(3), x(4), x(5) на объектах, провести вычисления по программе «Hierarchical cluster analysis», выбрав для классификации все пять признаков, и реализовать метод ближайшего соседа (nearest neighbor) с выбором евклидовой метрики расстояний (eudidean distance), предварительно стандартизовав исходные данные (standardize); построить дендрограмму (dendrogram); сохранить протокол объединения (agglomeration schedule) и матрицу расстояний (proximity matrix),

2. В окне результатов иерархического кластерного анализа:

а) просмотрев матрицу расстояний, выписать расстояние между первым и двадцатым объектами и привести формулу его расчета;

б) выписать первые пять строк протокола объединения, объяснить их смысл и привести алгоритм пересчета матрицы расстояний между объектами на каждом, шаге объединения;

в) проанализировав по дендрограмме иерархию объединения кластеров (первые пять шагов сопоставить с протоколом объединения), предложить (если это возможно) разбиение исходных 20 объектов на два кластера — класса и указать объекты, относящиеся к каждому классу.

3. Выполнить пп. 1 - 2 для методов дальнего соседа (furthest neighbor) и средней связи (between-groups linkage),

4. Провести вычисления по программе «K-Means cluster», выбрав для классификации пять признаков x(1), x(2), x(3), x(4), x(5) (с предварительной стандартизацией) и указав в качестве количества кластеров число 2.

5. Выполнить пп. 1 - 4, выбрав для классификации не исходные признаки x(1), x(2), x(3), x(4), x(5), а главные компоненты, на долю которых приходится не менее 70% общей дисперсии исходных признаков, (полученные в работе 5),

6. Выполнить пп. 1 — 4, выбрав для классификации не исходные признаки x(1), x(2), x(3), x(4), x(5), а общие факторы (полученные в работе 5).

7. По результатам пп. 1 — 6 для каждого варианта разбиения вычислить внутриклассовые средние значения признаков x(1), x(2), x(3), x(4), x(5) и их выборочные дисперсии, после чего выбрать вариант разбиения 20 объектов на два кластера — класса, руководствуясь критерием минимума суммы внутриклассовых дисперсий.

8. Для выбранного варианта разбиения проверить гипотезы о равенстве математических ожиданий каждого из пяти признаков в кластерах и на основании результатов проверки этих гипотез провести содержательную интерпретацию структуры изучаемой совокупности из 20 объектов и предложить названия для построенных кластеров.

9. Провести регрессионный анализ признака У на признаки x(1), x(2), x(3), x(4), x(5) отдельно для каждого кластера. Сравнить его результаты с результатами регрессионного анализа признака У на признаки x(1), x(2), x(3), x(4), x(5), полученными в работе 4.

Исходные данные:

№ п/п Страна (результативный признак) Y Регрессоры
х(1) х(2) х(3) х(8) х(11)
х1 х2 х3 х4 х5
  Беларусь            
  Бельгия            
  Бразилия            
  Буркина-Фасо            
  Великобритания            
  Вьетнам            
  Гаити            
  Германия            
  Гондурас            
  Гонконг            
  Египет            
  Замбия            
  Индия            
  Ирландия            
  Испания            
  Италия            
  Канада            
  Китай            
  Колумбия            
  Коста-Рика            

 


 


 


 


 


 


 

 


 


 


 


 


1 | 2 | 3 | 4 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.)