АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Подходы к классификации метрических и неметрических данных

Читайте также:
  1. APQC структура классификации процессов SM
  2. II. Определение геометрических размеров двигателя
  3. Администр-ный и эк-ский подходы к мен-ту кач-ва
  4. Административные и экономические подходы к управлению качеством
  5. Адресация памяти и данных.
  6. Анализ статистических данных. Построение контрольных листков
  7. Аналитический способ стехиометрических расчетов
  8. АРЕАЛЬНАЯ И ФУНКЦИОНАЛЬНАЯ КЛАССИФИКАЦИИ ЯЗЫКОВ
  9. Аудит классификации, формирования доходов и расходов организации, правильности их признания в бухгалтерском учете
  10. База данных.
  11. В чем опасность согласия на сбор и обработку персональных данных.
  12. В) Валидность – один из важнейших психометрических критериев качества теста, указывающий на степень его устойчивости к искажающему воздействию случайных факторов

19. Суть метода главных компонент.

Метод главных компонент (МГК) был предложен Пирсоном в 1901 году и затем вновь открыт и детально разработан Хоттелингом /1933/. Ему посвящено большое количество исследований, и он широко представлен в литературных источниках, обратившись к которым можно получить сведения о методе главных компонент с различной степенью детализации и математической строгости (например, Айвазян С. А. и др., 1974, 1983, 1989). В данном разделе не ставится цель добиться подробного изложения всех особенностей МГК. Сконцентрируем свое внимание на основных феноменах метода главных компонент.

Метод главных компонент осуществляет переход к новой системе координат y1,...,ур в исходном пространстве признаков x1,...,xp которая является системой ортнормированных линейных комбинаций

где mi — математическое ожидание признака xi. Линейные комбинации выбираются таким образом, что среди всех возможных линейных нормированных комбинаций исходных признаков первая главная компонента у1(х) обладает наибольшей дисперсией. Геометрически это выглядит как ориентация новой координатной оси у1 вдоль направления наибольшей вытянутости эллипсоида рассеивания объектов исследуемой выборки в пространстве признаков x1,...,xp. Вторая главная компонента имеет наибольшую дисперсию среди всех оставшихся линейных преобразований, некоррелированных с первой главной компонентой. Она интерпретируется как направление наибольшей вытянутости эллипсоида рассеивания, перпендикулярное первой главной компоненте. Следующие главные компоненты определяются по аналогичной схеме.

Вычисление коэффициентов главных компонент wij основано на том факте, что векторы wi = (w11,...,wpl)',..., wp = (w1p,...,wpp)' являются собственными (характеристическими) векторами корреляционной матрицы S. В свою очередь, соответствующие собственные числа этой матрицы равны дисперсиям проекций множества объектов на оси главных компонент.

Алгоритмы, обеспечивающие выполнение метода главных компонент, входят практически во все пакеты статистических программ.

(ВОПРОС №19) ВАРИАНТ №2

Метод главных компонент – это один из широко использующихся методов многомерной математической статистики. Он применяется для решения следующих задач:

- причинный анализ взаимосвязей показателей и определение их

стохастической связи с главными компонентами;

- построение обобщенных технико-экономических показателей;

- ранжирование объектов или наблюдений по главным

компонентам;

- классификация объектов наблюдений;

- сжатие исходной информации;

- построение уравнений регрессии по обобщенным технико-

экономическим показателям.

Пусть N - число исследуемых объектов; n - число признаков (измеряемых характеристик объектов -критериев); матрица Y порядка n × N - совокупность всех N наблюдаемыхзначений всех параметров n после нормализации. Необходимо описать набор критериев n числом главныхкомпонент m << n, обеспечивающих долю дисперсии γ ≥ 0,95 и сформировать интегральный показатель оптимальности на основе матрицы и весовых коэффициентов, учитывающих тесноту связи между исходными критериями и главными компонентами. На основе выявленных наиболее весомых главных компонент, как критериальных характеристик, предлагается проводить компонентный анализ для выявления индивидуальных значений этих главных компонент

для рассматриваемых объектов и ранжирования объектов по весу этих значений, что позволит выбрать наиболее оптимальные объекты

Рис. 1 Матрица данных

Постараемся передать суть метода главных компонент, используя интуитивно-понятную геометрическую интерпретацию. Начнем с простейшего случая, когда имеются только две переменные x 1 и x 2. Такие данные легко изобразить на плоскости (Рис. 2).

Рис. 2 Графическое представление двумерных данных

Каждой строке исходной таблицы (т.е. образцу) соответствует точка на плоскости с соответствующими координатами. Они обозначены пустыми кружками на Рис. 2. Проведем через них прямую, так, чтобы вдоль нее происходило максимальное изменение данных;

Если Ci={x 1, x 2,...,xm }, где x 1, x 2,...,xm – факторы, то требуется найти такое преобразование величин Ci в новый набор величин Zi ={ z1, z2,..., zp}, которые были бы независимыми и располагались в порядке убывания дисперсий.

Каждая величина Zi представляет собой линейную комбинацию m исходных величин, т.е. имеет вид:

 

(1) Z=b1x1+b2x2+...+bmxm

 

Эта величина и называется главной компонентой. Теоретически число главных компонент равно числу исходных параметров, однако, первые две - четыре главные компоненты описывают до 90 % изменчивости исходного массива.

 

 


1 | 2 | 3 | 4 |

Поиск по сайту:



Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.)