|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Модель метода главных компонент и ее сведение к задаче о сингулярных тройкахМетод главных— один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Применяется во многих областях, таких как распознавание образов, компьютерное зрение, сжатие данных и т. п. Вычисление главных компонент сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных. Рассмотрим метод гл.компонент на простом примере. Допустим, есть оценки студентов по неск.предметам: Пусть i – номер студента, v – номер предмета, Будем считать, что то, что мы наблюдаем порождено скрытыми переменными. Т.е., что оценку по предмету студент получает исходя из своего таланта и нагруженности: Однако в реал.данных, поэтому необх.вводить ошибку: (Миркин на паре исп. x, а в конспекте во всех формулах пишет y, говоря, что y это стандартизованный x) Минимиз.ошибку, например сумму квадратом ошибок: Однозначно эту задачу не решить, так как если z умножить, а с разделить на одно и тоже число, то ре-т не изменится. Добавим ограничение нормы:
Перепишем в матричном виде
Из (1) можно сказать, что Эти матрицы положительно полуопределены. Ранг Если нам надо минимизировать 1. 2. 3. главная компонента Если имеется k факторов, то Решение - первые k сингулярных троек, если
19. Соб.числа матриц В наших обозначениях это соответственно матрицы Чтобы объяснить значение некоторой зависимой переменной, нужно определить составляющие. Рассмотрим на конкретном примере. От чего зависит оценка конкретного студента по конкретному предмету?
Соответственно, i – номер студента (всего N), k – номер предмета (всего M), xik – оценка студента i по предмету k (завис.переменная), zi – степень таланта студента i (скрытая вел-на, не можем ее померять), сk – нагрузка предмета k. В уравнении (1) в левой части N * M известных, а в правой N + M неизвестных. Слишком много уравнений, мало неизвестных, поэтому введем невязки (как я понимаю, это просто ошибки) и формируем задачу оптимизации:
Эта задача свелась к задаче о сингулярных тройках:
В системе (4) Нас интересует максимальное сингулярное число, тогда L 2 будет минимальным. Как найти сингулярные числа, сколько их? Чтобы ответить на этот вопрос, домножим обе части первого уравнения в системе (4) на *Предпоследнее равенство получено из второго уравнения системы (4). Таким образом, имеем результат: Если
Аналогично можно получить: Если
Эти матрицы симметричны и положительно полуопределены, их собственные числа неотрицательны, а собственные векторы взаимно ортогональны. Собственных чисел будет столько, какой ранг у матрицы, соответственно, сингулярных троек столько же. Матрицы имеют разное количество собственных чисел, но одинаковое количество ненулевых собственных чисел. Если сингулярных троек больше, чем k, решениями будут являться первые k, если соответствующие
Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.008 сек.) |