|
|||||||
АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомДругоеЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция |
Збереження даних (Data Retention)У той час, як при дистиляції шаблонів ми аналізуємо Дані, виділяємо необхідний зразок і потім залишаємо їх, то, застосовуючи метод збереження, дані зберігаються для зіставляння з шаблоном. Коли надходять нові елементи даних, то вони порівнюються з попереднім рядом даних. Метод «найближчого сусіда» (самий схожий сусід, «nearest neighbor») — добре відомий приклад підходу, який ґрунтується на збереженні даних. При цьому ряд даних тримається в пам'яті Для порівняння з новими елементами даних. Коли презентується новий запис для передбачення, знаходяться «відхилення» між ним і подібними низками даних, а найподібніший ідентифікується.
Кластерний аналіз — це спосіб групування багатовимірних об'єктів, що базується на поданні результатів окремих спостережень точками геометричного простору з наступним виділенням груп як «грон» цих точок. Термін «кластерний аналіз» запропонований К. Тріоном 1939 року (cluster, англ. — гроно, скупчення, пучок). Синонімами (хоч з обмовками і не завжди) є вирази: автоматична класифікація, таксономія, розпізнавання без навчання, розпізнавання образів без учителя, самонавчання та ін. У дейта-майнінгу використовується, головно, для класифікації (таксономії). Основна мета кластерного аналізу — виділити у початкових багатовимірних даних такі однорідні підмножини, щоб об'єкти всередині груп були схожими за певними ознаками, а об'єкти з різних — несхожими. Під «схожими» розуміється близькість об'єктів у багатовимірному просторі ознак, і тоді завдання зводиться до виділення в цьому просторі природних скупчень об'єктів, які і вважаються однорідними групами. В кластерному аналізі використовуються десятки різних алгоритмів і методів (один з таких методів — K-Means реалізований у системі дейта-майнінгу KnowledgeSTUDIO). Поиск по сайту: |
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.004 сек.) |