МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах
РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ" ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах Гендерна антидискримінаційна експертиза може зробити нас моральними рабами ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів
Контакти
Тлумачний словник Авто Автоматизація Архітектура Астрономія Аудит Біологія Будівництво Бухгалтерія Винахідництво Виробництво Військова справа Генетика Географія Геологія Господарство Держава Дім Екологія Економетрика Економіка Електроніка Журналістика та ЗМІ Зв'язок Іноземні мови Інформатика Історія Комп'ютери Креслення Кулінарія Культура Лексикологія Література Логіка Маркетинг Математика Машинобудування Медицина Менеджмент Метали і Зварювання Механіка Мистецтво Музика Населення Освіта Охорона безпеки життя Охорона Праці Педагогіка Політика Право Програмування Промисловість Психологія Радіо Регилия Соціологія Спорт Стандартизація Технології Торгівля Туризм Фізика Фізіологія Філософія Фінанси Хімія Юриспунденкция |
|
|||||||
Класифікація методів Data MiningПорівняння вільного пошуку і прогностичного моделювання з погляду логіки Вільний пошук розкриває загальні закономірності. Він по своїй природі індуктивний. Закономірності, отримані на цій стадії, формуються від часткового до загального. У результаті ми одержуємо деяке загальне знання про деякий клас об'єктів на підставі дослідження окремих представників цього класу. Правило: "Якщо вік здобувача < 20 років і бажаний рівень винагороди > 700 умовних одиниць, то в 75% випадків здобувач шукає роботу програміста" На підставі частки, тобто інформації про деякі властивості класу "вік < 20 років" і "бажаний рівень винагороди > 700 умовних одиниць", ми робимо висновок про загальне, а саме: здобувачі – програмісти. Прогностичне моделювання, навпаки, дедуктивне. Закономірності, отримані на цій стадії, формуються від загального до приватного і єдиного. Тут ми одержуємо нове знання про деякий об'єкт або ж групу об'єктів на підставі: Ø знання класу, до якого належать досліджувані об'єкти; Ø знання загального правила, що діє в межах даного класу об'єктів. Знаючи, що здобувач шукає керівну роботу і його стаж > 15 років, на 65% можна бути впевненим у тому, що вік здобувача > 35 років. На підставі деяких загальних правил, а саме: ціль здобувача – керівна робота і його стаж > 15 років, ми робимо висновок про єдине – вік здобувача > 35 років. Слід зазначити, що отримані закономірності, а точніше, їх конструкції, можуть бути прозорими, тобто допускаються тлумачення аналітика (розглянуті вище правила), і непрозорими, так названим "чорним ящикам". Типовий приклад останньої конструкції – нейронна мережа.
3. Аналіз виключень (forensic analysis) На третій стадії Data Mining аналізуються виключення або аномалії, виявлені в знайдених закономірностях. Дія, що виконується на цій стадії, – виявлення відхилень (deviation detection). Для виявлення відхилень необхідно визначити норму, що розраховується на стадії вільного пошуку. Повернемося до одного з прикладів, розглянутого вище. Знайдено правило "Якщо вік > 35 років і бажаний рівень винагороди > 1200 умовних одиниць, то в 90 % випадків здобувач шукає керівну роботу". Виникає питання – до чого віднести 10 % випадків що залишилися? Тут можливо два варіанти. Перший з них – існує деяке логічне пояснення, що також може бути оформлене у вигляді правила. Другий варіант для 10% що залишилися – це помилки вихідних даних. У цьому випадку стадія аналізу виключень може бути використана як дистиляція даних.
Далі ми розглянемо кілька відомих класифікацій методів Data Mining по різних ознаках.
Читайте також:
|
||||||||
|