Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Класифікація методів Data Mining

Порівняння вільного пошуку і прогностичного моделювання з погляду логіки

Вільний пошук розкриває загальні закономірності. Він по своїй природі індуктивний. Закономірності, отримані на цій стадії, формуються від часткового до загального. У результаті ми одержуємо деяке загальне знання про деякий клас об'єктів на підставі дослідження окремих представників цього класу.

Правило: "Якщо вік здобувача < 20 років і бажаний рівень винагороди > 700 умовних одиниць, то в 75% випадків здобувач шукає роботу програміста"

На підставі частки, тобто інформації про деякі властивості класу "вік < 20 років" і "бажаний рівень винагороди > 700 умовних одиниць", ми робимо висновок про загальне, а саме: здобувачі – програмісти.

Прогностичне моделювання, навпаки, дедуктивне. Закономірності, отримані на цій стадії, формуються від загального до приватного і єдиного. Тут ми одержуємо нове знання про деякий об'єкт або ж групу об'єктів на підставі:

Ø знання класу, до якого належать досліджувані об'єкти;

Ø знання загального правила, що діє в межах даного класу об'єктів.

Знаючи, що здобувач шукає керівну роботу і його стаж > 15 років, на 65% можна бути впевненим у тому, що вік здобувача > 35 років.

На підставі деяких загальних правил, а саме: ціль здобувача – керівна робота і його стаж > 15 років, ми робимо висновок про єдине – вік здобувача > 35 років.

Слід зазначити, що отримані закономірності, а точніше, їх конструкції, можуть бути прозорими, тобто допускаються тлумачення аналітика (розглянуті вище правила), і непрозорими, так названим "чорним ящикам". Типовий приклад останньої конструкції – нейронна мережа.

 

3. Аналіз виключень (forensic analysis)

На третій стадії Data Mining аналізуються виключення або аномалії, виявлені в знайдених закономірностях.

Дія, що виконується на цій стадії, – виявлення відхилень (deviation detection). Для виявлення відхилень необхідно визначити норму, що розраховується на стадії вільного пошуку.

Повернемося до одного з прикладів, розглянутого вище.

Знайдено правило "Якщо вік > 35 років і бажаний рівень винагороди > 1200 умовних одиниць, то в 90 % випадків здобувач шукає керівну роботу". Виникає питання – до чого віднести 10 % випадків що залишилися?

Тут можливо два варіанти. Перший з них – існує деяке логічне пояснення, що також може бути оформлене у вигляді правила. Другий варіант для 10% що залишилися – це помилки вихідних даних. У цьому випадку стадія аналізу виключень може бути використана як дистиляція даних.

 

Далі ми розглянемо кілька відомих класифікацій методів Data Mining по різних ознаках.

 


Читайте також:

  1. H) інноваційний менеджмент – це сукупність організаційно-економічних методів управління всіма стадіями інноваційного процесу.
  2. II. Класифікація видатків та кредитування бюджету.
  3. V. Класифікація і внесення поправок
  4. V. Класифікація рахунків
  5. Web Mining
  6. А. Структурно-функціональна класифікація нирок залежно від ступеню злиття окремих нирочок у компактний орган.
  7. Адміністративні провадження: поняття, класифікація, стадії
  8. АЛЬТЕРНАТИВНІ ПІДХОДИ ДО ВИДІЛЕННЯ МЕТОДІВ УПРАВЛІННЯ
  9. АНАЛІЗ ПЕРСПЕКТИВНИХ НАПРЯМІВ|направлень| РОЗВИТКУ МЕТОДІВ РОЗПІЗНАВАННЯ
  10. АНАЛІЗ ПЕРСПЕКТИВНИХ НАПРЯМІВ|направлень| РОЗВИТКУ МЕТОДІВ РОЗПІЗНАВАННЯ
  11. Аналітичні процедури внутрішнього аудиту та їх класифікація.
  12. Банківська платіжна картка як засіб розрахунків. Класифікація платіжних карток




Переглядів: 812

<== попередня сторінка | наступна сторінка ==>
ВІЛЬНИЙ ПОШУК (у тому числі ВАЛІДАЦІЯ) ® ПРОГНОСТИЧНЕ МОДЕЛЮВАННЯ ® АНАЛІЗ ВИКЛЮЧЕНЬ | Класифікація технологічних методів Data Mining

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

  

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.048 сек.