Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Завдання Data Mining

 

Класифікація (Classification)

Короткий опис. Найбільш просте і розповсюджене завдання Data Mining. У результаті вирішення завдання класифікації виявляються ознаки, які характеризують групи об'єктів досліджуваного набору даних – класи; по цих ознаках новий об'єкт можна віднести до того або іншого класу.

Методи вирішення. Для вирішення завдання класифікації можуть використовуватися методи: найближчого сусіда (Nearest Neighbor); k-найближчого сусіда (k-Nearest Neighbor); байєсові мережі (Bayesian Networks); індукція дерев рішень; нейронні мережі (neural networks).

Кластеризація (Clustering)

Короткий опис. Кластеризація є логічним продовженням ідеї класифікації. Це завдання більш складне, особливість кластеризації полягає в тому, що класи об'єктів на початку не визначені. Результатом кластеризації є розбивка об'єктів на групи.

Приклад методу вирішення завдання кластеризації: навчання "без вчителя" особливого виду нейронних мереж – самоорганізованих карт Кохонена.

Асоціація (Associations)

Короткий опис. У ході вирішення завдання пошуку асоціативних правил шукаються закономірності між зв'язаними подіями в наборі даних.

Відмінність асоціації від двох попередніх завдань Data Mining: пошук закономірностей здійснюється не на основі властивостей аналізованого об'єкта, а між декількома подіями, які відбуваються одночасно.

Найбільш відомий алгоритм вирішення завдання пошуку асоціативних правил – алгоритм Apriori.

Послідовність (Sequence), або послідовна асоціація (sequential association)

Короткий опис. Послідовність дозволяє знайти тимчасові закономірності між транзакціями. Завдання послідовності подібне асоціації, але її метою є встановлення закономірностей не між одночасно наступаючими подіями, а між подіями, зв'язаними в часі (тобто в часі, що проходить з деяким певним інтервалом). Інакше кажучи, послідовність визначається високою ймовірністю ланцюжка зв'язаних у часі подій. Фактично, асоціація є частковим випадком послідовності з тимчасовим лагом, рівним нулю. Це завдання Data Mining також називають завданням знаходження послідовних шаблонів (sequential pattern).

Правило послідовності: після події X через певний час відбудеться подія Y.

Приклад. Після покупки квартири мешканці в 60% випадків протягом двох тижнів купують холодильник, а протягом двох місяців в 50% випадків купується телевізор. Вирішення даного завдання широко застосовується в маркетингу та менеджменті, наприклад, при керуванні циклом роботи із клієнтом (Customer Lifecycle Management).

Прогнозування (Forecasting)

Короткий опис. У результаті вирішення завдання прогнозування на основі особливостей історичних даних оцінюються пропущені або ж майбутні значення цільових чисельних показників.

Для вирішення таких завдань широко застосовуються методи математичної статистики, нейронні мережі та ін.

Визначення відхилень або викидів (Deviation Detection), аналіз відхилень або викидів

Короткий опис. Ціль dbрішення даного завдання – виявлення та аналіз даних, найбільш відмінних від загальної множини даних, виявлення так званих нехарактерних шаблонів.

Оцінювання (Estimation)

Завдання оцінювання зводиться до прогнозування безперервних значень ознаки.

Аналіз зв'язків (Link Analysis) – завдання знаходження залежностей у наборі даних.

Візуалізація (Visualization, Graph Mining)

У результаті візуалізації створюється графічний образ аналізованих даних. Для вирішення завдання візуалізації використаються графічні методи, що показують наявність закономірностей у даних.

Приклад методів візуалізації – подання даних в 2-D і 3-D вимірах.

Підведення підсумків (Summarization) – завдання, ціль якої – опис конкретних груп об'єктів з аналізованого набору даних.

 


Читайте також:

  1. V. Завдання.
  2. VІ. Підсумки уроку і повідомлення домашнього завдання.
  3. Web Mining
  4. Адаптація персоналу: цілі та завдання. Введення у посаду
  5. Адвокатура в Україні: основні завдання і функції
  6. АКТУАЛЬНI ПРОБЛЕМИ І ЗАВДАННЯ КУРСУ РОЗМIЩЕННЯ ПРОДУКТИВНИХ СИЛ УКРАЇНИ
  7. Актуальність і завдання курсу безпека життєдіяльності. 1.1. Проблема безпеки людини в сучасних умовах.
  8. Аналіз руху грошових коштів у контексті нової фінансової звітності Важливим завданням аналізу фінансового стану підприємства є оцінка руху грошових коштів підприємства.
  9. Аудит, його мета та завдання
  10. Багатокритеріальні завдання оптимального керування
  11. Багатокритерійні завдання і можливі шляхи їхнього рішення.
  12. Безпека життєдіяльності людини – найважливіше завдання людської цивілізації




Переглядів: 1405

<== попередня сторінка | наступна сторінка ==>
Професійна орієнтація як стадія професійного вибору | Класифікація завдань Data Mining

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

  

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.002 сек.