Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Властивості методів Data Mining

 

Різні методи Data Mining характеризуються певними властивостями, які можуть бути визначальними при виборі методу аналізу даних. Методи можна порівнювати між собою, оцінюючи характеристики їхніх властивостей.

Серед основних властивостей і характеристик методів Data Mining розглянемо наступні: точність, масштабованість, інтерпритованість, перевіряємість, трудомісткість, гнучкість, швидкість і популярність.

Масштабованість – властивість обчислювальної системи, що забезпечує передбачуваний ріст системних характеристик, наприклад, швидкості реакції, загальної продуктивності та ін., при додаванні до неї обчислювальних ресурсів.

У таблиці 3.1 наведена порівняльна характеристика деяких розповсюджених методів. Оцінка кожної з характеристик проведена наступними категоріями, у порядку зростання: надзвичайно низька, дуже низька, низька/нейтральна, нейтральна/низька, нейтральна, нейтральна/висока, висока, дуже висока.


Таблиця 3.1. Порівняльна характеристика методів Data Mining

 

Алгоритм Точність Масштабованість Інтерпритованість Придатність до використання Трудомісткість Різнобічність Швидкість Популярність, широта використання
класичні методи (лінійна регресія) нейтра-льна висока висока / нейтра-льна висока нейтра-льна нейтра-льна висока низька
нейронні мережі висока низька низька низька нейтра-льна низька дуже низька низька
методи візуалізації висока дуже низька висока висока дуже висока низька надзвичайно низька висока / нейтра-льна
дерева рішень низька висока висока висока / нейтра-льна висока висока висока / нейтральна висока / нейтра-льна
поліноміальні висока нейтра-льна низька висока / нейтра-льна нейтра-льна / низька нейтра-льна низька / нейтральна нейтра-льна
k-найближчого сусіда низька дуже низька висока / нейтра-льна нейтра-льна нейтра-льна / низька низька висока низька

 

Як видно з розглянутої таблиці, кожний з методів має свої сильні та слабкі сторони. Але жоден метод, яким би не була його оцінка з погляду властивих йому характеристик, не може забезпечити вирішення всього спектра завдань Data Mining.

Більшість інструментів Data Mining, запропонованих в даний час на ринку програмного забезпечення, реалізують відразу кілька методів, наприклад, дерева рішень, індукцію правил і візуалізацію, або ж нейронні мережі, самоорганізовані карти Кохонена та візуалізацію.

В універсальних прикладних статистичних пакетах (наприклад, SPSS, SAS, STATGRAPICS, Statistica, ін.) реалізується широкий спектр різноманітних методів (як статистичних, так і кібернетичних). Варто враховувати, що для можливості їхнього використання, а також для інтерпретації результатів роботи статистичних методів (кореляційного, регресійного, факторного, дисперсійного аналізу і ін.) потрібні спеціальні знання в області статистики.

Універсальність того або іншого інструмента часто накладає певні обмеження на його можливості. Перевагою використання таких універсальних пакетів є можливість відносно легко порівнювати результати побудованих моделей, отриманих різними методами. Така можливість реалізована, наприклад, у пакеті Statistica, де порівняння основане на так називаній "конкурентній оцінці моделей". Ця оцінка складається в застосуванні різних моделей до того самого набору даних і в подальшому порівнянні їх характеристик для вибору найкращої з них.


Читайте також:

  1. H) інноваційний менеджмент – це сукупність організаційно-економічних методів управління всіма стадіями інноваційного процесу.
  2. Web Mining
  3. Аеродинамічні властивості колісної машини
  4. АЛЬТЕРНАТИВНІ ПІДХОДИ ДО ВИДІЛЕННЯ МЕТОДІВ УПРАВЛІННЯ
  5. АНАЛІЗ ПЕРСПЕКТИВНИХ НАПРЯМІВ|направлень| РОЗВИТКУ МЕТОДІВ РОЗПІЗНАВАННЯ
  6. АНАЛІЗ ПЕРСПЕКТИВНИХ НАПРЯМІВ|направлень| РОЗВИТКУ МЕТОДІВ РОЗПІЗНАВАННЯ
  7. Аналізатори людини та їхні властивості.
  8. Аналізатори людини та їхні властивості.
  9. Атрибутивні ознаки і властивості культури
  10. Білки, властивості, роль в життєдіяльності організмів.
  11. Біосфера Землі, її характерні властивості
  12. Будова атомів та хімічний зв’язок між атомами визначають будову сполук, а отже і їх фізичні та хімічні властивості.




Переглядів: 834

<== попередня сторінка | наступна сторінка ==>
Кібернетичні методи Data Mining | Тема 3. Інститут пайовиків: місце і роль в системі споживчої кооперації.

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

  

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.003 сек.