Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Класифікація Байєсовськая

Альтернативні назви: байєсовське моделювання, байєсовська статистика, метод байєсовських мереж.

Ознайомитися детально з байєсовскою класифікацією можна в [11]. Спочатку байєсовська класифікація використовувалася для формалізації знань експертів в експертних системах [40], зараз баєсовска класифікація також застосовується як один з методів Data Mining.

Так звана наївна класифікація або наївно-байєсовський підхід (naive-bayes approach) [43] є найбільш простим варіантом методу, що використовує байєсовські мережі. При цьому підході розв'язуються задачі класифікації, результатом роботи методу є так звані "прозорі" моделі.

"Наївна" класифікація – достатньо прозорий і зрозумілий метод класифікації. "Наївною" вона називається тому, що виходить з припущення про взаємну незалежність ознак.

Властивості наївної класифікації:

  1. Використання всіх змінних і визначення всіх залежностей між ними.
  2. Наявність двох припущень відносна змінних:

Ø всі змінні є однаково важливими;

Ø всі змінні є статистично незалежними, тобто значення однієї змінної нічого не говорить про значення інший.

Більшість інших методів класифікації передбачають, що перед початком класифікації ймовірність того, що об'єкт належить тому або іншому класу, однакова; але це не завжди вірно.

Допустимо, відомо, що певний процент даних належить конкретному класу. Виникає питання, чи можемо ми використовувати цю інформацію при побудові моделі класифікації? Існує множина реальних прикладів використання цих апріорних знань, що допомагають класифікувати об'єкти. Типовий приклад з медичної практики. Якщо лікар відправляє результати аналізів пацієнта на додаткове дослідження, він відносить пацієнта до якогось певного класу. Яким чином можна застосувати цю інформацію? Ми можемо використовувати її як додаткові дані при побудові класифікаційної моделі.

Відзначають такі достоїнства байєсовських мереж як методу Data Mining [41]:

Ø у моделі визначаються залежності між всіма змінними, це дозволяє легко обробляти ситуації, в яких значення деяких змінних невідомі;

Ø байєсовсі мережі досить просто інтерпретуються і дозволяють на етапі прогностичного моделювання легко проводити аналіз сценарієм "що, якщо";

Ø байєсовий метод дозволяє природним чином поєднувати закономірності, виведені з даних, і, наприклад, експертні знання, отримані в явному виді;

Ø використання байєсовских мереж дозволяє уникнути проблеми перенавчання (overfitting), тобто надмірного ускладнення моделі, що є слабкою стороною багатьох методів (наприклад, дерев рішень і нейронних мереж).

 

Наївно-байєсовський підхід має наступні недоліки:

Ø перемножувати умовну ймовірність коректно тільки тоді, коли всі вхідні змінні дійсно статистично незалежні; хоча часто даний метод показує досить добрі результати при недотриманні умови статистичної незалежності, але теоретично така ситуація повинна оброблятися складнішими методами, заснованими на навчанні байєсовских мереж [42];

Ø неможлива безпосередня обробка безперервних змінних – потрібне їх перетворення до інтервальної шкали, щоб атрибути були дискретними; проте такі перетворення іноді можуть приводити до втрати значимих закономірностей [43];

Ø на результат класифікації в наївно-байєсовському підході впливають тільки індивідуальні значення вхідних змінних, комбінований вплив пар або трійок значень різних атрибутів тут не враховується [43]. Це могло б поліпшити якість класифікаційної моделі з точки зору її прогнозуючої точності, проте, збільшило б кількість варіантів, що перевірялися.

 

Байесовська класифікація знайшла широке застосування на практиці.

 


Читайте також:

  1. II. Класифікація видатків та кредитування бюджету.
  2. V. Класифікація і внесення поправок
  3. V. Класифікація рахунків
  4. А. Структурно-функціональна класифікація нирок залежно від ступеню злиття окремих нирочок у компактний орган.
  5. Адміністративні провадження: поняття, класифікація, стадії
  6. Аналітичні процедури внутрішнього аудиту та їх класифікація.
  7. Банківська платіжна картка як засіб розрахунків. Класифікація платіжних карток
  8. Банківський кредит та його класифікація.
  9. Банківські ресурси, їх види та класифікація
  10. Будівельна класифікація ґрунтів
  11. Будівельні домкрати, їх призначення, класифікація та конструкція.
  12. Будівельні лебідки, їх призначення, класифікація та конструкція.




Переглядів: 939

<== попередня сторінка | наступна сторінка ==>
Оцінка параметра до методом крос-перевірки | Поняття, значення, завдання та джерела аналізу фінансового стану підприємства.

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

  

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.011 сек.