Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Контакти
 


Тлумачний словник
Авто
Автоматизація
Архітектура
Астрономія
Аудит
Біологія
Будівництво
Бухгалтерія
Винахідництво
Виробництво
Військова справа
Генетика
Географія
Геологія
Господарство
Держава
Дім
Екологія
Економетрика
Економіка
Електроніка
Журналістика та ЗМІ
Зв'язок
Іноземні мови
Інформатика
Історія
Комп'ютери
Креслення
Кулінарія
Культура
Лексикологія
Література
Логіка
Маркетинг
Математика
Машинобудування
Медицина
Менеджмент
Метали і Зварювання
Механіка
Мистецтво
Музика
Населення
Освіта
Охорона безпеки життя
Охорона Праці
Педагогіка
Політика
Право
Програмування
Промисловість
Психологія
Радіо
Регилия
Соціологія
Спорт
Стандартизація
Технології
Торгівля
Туризм
Фізика
Фізіологія
Філософія
Фінанси
Хімія
Юриспунденкция






Модуль 4. Закономірності розвитку сітового господарства.

Висновки

Розробка нових масштабованих алгоритмів

Алгоритм C4.5

Алгоритм C4.5 будує дерево рішень з необмеженою кількістю гілок у вузла. Даний алгоритм може працювати тільки з дискретним залежним атрибутом і тому може вирішувати тільки задачу класифікації. C4.5 вважається одним з найвідоміших і широко використовуваних алгоритмів побудови дерев класифікації.

Для роботи алгоритму C4.5 необхідне дотримання наступних вимог:

Ø Кожний запис набору даних повинен бути асоційований з одним із визначених класів, тобто один з атрибутів набору даних повинен бути міткою класу.

Ø Класи повинні бути дискретними. Кожен приклад повинен однозначно відноситися до одного з класів.

Ø Кількість класів повинно бути значно менше кількості записів у досліджуваному наборі даних.

Остання версія алгоритму – алгоритм C4.8 – реалізована в інструменті Weka як J4.8 (Java). Комерційна реалізація методу: C5.0, розроблювач RuleQuest, Австралія.

Алгоритм C4.5 повільно працює на надвеликих і зашумлених наборах даних.

Ми розглянули два відомих алгоритми побудови дерев рішень CART і C4.5. Обидва алгоритми є робастними, тобто стійкими до шумів і викидів даних.

Алгоритми побудови дерев рішень розрізняються наступними характеристиками:

Ø вид розщеплення – бінарне (binary), множинне (multi-way)

Ø критерії розщеплення – ентропія, Gini, інші

Ø можливість обробки пропущених значень

Ø процедура скорочення гілок або відсікання

Ø можливості витягу правил з дерев.

Жоден алгоритм побудови дерева не можна апріорі вважати найкращим або неповторним, підтвердження доцільності використання конкретного алгоритму повинно бути перевірено і підтверджено експериментом.

 

Найбільш серйозна вимога, що зараз пред'являється до алгоритмів конструювання дерев рішень – це масштабованість, тобто алгоритм повинен мати масштабований метод доступу до даних.

Розроблено ряд нових масштабованих алгоритмів, серед них – алгоритм Sprint, запропонований Джоном Шафером і його колегами [36]. Sprint, що є масштабованим варіантом розглянутого в лекції алгоритму CART, висуває мінімальні вимоги до обсягу оперативної пам'яті.

У лекції ми розглянули метод дерев рішень; визначити його коротко можна як ієрархічний, гнучкий засіб передбачування приналежності об'єктів до певного класу або прогнозування значень числових змінних.

Якість роботи розглянутого методу дерев рішень залежить як від вибору алгоритму, так і від набору досліджуваних даних. Незважаючи на всі переваги даного методу, варто пам'ятати, що для того, щоб побудувати якісну модель, необхідно розуміти природу взаємозв'язку між залежними і незалежними змінними та підготувати достатній набір даних.


Читайте також:

  1. II. Основні закономірності ходу і розгалуження судин великого і малого кіл кровообігу
  2. III.Цілі розвитку особистості
  3. III.Цілі розвитку особистості
  4. III.Цілі розвитку особистості
  5. IV. Закономірності структурно-функціональної організації спинного мозку
  6. Iсторiя розвитку геодезичного приладознавства
  7. V міні – модуль
  8. V Потреби та мотиви стимулюють пізнання себе та прагнення до саморозвитку.
  9. VІІІ. Проблеми та перспективи розвитку машинобудування.
  10. А. В. Петровський виділяє три стадії розвитку особистості в процесі соціалізації: адаптацію, індивідуалізацію і інтеграцію.
  11. Агроекологічні проблеми розвитку і шляхи їх розв'язання
  12. Альтернативність у реалізації стратегії розвитку підприємства




Переглядів: 569

<== попередня сторінка | наступна сторінка ==>
Алгоритми | 

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

 

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.004 сек.