Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Оцінка параметра до методом крос-перевірки

Один з варіантів оцінки параметра k – проведення крос-перевірки (Bishop, 1995).

Така процедура реалізована, наприклад, в пакеті STATISTICA (StatSoft) [39].

Крос-перевірка – відомий метод отримання оцінок невідомих параметрів моделі. Основна ідея методу – розділення вибірки даних на v "складок". V "складки" тут суть випадковим чином виділені ізольовані підвибірки.

По фіксованому значенню k будується модель k-ближчих сусідів для отримання передбачень на v-м сегменті (останні сегменти при цьому використовуються як приклади) і оцінюється помилка класифікації. Для регресійних задач найчастіше як оцінка помилки виступає сума квадратів, а для класифікаційних задач зручніше розглядати точність (відсоток коректно класифікованих спостережень).

Далі процес послідовно повторюється для всіх можливих варіантів вибору v. Після вичерпання v "складок" (циклів), обчислені помилки усереднюються і використовуються як міра стійкості моделі (тобто заходи якості передбачення в точках запиту). Вищеописані дії повторюються для різних k, і значення, відповідного найменшій помилці (або найбільшій класифікаційній точності), набуває як оптимальне (оптимальне в змісті методу крос-перевірки).

Слід враховувати, що крос-перевірка – обчислювально ємка процедура, і необхідно надати час для роботи алгоритму, особливо якщо обсяг вибірки досить великий.

Другий варіант вибору значення параметра k – самостійно задати його значення. Проте цей спосіб слід використовувати, якщо є обґрунтовані припущення відносно можливого значення параметра, наприклад, попередні дослідження схожих наборів даних.

Метод k-ближчих сусідів показує досить непогані результати в найрізноманітніших задачах.

Прикладом реального використання описаного вище методу є програмне забезпечення центру технічної підтримки компанії Dell, розроблене компанією Inference. Ця система допомагає співробітникам центру відповідати на більше число запитів, відразу пропонуючи відповіді на поширені питання і дозволяючи звертатися до бази під час розмови по телефону з користувачем. Співробітники центру технічної підтримки, завдяки реалізації цього методу, можуть відповідати одночасно на значне число дзвінків. Програмне забезпечення CBR зараз розгорнене в мережі Intranet компанії Dell.

Інструментів Data Mining, що реалізовують метод k-ближчих сусідів і CBR-метод, не дуже багато. Серед найбільш відомих: CBR Express і Case Point (Inference Corp), Apriori (Answer Systems), DP Umbrella (VYCOR Corp), KATE tools (Acknosoft, Франція), Pattern Recognition Workbench (Unica, США), а також деякі статистичні пакети, наприклад, Statistica.


Читайте також:

  1. IV. Оцінка вигідності залучення короткотермінових кредитів
  2. VII. Нахождение общего решения методом характеристик
  3. Аналіз виявлених проблем і їхня оцінка
  4. Аналіз і оцінка рівня соціальної відповідальності бізнесу
  5. Аналіз і оцінка стану охорони праці
  6. Аналіз рейтингових підходів і оцінка інвестиційної
  7. Аналіз руху грошових коштів у контексті нової фінансової звітності Важливим завданням аналізу фінансового стану підприємства є оцінка руху грошових коштів підприємства.
  8. Аналіз стану й оцінка рівня нормування праці
  9. Аналіз та оцінка виробничого травматизму в галузі
  10. Аналіз та оцінка інвестування в умовах ризику. Якісні та кількісні методи оцінювання проектних ризиків.
  11. Аналіз та оцінка організаційних структур управління
  12. Аналіз та оцінка проведеного уроку




Переглядів: 564

<== попередня сторінка | наступна сторінка ==>
Рішення задачі прогнозування | Класифікація Байєсовськая

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

  

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.02 сек.