Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



МЕТОД K-найближчих| СУСІДІВ

Метод до-найближчих сусідів для вирішення завдань|задач| аналізу дискримінанта був вперше|уперше| запропонований ще в 1952 році. Він полягає в наступному|слідуючому|.

При класифікації невідомого об'єкту знаходиться|перебуває| задане число (k) геометрично найближчих до нього в просторі|простір-час| ознак інших об'єктів (найближчих сусідів) з|із| вже відомою приналежністю до розпізнаваних класів. Рішення про віднесення невідомого об'єкту до того або іншого діагностичного класу приймається шляхом аналізу інформації про цю відому приналежність його найближчих сусідів, наприклад, за допомогою простого підрахунку голосів.

Спочатку метод до-найближчих сусідів розглядався як непараметричний метод оцінювання відношення правдоподібності. Для цього методу отримані теоретичні оцінки його ефективності порівняно з оптимальним байесовским класифікатором. Доведено, що асимптотична вірогідність помилки для методу до-найближчих сусідів перевищує помилки правила Байеса не більше ніж в два рази.

Як наголошувалося вище, в реальних задачіх|задачах| часто доводиться оперувати об'єктами, які описуються великою кількістю якісних (дихотомічних) ознак. При цьому розмірність простору|простір-час| ознак соизмерима| або перевищує об'єм|обсяг| досліджуваної вибірки. У таких умовах зручно інтерпретувати кожен об'єкт навчальної вибірки, як окремий лінійний класифікатор. Тоді той або інший діагностичний клас представляється не одним прототипом, а набором лінійних класифікаторів. Сукупна взаємодія лінійних класифікаторів дає у результаті кусочно-лінійну поверхню, що розділяє в просторі|простір-час| ознак розпізнавані класи. Вигляд|вид| розділяючої поверхні, що складається з шматків гіперплощин, може бути всіляким|різноманітним| і залежить від взаємного розташування совокупностей|, що класифікуються.

Також можна використовувати іншу інтерпретацію механізмів класифікації за правилом до-найближчих сусідів. У її основі лежить уявлення про існування деяких латентних змінних, абстрактних або зв'язаних яким-небудь перетворенням з|із| вихідним|початковим| простором|простір-час| ознак. Якщо в просторі|простір-час| латентних змінних попарні відстані між об'єктами такі ж, як і в просторі|простір-час| вихідних|початкових| ознак, і кількість цих змінних значно менше числа об'єктів, то інтерпретація методу до-найближчих сусідів може розглядатися|розглядувати| під кутом зору порівняння непараметричних оцінок щільності розподілу умовної вірогідності|ймовірності|. Приведене тут уявлення про латентні змінні близько|поблизу| за своєю суттю до уявлення про дійсну розмірність і інших вистав|подань|, використовуваних в різних методах зниження розмірності.

При використанні методу до-найближчих сусідів для розпізнавання образів дослідникові доводиться вирішувати складну проблему вибору метрики для визначення близькості об'єктів, що діагностуються. Ця проблема в умовах високої розмірності простору ознак надзвичайно загострюється унаслідок достатньої трудомісткості даного методу, яка стає значимою навіть для високопродуктивних комп'ютерів. Тому тут так само, як і в методі порівняння з прототипом, необхідно вирішувати творчу задачу аналізу багатовимірної структури експериментальних даних для мінімізації числа об'єктів, що представляють діагностичні класи.

На думку авторів необхідність зменшення числа об'єктів в повчальній вибірці (діагностичних прецедентів) є недоліком|нестачею| даного методу, оскільки зменшує показність навчальної вибірки.

2.2.2.3. АЛГОРИТМИ ОБЧИСЛЕННЯ|підрахунку| ОЦІНОК (ГОЛОСУВАННЯ)

Принцип дії алгоритмів обчислення|підрахунку| оцінок (АВО|) полягає в обчисленні|підрахунку| пріоритеті (оцінок схожості), що характеризують “близькість” розпізнаваного і еталонних об'єктів за системою ансамблів ознак, що є системою підмножин заданої множинаі ознак.

На відміну від всіх раніше розглянутих|розглядувати| методів алгоритми обчислення|підрахунку| оцінок принципово по-новому оперують описами об'єктів. Для цих алгоритмів об'єкти існують одночасно в самих різних підпросторах|простір-час| простору|простір-час| ознак. Клас АВО доводить ідею використання ознак до логічного кінця: оскільки не завжди відомо, які поєднання ознак найбільш інформативні, то в АВО міра|ступінь| схожості об'єктів обчислюється|вичисляє| при зіставленні всіх можливих або визначених поєднань ознак, що входять в описи об'єктів [46].

Використовувані поєднання ознак (підпростори|простір-час|) автори називають опорною множиначю|множиною| або множиначю часткових описів об'єктів. Вводиться|запроваджує| поняття узагальненої близькості між розпізнаваним об'єктом і об'єктами навчальної вибірки (з|із| відомою класифікацією), які називають еталонними об'єктами. Ця близькість представляється комбінацією близостей| розпізнаваного об'єкту з|із| еталонними об'єктами, обчислених|вичисляти| на множинаі|множині| часткових описів. Таким чином, АВО є розширенням методу до-найближчих сусідів, в якому близькість об'єктів розглядається|розглядує| лише|тільки| в одному заданому просторі|простір-час| ознак.

Ще одним розширенням АВО є те, що в даних алгоритмах задачі|задача| визначення схожості і відмінності об'єктів формулюється як параметрична і виділений етап налаштування АВО по повчальній вибірці, на якому підбираються оптимальні значення введених|запроваджувати| параметрів. Критерієм якості служить помилка розпізнавання, а параметризується буквально все:

правила обчислення|підрахунку| близькості об'єктів по окремих ознаках

правила обчислення|підрахунку| близькості об'єктів в підпросторах|простір-час| ознак

міра|ступінь| важливості того або іншого еталонного об'єкту як діагностичного прецеденту

значущість вкладу|внеску| кожної опорної множинаі ознак в підсумкову оцінку схожості розпізнаваного об'єкту з|із| яким-небудь діагностичним класом.

Параметри АВО задаються у вигляді значень порогів і (або) як ваги вказаних складових.

Теоретичні можливості АВО перевищують або, принаймні, не нижче за можливості будь-якого іншого алгоритму розпізнавання образів, оскільки за допомогою АВО можуть бути реалізовані всі гадані операції з досліджуваними об'єктами. Але, як це зазвичай буває, розширення потенційних можливостей натрапляє на великі труднощі їх практичного втілення, особливо на етапі побудови (налаштування) алгоритмів даного типа. Окремі труднощі наголошувалися раніше при обговоренні методу до-найближчих сусідів, який можна було інтерпретувати як усічений варіант АВО. Його теж можна розглядати в параметричному вигляді і звести задачі до пошуку зваженої метрики вибраного типа. В той же час вже тут для високорозмірних завдань виникають складні теоретичні питання і проблеми, пов'язані з організацією ефективного обчислювальному процесу. Для АВО, якщо спробувати використовувати потенційні можливості даних алгоритмів в повному об'ємі, вказані труднощі зростають багато разів.

Відмічені проблеми пояснюють|тлумачать| те, що на практиці вживання|застосування| АВО для вирішення високорозмірних завдань|задач| супроводиться|супроводжується| введенням|вступом| яких-небудь евристичних обмежень і допущень. Зокрема, відомий приклад|зразок| використання АВО в психодіагностиці, в якому апробований різновид АВО, фактично еквівалентний методу до-найближчих сусідів.


Читайте також:

  1. D) методу мозкового штурму.
  2. H) інноваційний менеджмент – це сукупність організаційно-економічних методів управління всіма стадіями інноваційного процесу.
  3. I Метод Шеннона-Фано
  4. I. Метод рiвних вiдрiзкiв.
  5. VII. Нахождение общего решения методом характеристик
  6. А. науковий факт, b. гіпотеза, с. метод
  7. Автоматизація водорозподілу на відкритих зрошувальних системах. Методи керування водорозподілом. Вимірювання рівня води. Вимірювання витрати.
  8. Агрегативна стійкість, коагуляція суспензій. Методи отримання.
  9. АгротехнІЧНИЙ метод
  10. Адаптовані й специфічні методи дослідження у журналістикознавстві
  11. Адміністративні (прямі) методи регулювання.
  12. Адміністративні методи - це сукупність прийомів, впливів, заснованих на використанні об'єктивних організаційних відносин між людьми та загальноорганізаційних принципів управління.




Переглядів: 2466

<== попередня сторінка | наступна сторінка ==>
МЕТОДИ, ЗАСНОВАНІ НА ОЦІНКАХ ЩІЛЬНОСТІ РОЗПОДІЛУ ЗНАЧЕНЬ ОЗНАК | Принципи побудови системи інформаційної безпеки об'єкту

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

  

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.015 сек.