Новини освіти і науки:

Тлумачний словник
Авто
Автоматизація
Архітектура
Астрономія
Аудит
Біологія
Будівництво
Бухгалтерія
Винахідництво
Виробництво
Військова справа
Генетика
Географія
Геологія
Господарство
Держава
Дім
Екологія
Економетрика
Економіка
Електроніка
Журналістика та ЗМІ
Зв'язок
Іноземні мови
Інформатика
Історія
Комп'ютери
Креслення
Кулінарія
Культура
Лексикологія
Література
Логіка
Маркетинг
Математика
Машинобудування
Медицина
Менеджмент
Метали і Зварювання
Механіка
Мистецтво
Музика
Населення
Освіта
Охорона безпеки життя
Охорона Праці
Педагогіка
Політика
Право
Програмування
Промисловість
Психологія
Радіо
Регилия
Соціологія
Спорт
Стандартизація
Технології
Торгівля
Туризм
Фізика
Фізіологія
Філософія
Фінанси
Хімія
Юриспунденкция

Web Mining

Web Mining можна перевести як "видобуток даних в Web". Web Intelligence або Web Інтелект готовий "відкрити нову главу" у стрімкому розвитку електронного бізнесу. Здатність визначати інтереси та переваги кожного відвідувача, спостерігаючи за його поводженням, є серйозною та критичною перевагою конкурентної боротьби на ринку електронної комерції.

Системи Web Mining можуть відповісти на багато питань, наприклад, хто з відвідувачів є потенційним клієнтом Web-магазина, яка група клієнтів Web-магазина приносить найбільший доход, які інтереси певного відвідувача або групи відвідувачів.

Технологія Web Mining охоплює методи, які здатні на основі даних сайту виявити нові, раніше невідомі знання і які надалі можна буде використати на практиці. Інакше кажучи, технологія Web Mining застосовує технологію Data Mining для аналізу неструктурованої, неоднорідної, розподіленої і значної по обсягу інформації, що міститься на Web-вузлах.

Відповідно до таксономії Web Mining [31], тут можна виділити два основних напрямки: Web Content Mining та Web Usage Mining.

Web Content Mining має на увазі автоматичний пошук і витяг якісної інформації з різноманітних джерел Інтернету, перевантажених "інформаційним шумом". Тут також мова йде про різні засоби кластеризації та анотуванні документів.

У цьому напрямку, в свою чергу, виділяють два підходи: підхід, заснований на агентах, і підхід, заснований на базах даних.

Підхід, заснований на агентах (Agent Based Approach), включає такі системи:

Ø інтелектуальні пошукові агенти (Intelligent Search Agents);

Ø фільтрація інформації / класифікація;

Ø персоніфіковані агенти мережі.

Приклади систем інтелектуальних агентів пошуку:

Ø Harvest (Brown та ін., 1994),

Ø FAQ-Finder (Hammond та ін., 1995),

Ø Information Manifold (Kirk та ін., 1995),

Ø OCCAM (Kwok and Weld, 1996), and ParaSite (Spertus, 1997),

Ø ILA (Information Learning Agent) (Perkowitz and Etzioni, 1995),

Ø ShopBot (Doorenbos та ін., 1996).

Підхід, заснований на базах даних (Database Approach), включає системи:

Ø багаторівневі бази даних;

Ø системи web-запитів (Web Query Systems);

Приклади систем web-запитів:

Ø W3QL (Konopnicki й Shmueli, 1995),

Ø WebLog (Lakshmanan та ін., 1996),

Ø Lorel (Quass та ін., 1995),

Ø UnQL (Buneman та ін., 1995 and 1996),

Ø TSIMMIS (Chawathe та ін.., 1994).

Другий напрямок Web Usage Mining має на увазі виявлення закономірностей у діях користувача Web-вузла або їхньої групи.

Аналізується наступна інформація:

Ø які сторінки переглядав користувач;

Ø яка послідовність перегляду сторінок.

Аналізується також, які групи користувачів можна виділити серед загального їх числа на основі історії перегляду Web-вузла.

Web Usage Mining включає наступні складові:

Ø попередня обробка;

Ø операційна ідентифікація;

Ø інструменти виявлення шаблонів;

Ø інструменти аналізу шаблонів.

При використанні Web Mining перед розроблювачами виникає два типи завдань. Перша стосується збору даних, друга – використання методів персоніфікації. У результаті збору деякого обсягу персоніфікованих ретроспективних даних про конкретного клієнта, система накопичує певні знання про нього та може рекомендувати йому, наприклад, певні набори товарів або послуг. На основі інформації про всіх відвідувачів сайту Web-система може виявити певні групи відвідувачів і також рекомендувати їм товари або ж пропонувати товари в розсиланнях.

Задача Web Mining згідно [31] можна підрозділити на такі категорії:

Ø Попередня обробка даних для Web Mining.

Ø Виявлення шаблонів і відкриття знань з використанням асоціативних правил, часових послідовностей, класифікації і кластеризації;

Ø Аналіз отриманого знання.

Text Mining

Text Mining охоплює нові методи для виконання семантичного аналізу текстів, інформаційного пошуку і керування. Синонімом поняття Text Mining є KDT (Knowledge Discovering in Text – пошук або виявлення знань у тексті).

На відміну від технології Data Mining, що передбачає аналіз впорядкованої в якісь структури інформації, технологія Text Mining аналізує більші та надвеликі масиви неструктурованої інформації.

Програми, що реалізують це завдання, повинні деяким чином оперувати природною людською мовою та при цьому розуміти семантику аналізованого тексту. Один з методів, на якому засновані деякі Text Mining системи, – пошук так називаної підстроки в рядку.

Call Mining

За словами Єнн Беднарц [32], "видобуток дзвінків" може стати популярним інструментом корпоративних інформаційних систем.

Технологія Call Mining поєднує в себе розпізнавання мови, її аналіз і Data Mining. Її ціль – спрощення пошуку в аудіо-архівах, що містить записи переговорів між операторами та клієнтами. За допомогою цієї технології оператори можуть виявляти недоліки в системі обслуговування клієнтів, знаходити можливості збільшення продажу, а також виявляти тенденції в зверненнях клієнтів.

Серед розроблювачів нової технології Call Mining ("видобуток" та аналіз дзвінків) – компанії CallMiner, Nexidia, ScanSoft, Witness Systems. У технології Call Mining розроблено два підходи – на основі перетворення мови в текст і на базі фонетичного аналізу.

Прикладом реалізації першого підходу, заснованого на перетворенні мови, є система CallMiner. У процесі Call Mining спочатку використовується система перетворення мови, потім слідує її аналіз, у ході якого залежно від змісту розмов формується статистика телефонних викликів. Отримана інформація зберігається в базі даних, у якій можливий пошук, витяг та обробка.

Приклад реалізації другого підходу – фонетичного аналізу – продукція компанії Nexidia. При цьому підході мова розбивається на фонеми, що є звуками або їхніми сполученнями. Такі елементи утворюють розпізнавані фрагменти. При пошуку певних слів та їх сполучень система ідентифікує їх з фонемами.

Аналітики відзначають, що за останні роки інтерес до систем на основі Call Mining значно зріс. Це пояснюється тим фактом, що менеджери вищої ланки компаній, що працюють у різних сферах, у т.ч. в області фінансів, мобільного зв'язку, авіабізнесу, не хочуть витрачати багато часу на прослуховування дзвінків з метою узагальнення інформації або ж виявлення яких-небудь фактів порушень.

За словами Деніела Хонг, аналітика компанії Datamonitor: "Використання цих технологій підвищує оперативність і знижує вартість обробки інформації".

Типова інсталяція продукції від розроблювача Nexidia обходиться в суму від 100 до 300 тис. дол. Вартість впровадження системи CallMiner по перетворенню мови та набору аналітичних додатків становить близько 450 тис. дол.

На думку Шолера, додатки Audio Mining та Video Mining знайдуть згодом набагато більш широке застосування, наприклад, при індексації навчальних відеофільмів і презентацій у медіабібліотеках компаній. Однак технології Audio Mining та Video Mining перебувають в даний час на рівні становлення, а практичне їх застосування – на самій початковій стадії.

Читайте також:

<== попередня сторінка	\|	наступна сторінка ==>
Застосування Data Mining в CRM	\|	Звіти як окремі об’єкти в Access 2000

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

Генерація сторінки за: 0.015 сек.