МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах
РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ" ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах Гендерна антидискримінаційна експертиза може зробити нас моральними рабами ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів
Контакти
Тлумачний словник Авто Автоматизація Архітектура Астрономія Аудит Біологія Будівництво Бухгалтерія Винахідництво Виробництво Військова справа Генетика Географія Геологія Господарство Держава Дім Екологія Економетрика Економіка Електроніка Журналістика та ЗМІ Зв'язок Іноземні мови Інформатика Історія Комп'ютери Креслення Кулінарія Культура Лексикологія Література Логіка Маркетинг Математика Машинобудування Медицина Менеджмент Метали і Зварювання Механіка Мистецтво Музика Населення Освіта Охорона безпеки життя Охорона Праці Педагогіка Політика Право Програмування Промисловість Психологія Радіо Регилия Соціологія Спорт Стандартизація Технології Торгівля Туризм Фізика Фізіологія Філософія Фінанси Хімія Юриспунденкция |
|
|||||||||||||||||||||
Погана візуалізаціяЗадача візуалізації Методи прогнозування Методи Data Mining, за допомогою яких вирішуються задачі прогнозування, будуть розглянуті в другому розділі курсу. Серед розповсюджених методів Data Mining, що використовуються для прогнозування, відзначимо нейронні мережі і лінійну регресію. Вибір методу прогнозування залежить від багатьох факторів, у тому числі від параметрів прогнозування. Вибір методу варто робити з врахуванням всіх специфічних особливостей набору ретроспективних даних і цілей, з якими він будується. Програмне забезпечення Data Mining, що використовується для прогнозування, повинне забезпечувати користувача точним і достовірним прогнозом. Однак одержання такого прогнозу залежить не тільки від програмного забезпечення і методів, закладених у його основу, але також і від інших факторів, серед яких повнота і достовірність вихідних даних, своєчасність і оперативність їх поповнення, кваліфікація користувача.
Візуалізація –це інструментарій, що дозволяє побачити кінцевий результат обчислень, організувати керування обчислювальним процесом і навіть повернутися назад до вихідних даних, щоб визначити найбільш раціональний напрямок подальшого руху [25]. Із задач візуалізації можна докладно ознайомитися за матеріалами конференцій, серед яких, наприклад, CHI і ACM-SIGGraph, а також у періодичній літературі, зокрема, за матеріалами журналу "IEEE Trans. visualization and computer graphics". У результаті використання візуалізації створюється графічний образ даних. Застосування візуалізації допомагає в процесі аналізу даних побачити аномалії, структури, тренди. При розгляді задач прогнозування ми використали графічне подання тимчасового ряду і побачили, що в ньому є присутній сезонний компонент. У попередній лекції ми розглядали задачу класифікації і кластеризації, і для ілюстрації розподілу об'єктів у двомірному просторі також використали візуалізацію. Можна говорити про те, що застосування візуалізації є більше економічним: лінія тренда або скупчення крапок на діаграмі розсіювання дозволяє аналітикові набагато швидше визначити закономірності і прийти до потрібного рішення. Таким чином, тут мова йде про використання в Data Mining не символів, а образів. Головна перевага візуалізації – практично повна відсутність необхідності в спеціальній підготовці користувача. За допомогою візуалізації ознайомитися з інформацією дуже легко, досить усього лише кинути на неї погляд. Хоча найпростіші види візуалізації з'явилися досить давно, її використання зараз тільки набирає силу. Візуалізації не спрямована винятково на вдосконалювання техніки аналізу – за словами Скотта Лейбса, у деяких випадках візуалізація може навіть замінити його. Візуалізації даних може бути представлена у вигляді: графіків, схем, гістограм, діаграм і т.д. Коротко роль візуалізації можна описати такими її можливостями: Ø підтримка інтерактивного і погодженого дослідження; Ø допомога в представленні результатів; Ø використання очей (зору), щоб створювати зорові образи і осмислювати їх.
Результати візуалізації іноді можуть приводити користувача в оману. Приведемо простий приклад поганої візуалізації. Припустимо, ми маємо базу "Прибуток компанії А" за період з 2003 по 2008 рік, вона представлена в табличному виді в таблиці 6.1.
Таблиця 6.1. Прибуток компанії А
Побудуємо гістограму в Excel за цим даними. Гістограма являє собою візуальне зображення розподілу даних. Ця інформація відображається за допомогою серії прямокутників або смуг однакової ширини, висота яких вказує кількість даних у кожному класі. Використовуючи всі значення побудови графіка, прийняті за замовчуванням, одержуємо гістограму, наведену на мал. 6.4.
Рис. 6.4. Гістограма, мінімальне значення осі y дорівнює 1096
Даний малюнок демонструє значне зростання прибутку компанії А за період з 2003 по 2008 рік. Однак, якщо ми звернемо увагу на вісь y, що показує величину прибутку, то побачимо, що ця вісь перетинає вісь x у значенні, рівному 1096. Фактично, вісь y зі значеннями від 1096 до 1108 вводить користувача в оману. Змінивши значення параметрів, відповідальних за формат осі y, одержуємо графік, наведений на рис. 6.5.
Рис. 6.5. Гістограма, мінімальне значення осі y дорівнює 0
Вісь у зі значеннями від 0 до 2000 дає користувачеві правильну інформацію про незначну зміну прибутку компанії. Якщо мова йде про велику розмірність і складність вихідних даних, засоби візуалізації забезпечують їх різке зменшення, конденсуючи, мільйони записів даних у прості, легкі для розуміння і маніпулювання подання [26]. Такі подання називають візуальним або графічним способом подання інформації. Візуалізацію можна вважати ключовим фактором у дослідженні даних, отриманих за допомогою інструментів Data Mining. У таких випадках говорять про візуальний Data Mining. Методи візуалізації, серед яких подання інформації в одно-, дво-, тривимірному і більше вимірах, а також інші способи відображення інформації, наприклад, паралельні координати, "лице Чернова", будуть розглянуті в наступному розділі курсу. Читайте також:
|
||||||||||||||||||||||
|