Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Типи набору даних

Шкали

Основні методи дослідження носа.

Обстеження хворого із захворюванням носа та приносових пазух починають з бесіди з ним, під час якої з’ясовують:

- скарги пацієнта,

- історію даного захворювання,

- інші перенесені захворювання (анамнез).

Потім виконують об’єктивне обстеження носа та приносових пазух і проводять функціональні дослідження.

Скарги, яки примусили хворого звернутись за допомогою. Можуть включати:

- біль у зовнішньому носі чи навколишніх ділянках,

- утруднення носового дихання однією чи обома половинами носа,

- виділення з носа, що бувають серозного, слизового, гнійного, кров’янистого чи змішаного характеру,

- зниження нюху чи його повна відсутність,

- поява неприємного запаху, який відчуває сам хворий або оточуючі,

- наявність головного болю, підвищення температури тіла.

Об’єктивнедослідження включає:

- зовнішній огляд

- пальпацію і перкусію носа та навколишніх ділянок,

- визначення дихальної та нюхової функції носа,

- проведення передньої та задньої риноскопії,

- зондування гудзиковим зондом носових ходів і хоан.

Додаткові методи обстеження:

- лабораторні аналізи крові, сечі,

- посів на флору і чутливість до антибіотиків виділень з носа,

- пункцію приносових пазух,

- діафаноскопію,

- рентгенологічні методи обстеження,

- гістологічне дослідження

- и т. д .

Існує п'ять типів шкал вимірів: номінальна, порядкова, інтервальна, відносна і дихотомічна.

 

Номінальна шкала (nominal scale) – шкала, що містить тільки категорії; дані в ній не можуть упорядковуватися, з ними не можуть бути зроблені ніякі арифметичні дії.

Номінальна шкала складається з назв, категорій, імен для класифікації і сортування об'єктів або спостережень по деякій ознаці.

Приклад такої шкали: професії, місто проживання, родинний стан.

Для цієї шкали застосовні тільки такі операції: дорівнює (=), не дорівнює (¹).

Порядкова шкала (ordinal scale) – шкала, у якій числа присвоюють об'єктам для позначення відносної позиції об'єктів, але не величини розходжень між ними.

Шкала вимірів дає можливість ранжувати значення змінних. Виміри у порядковій шкалі містять інформацію тільки про порядок проходження величин, але не дозволяють сказати "наскільки одна величина більше іншої", або "наскільки вона менше іншої".

Приклад такої шкали: місце (1, 2, 3-е), що команда одержала на змаганнях, номер студента в рейтингу успішності (1-й, 23-й, і т.д.), при цьому невідомо, наскільки один студент успішніший за іншого, відомий лише його номер у рейтингу.

Для цієї шкали застосовуються тільки такі операції: дорівнює (=), не дорівнює (¹), більше (>), менше (<).

Інтервальна шкала (interval scale) – шкала, різниці між значеннями якої можуть бути обчислені, однак їхні відношення не мають змісту.

Ця шкала дозволяє знаходити різницю між двома величинами, має властивості номінальної та порядкової шкал, а також дозволяє визначити кількісну зміну ознаки.

Приклад такої шкали: температура води у морі зранку – 19 градусів, увечері – 24, тобто вечірня на 5 градусів вище, але не можна сказати, що вона в 1,26 разів вище.

Номінальна і порядкова шкали є дискретними, а інтервальна шкала – неперервною, вона дозволяє здійснювати точні виміри ознаки і робити арифметичні операції додавання (+), віднімання (–), множення (*), ділення (/).

Для цієї шкали застосовуються тільки такі операції: дорівнює (=), не дорівнює (¹), більше (>), менше (<), операції додавання (+) і віднімання (–).

Відносна шкала (ratio scale) – шкала, у якій є певна точка відліку та можливі відносини між значеннями шкали.

Приклад такої шкали: вага новонародженої дитини (4 кг й 3 кг). Перший в 1,33 рази важчий.

Ціна на картоплю у супермаркеті в 1,2 рази вища, від ціни на базарі.

Відносні та інтервальні шкали є числовими.

Для цієї шкали застосовуються тільки такі операції: дорівнює (=), не дорівнює (¹), більше (>), менше (<), операції додавання (+) і віднімання (–), множення (*) і ділення (/).

Дихотомічна шкала (dichotomous scale) – шкала, що містить тільки дві категорії.

Приклад такої шкали: стать (чоловіча та жіноча).

Приклад використання різних шкал для вимірів властивостей різних об'єктів, у цьому випадку температурних умов, наведений у таблиці даних, зображеної в таблиці 2.2.

 

Таблиця 2.2. Безліч вимірів властивостей різних об'єктів

Номер об'єкта Професія (номінальна шкала) Середній бал (інтервальна шкала) Освіта (порядкова шкала)
слюсар середня
вчений вища
вчитель вища

 

Приклад використання різних шкал для вимірів властивостей однієї системи, у цьому випадку температурних умов, наведено у таблиці даних, зображеної в таблиці 2.3.

 

Таблиця 2.3. Безліч вимірів властивостей однієї системи

Дата виміру Хмарність (номінальна шкала) Температура у 8 годині ранку (інтервальна шкала) Сила вітру (порядкова шкала)
1 вересня хмарно 22°С Вітер сильний
2 вересня похмуро 17°С Вітер слабкий
3 вересня ясно 23°С Вітер дуже сильний

 

Висновки. У цій частині лекції ми розглянули поняття даних, об'єкта та атрибута, їхньої характеристики.

Також ми обговорили типи шкал. Номінальна шкала описує об'єкти або спостереження в термінах якісних ознак. На один крок далі йдуть порядкові шкали, що дозволяють упорядковувати спостереження або об'єкти по певній характеристиці. Інтервальні та відносні шкали більш складні, у них можливе визначення кількісного значення ознаки.

 

 

 

Дані, що складаються із записів

Дані, які найбільш часто зустрічаються – дані, що складаються із записів (record data). Приклади таких наборів даних: табличні дані, матричні дані, документальні дані, транзакційні або операційні.

Табличні дані – дані, що складаються із записів, кожний з яких складається з фіксованого набору атрибутів.

Транзакційні дані представляють особливий тип даних, де кожен запис є транзакцією, включає набір значень.

Приклад транзакційної бази даних, що містить перелік покупок клієнтів магазину, наведений на рис. 2.1.

 

Рис. 2.1. Приклад транзакційних даних

 

Графічні дані

Приклади графічних даних: WWW-дані; молекулярні структури; графи (рис. 2.2); карти.

 

Рис. 2.2. Приклад графа

 

За допомогою карт, наприклад, можна відстежити зміни об'єктів у часі та просторі, визначити характер їхнього розподілу на площині або в просторі. Перевагою графічного подання даних є більша простота їх сприйняття, чим, наприклад, табличних даних.

Приклад карти, що є картою Кохонена (моделлю нейронних мереж, які будуть розглянуті в одній з лекцій нашого курсу), представлений на рис. 2.3.

 

Рис. 2.3. Приклад даних типу "Карта Кохонена"

 

Хімічні дані

Хімічні дані являють собою особливий тип даних. Приклад таких даних: Benzene Molecule: C6H6 (рис. 2.4)

 

Рис. 2.4. Приклад хімічних даних

 

Відповідно до опитування на сайті Kdnuggets, www.kdnuggets.com (квітень, 2004 р.) "Типи аналізованих даних", найбільше число опитаних аналізує дані з "плоских" (flat table) і реляційних таблиць (26% та 24% відповідно), далі ідуть часові ряди (14%) і дані у вигляді тексту (11%).

Інші аналізовані типи даних у порядку спадання: web-контенти, XML, графіка, аудіо, відео та ін.

В даній та у наступних лекціях приводяться результати опитувань, проведених на сайті Kdnuggets, який визнаний одним з найбільш авторитетних і відомих сайтів у сфері Data Mining.

 

4. Формати зберігання даних

 

Одна з основних особливостей даних сучасного світу полягає в тому, що їх стає дуже багато. Можливі чотири аспекти роботи з даними: визначення даних, обчислення, маніпулювання та обробка (збір, передача та ін.).

При маніпулюванні даними використовується структура даних типу "файл". Файли можуть мати різні формати.

Як уже було відзначено раніше, більшість інструментів Data Mining дозволяють імпортувати дані з різних джерел, а також експортувати результуючі дані в різні формати.

Дані для експериментів зручно зберігати в якомусь одному форматі.

У деяких інструментах Data Mining ці процедури називаються імпорт/експорт даних, інші дозволяють прямо відкривати різні джерела даних і зберігати результати Data Mining в одному із запропонованих форматів.

Найпоширеніші формати, відповідно до запиту "Формати зберігання даних", представлені на рис. 2.5.

 

Рис. 2.5. Найпоширеніші формати зберігання даних

 

Найбільше число опитаних (23%) воліють зберігати дані у форматі тієї бази даних, що вони використовують. У форматі Text, CSV – 18%, по 14% опитані зберігають дані у форматі Text, space or tab separated та SAS; у форматі Excel – 9%, SPSS – 8%, S-Plus/R – 4%, Weka ARFF – 6%, в інших форматах інструментів Data Mining – 2%.

Як бачимо з результатів опитування, найпоширенішим форматом зберігання даних для Data Mining виступають бази даних.

 

5. Бази даних. Основні положення

 

Для розуміння організації даних у базі даних необхідне знання основних положень теорії баз даних. Розглянемо деякі положення цієї теорії.

База даних (Database) – це особливим чином організовані та збережені в електронному виді дані.

Особливим чином організовані означає, що дані організовані певним конкретним методом, здатним полегшити їхній пошук і доступ до них для одного або декількох додатків. Також така організація даних передбачає наявність мінімальної надмірності даних.

Бази даних є однією з різновидностей інформаційних технологій, а також формою зберігання даних.

Метою створення баз даних є побудова такої системи даних, яка б не залежала від програмного забезпечення, застосовуваних технічних засобів і фізичного розташування даних в ЕОМ. Побудова такої системи даних повинно забезпечувати несуперечливу та цілісну інформацію. При проектуванні бази даних передбачається багатоцільове її використання.

База даних у найпростішому випадку представляється у вигляді системи двовимірних таблиць.

Схема даних – опис логічної структури даних, специфіковане на мові опису даних та оброблюваній СУБД.

Схема користувача – зафіксований для конкретного користувача один варіант порядку полів таблиці.

Системи керування базами даних, СУБД

Система керування базою даних – це програмне забезпечення, що контролює організацію, зберігання, цілісність, внесення змін, читання і безпеку інформації в базі даних.

СУБД (Database Management System, DBMS) являє собою оболонку, за допомогою якої при організації структури таблиць і заповнення їх даними виходить та або інша база даних.

Система керування реляційними базами даних (Relational Database Management System) – це СУБД, заснована на реляційній моделі даних.

У реляційній моделі даних будь-яке представлення даних зводиться до сукупності реляційних таблиць (двовимірних таблиць особливого типу). Системи керування реляційними базами даних використовують для побудови сховищ даних.

СУБД має програмні, технічні та організаційні складові.

Програмні засоби включають систему керування, що забезпечує ввід-вивід, обробку і зберігання інформації, створення, модифікацію та тестування бази даних. Внутрішніми мовами програмування СУБД є мови четвертого покоління (C, C++, Pascal, Object Pascal). За допомогою мов БД створюються додатки, бази даних та інтерфейс користувача, що включає екранні форми, меню, звіти.

Аналітикові при необхідності роботи з конкретною СУБД, зокрема, при експорті даних у середовище інструмента Data Mining, варто вивчити особливості цієї СУБД. Так, наприклад, у базі даних СУБД FoxPro всі таблиці та запити бази даних фізично зберігаються в окремих файлах, які поєднуються в одному проекті. У СУБД Access всі таблиці бази даних зберігаються в одному файлі.

Для роботи з конкретною базою даних, у тому числі з метою аналізу, аналітикові бажано знати опис всіх таблиць та їх структур (атрибутів, типів даних), кількість записів у таблиці, а також зв'язку між таблицями. Іноді для цих цілей використовується словник даних.

До баз даних, а також до СУБД пред'являються такі вимоги:

1. висока швидкодія;

2. простота відновлення даних;

3. незалежність даних;

4. можливість багатокористувацького використання даних;

5. безпека даних;

6. стандартизація побудови та експлуатації БД (фактично СУБД);

7. адекватність відображення даних відповідній предметній області;

8. дружелюбний інтерфейс користувача.

 

Висока швидкодія передбачає малий час відгуку, тобто малий проміжок часу від моменту запиту до бази даних до моменту реального одержання даних.

Незалежність даних – це можливість зміни логічної та фізичної структури бази даних без зміни представлень користувачів.

Незалежність даних забезпечує мінімальні зміни структури бази даних при змінах стратегії доступу до даних і структури самих вихідних даних. Ці зміни повинні бути передбачені на етапах концептуального і логічного проектування бази даних із забезпеченням мінімальних змін на етапі фізичного її проектування.

Безпека даних – це захист даних від навмисного або ненавмисного порушення таємності, перекручування або руйнування. Безпека включає два компоненти: цілісність і захист даних від несанкціонованого доступу.

Цілісність даних – стійкість збережених даних до руйнування та знищення, пов'язаних з несправностями технічних засобів, системними помилками і помилковими діями користувачів.

Цілісність даних – точність та валідність даних. Цілісність даних припускає: відсутність неточно введених даних, захист від помилок при відновленні баз даних; неможливість видалення (або каскадне видалення) зв'язаних даних різних таблиць; збереження даних при збоях техніки (можливість відновлення даних) і ін.

Захист даних від несанкціонованого доступу припускає обмеження доступу до певних даних бази та досягається введенням мір безпеки: розмежування прав доступу до даних різних користувачів залежно від виконуваних ними функцій і/або посадових обов'язків; введенням захисту у вигляді паролів; використанням представлень, тобто таблиць, які є похідними від вихідних і призначені для роботи конкретних користувачів для вирішення конкретних завдань.

Стандартизація забезпечує наступність поколінь конкретної СУБД, спрощує взаємодію баз даних одного покоління СУБД із однаковими та різними моделями даних.

СУБД відповідає за обробку запитів до бази даних та одержання відповіді. Способи зберігання даних можуть бути різними: модель даних може бути як реляційною, так і багатомірною, мережевою або ієрархічною.

 

6. Класифікація видів даних

 

Реляційні дані – це дані з реляційних баз (таблиць).

Багатомірні дані – це дані, представлені в кубах OLAP.

Вимір (dimension) або вісь – у багатомірних даних – це збори даних того самого типу, що дозволяють структурувати багатомірну базу даних.

За критерієм постійності своїх значень у ході вирішення завдання дані можуть бути:

Ø змінними;

Ø постійними;

Ø умовно-постійними.

Змінні дані – це такі дані, які змінюють свої значення в процесі вирішення завдання.

Постійні дані – це такі дані, які зберігають свої значення в процесі вирішення завдання (математичні константи, координати нерухомих об'єктів) і не залежать від зовнішніх факторів.

Умовно-постійні дані – це такі дані, які можуть іноді змінювати свої значення, але ці зміни не залежать від процесу вирішення завдання, а визначаються зовнішніми факторами.

 

Дані, залежно від тих функцій, які вони виконують, можуть бути довідковими, оперативними, архівними.

Варто розрізняти дані за період і точкові дані. Ці розходження важливі при проектуванні системи збору інформації, а також у процесі вимірів.

Ø дані за період;

Ø точкові дані.

Дані за період характеризують деякий період часу. Прикладом даних за період можуть бути: прибуток підприємства за місяць, середня температура за місяць.

Точкові дані представляють значення деякої змінної в конкретний момент часу. Приклад крапкових даних: залишок на рахунку на перше число місяця, температура о восьмій годині ранку.

Дані бувають первинними та вторинними. Вторинні дані – це дані, які є результатом певних обчислень, що застосовуються до первинних даних. Вторинні дані, як правило, приводять до прискореного одержання відповіді на запит користувача за рахунок збільшення обсягу збереженої інформації.

 

Метадані

У завершення лекції про дані розглянемо поняття метаданих.

Метадані (Metadate) – це дані про дані.

До складу метаданих можуть входити: каталоги, довідники, реєстри.

Метадані містять відомості про склад даних, змісті, статусі, походженні, місцезнаходженні, якості, форматах і формах подання, умовах доступу, придбання і використання, авторських, майнових і суміжних з ними правах на дані та ін.

Метадані – важливе поняття в керуванні сховищем даних.

Метадані, застосовуються при керуванні сховищем, містять інформацію, необхідну для його настроювання та використання. Розрізняють бізнес-метадані і оперативні метадані.

Бізнес-метадані містять бізнес-терміни та визначення, приналежність даних і правила оплати послуг сховища.

Оперативні метадані – це інформація, зібрана під час роботи сховища даних:

Ø походження перенесених і перетворених даних;

Ø статус використання даних (активні, архівовані або видалені);

Ø дані моніторингу, такі як статистика використання, повідомлення про помилки і т.д.

Метадані сховища звичайно розміщаються в репозитарії. Це дозволяє використовувати метадані спільно різним інструментам, а також процесам при проектуванні, установці, експлуатації та адмініструванні сховища.

Висновки. У лекції були розглянуті поняття даних, об'єктів та атрибутів, їхньої характеристики, типи шкал, поняття набору даних і його типи. Описано можливі формати зберігання даних. Введено поняття бази даних, системи керування базами даних, метаданих.


Читайте також:

  1. АДАПТОВАНА ДО РИНКУ СИСТЕМА ФОРМУВАННЯ (НАБОРУ) ОКРЕМИХ КАТЕГОРІЙ ПЕРСОНАЛУ. ВІДБІР ТА НАЙМАННЯ НА РОБОТУ ПРАЦІВНИКІВ ФІРМИ
  2. Аналіз паралельного інтерейсу з DSP-процесорами: запис даних в ЦАП, що під’єднаний до адресного простору пам’яті
  3. Аналіз паралельного інтерфейсу з DSP-процесорами: читання даних з АЦП, що під’єднаний до адресного простору пам’яті
  4. Аналіз статистичних даних про склад та плинність кадрів, які обіймали керівні
  5. Аналіз та інтерпретація одержаних даних
  6. Архіватори даних.
  7. Архітектура баз даних
  8. Аудит розрахунків за відшкодуванням завданих збитків
  9. Бази даних АС ДЗК
  10. Бази даних як засіб зберігання й обробки інформації
  11. Банки даних
  12. Безпека даних




Переглядів: 2188

<== попередня сторінка | наступна сторінка ==>
Фізіологія носа | Поняття податкової системи

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

  

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.088 сек.