МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах
РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ" ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах Гендерна антидискримінаційна експертиза може зробити нас моральними рабами ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів
Контакти
Тлумачний словник Авто Автоматизація Архітектура Астрономія Аудит Біологія Будівництво Бухгалтерія Винахідництво Виробництво Військова справа Генетика Географія Геологія Господарство Держава Дім Екологія Економетрика Економіка Електроніка Журналістика та ЗМІ Зв'язок Іноземні мови Інформатика Історія Комп'ютери Креслення Кулінарія Культура Лексикологія Література Логіка Маркетинг Математика Машинобудування Медицина Менеджмент Метали і Зварювання Механіка Мистецтво Музика Населення Освіта Охорона безпеки життя Охорона Праці Педагогіка Політика Право Програмування Промисловість Психологія Радіо Регилия Соціологія Спорт Стандартизація Технології Торгівля Туризм Фізика Фізіологія Філософія Фінанси Хімія Юриспунденкция |
|
||||||||||
Теорія інформаційного пошукуАналіз інформаційних потоків Закономірності зростання, розпорошення та старіння наукових документів
Закон про зростання кількості НТІ. Нп: за останні 200 років кількість бібліографічних журналів подвоюється кожні 18 років; аналогічно за останні 100 років кількість журналів з математики подвоюється кожні 28 років. Аналогія: чим більше зростає діаметр кола, тим більшим стає його периметр (чим більше знаємо, тим дізнаємося про все більшу кількість невідомого). Закон про концентрацію та розпорошення інформації. Виражається законом Бредфорда. Як пише С. Бредфорд, „якщо наукові журнали розташувати в порядку зменшення кількості опублікованих у них статтей за якоюсь темою, то в отриманому списку можна виділити ядро журналів, присвячених безпосередньо цій темі, і кілька груп чи зон, кожна з яких містить таку саму кількість статтей, як і ядро. Тоді кількість журналів у ядрі та наступних зонах буде відноситись як 1:n:n2»[7]. Як було встановлено С. Бредфордом, число n = 5. Тому вказане вище співвідношення кількості журналів у ядрі та наступних двох зонах можна записати приблизно як 1:5:25. Закон про старіння видань: документи зі збільшенням часу з моменту їх публікування втрачають свою цінність як джерело інформації й до них дедалі менше звертаються дослідники. Півперіод життя публікацій з фізики дорівнює 4,6 року. Це означає, що 50% всіх зараз використовуваних (цитованих) публікацій з цієї галузі мають вік не більше 4,6 року. Старіння публікацій по інших науках (роки): — біологія, медицина, металургія — 3,0…4,0; — фізика, хімічні технології — 4,0…5,0; — соціологія, машинобудування, фізіологія, хімія, ботаніка — 5,0…10,0; — математика, геологія, географія — 10,0…16,0.
Кількісний аналіз потоків НТІ: — чисельність первинних документів; — обсяги первинних видань; — показники розпорошення; — показники старіння; — кількість і продуктивність авторів; — частоту цитування документів (американський журнал: Science Citation Index); — кількості запитів користувачів на документи; — кількості інформаційних видань (сигнальної інформації, реферативних журналів, оглядових збірників). Якісний аналіз потоків НТІ (цінність, істинність та повному інформації) виконують науковці. Аналіз інформаційних зв’язків виконують на основі цитування (Science Citation Index). Це дає змогу виявити зв’язки між науковими школами, вченими, країнами, науками, колективами тощо. Аналіз видової структури потоків дає змогу виявити: — типи видань; — зміни в типах видань.
Дано: масив документів, пошукові образи документів (ПОД), пошуковий образ запиту (ПОЗ) отримувача інормації. Завдання: розшукати такі документи, які відповідають ПОЗ. Види запиту: інформаційна потреба, вербальний запит, ПОЗ. При переході від інформаційної потреби до ПОЗ відбувається втрата частини інформації. Ступінь відповідності виданих документів інформаційного запиту називають релевантністю. Модель пошуку інформації:
Рис. Х.
Пошук здійснюють не в самих документах, а в ПОД. ПОД утворюють шляхом індексування документів. Для індексування ПОЗ і ПОД використовують інформаційно-пошукові мови (ІПМ). Види ІПМ: 1. Передкоординатні: а) перелічувальні (ієрархічні — УДК, алфавітно-предметні — каталоги); б) фасетні (багатомірні класифікації). 2. Посткоординатні: а) семантичні коди; б) ключові слова (тобто слова, що описують основну тему ПОД чи ПОЗ); в) дескриптори (тобто нормалізовані ключові слова з їх семантичними зв’язками). 3. Бібліографічні посилання (на зразок Science Citation Index). Всі ці види ІПМ мають як свої переваги, так і свої недоліки (нп: УДК не може заіндексувати найновіші відкриття науки; ключові слова це зробити можуть). Типи пошукових масивів документів: — бібліографічний опис (БО); — БО, ПОД; — БО, ПОД, реферат; — БО, реферат; — БО, повний текст; — інші комбінації. Для проведення пошуку до ПОЗ додають критерій видачі (КВ). КВ — це сукупність ознак, на основі якої визначається ступінь схожості (релевантності) між ПОД і ПОЗ та приймається рішення про видачу документа. Найпростіший КВ — повне збігання ПОД і ПОЗ (буває вкрай рідко). Інші види КВ: — ПОЗ входить у ПОД; — ПОЗ і ПОД перехрещуються (найчастіше на практиці в ПОД повинно бути більше 25% ключових слів, що збіглися з ПОЗ); — ПОД входить у ПОЗ. ПОД і КВ утворюють пошуковий припис (ПП). Модель визначення ефективності пошуку (рис. Х).
Рис. Х.
Критерії оцінювання ефективності пошуку: — повнота; — точність. Повнота пошуку: кількість виданих релевантних / на суму усіх релевантних документів. Точність пошуку: кількість виданих релевантних / суму усіх виданих документів. Експериментально встановлено, що між повнотою і точністю пошуку існує обернена функціональна залежність. На практиці вважається нормальним, якщо повнота пошуку становить 60…70%, а точність 40…50%. На повноту й точність видачі впливають величина масиву документів і величина видачі.
Читайте також:
|
|||||||||||
|