Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Теорія інформаційного пошуку

Аналіз інформаційних потоків

Закономірності зростання, розпорошення та старіння наукових документів

 

Закон про зростання кількості НТІ.

Нп: за останні 200 років кількість бібліографічних журналів подвоюється кожні 18 років; аналогічно за останні 100 років кількість журналів з математики подвоюється кожні 28 років.

Аналогія: чим більше зростає діаметр кола, тим більшим стає його периметр (чим більше знаємо, тим дізнаємося про все більшу кількість невідомого).

Закон про концентрацію та розпорошення інформації. Виражається законом Бредфорда.

Як пише С. Бредфорд, „якщо наукові журнали розташувати в порядку зменшення кількості опублікованих у них статтей за якоюсь темою, то в отриманому списку можна виділити ядро журналів, присвячених безпосередньо цій темі, і кілька груп чи зон, кожна з яких містить таку саму кількість статтей, як і ядро. Тоді кількість журналів у ядрі та наступних зонах буде відноситись як 1:n:n2»[7].

Як було встановлено С. Бредфордом, число n = 5. Тому вказане вище співвідношення кількості журналів у ядрі та наступних двох зонах можна записати приблизно як 1:5:25.

Закон про старіння видань: документи зі збільшенням часу з моменту їх публікування втрачають свою цінність як джерело інформації й до них дедалі менше звертаються дослідники.

Півперіод життя публікацій з фізики дорівнює 4,6 року. Це означає, що 50% всіх зараз використовуваних (цитованих) публікацій з цієї галузі мають вік не більше 4,6 року.

Старіння публікацій по інших науках (роки):

— біологія, медицина, металургія — 3,0…4,0;

— фізика, хімічні технології — 4,0…5,0;

— соціологія, машинобудування, фізіологія, хімія, ботаніка — 5,0…10,0;

— математика, геологія, географія — 10,0…16,0.

 

 

Кількісний аналіз потоків НТІ:

— чисельність первинних документів;

— обсяги первинних видань;

— показники розпорошення;

— показники старіння;

— кількість і продуктивність авторів;

— частоту цитування документів (американський журнал: Science Citation Index);

— кількості запитів користувачів на документи;

— кількості інформаційних видань (сигнальної інформації, реферативних журналів, оглядових збірників).

Якісний аналіз потоків НТІ (цінність, істинність та повному інформації) виконують науковці.

Аналіз інформаційних зв’язків виконують на основі цитування (Science Citation Index). Це дає змогу виявити зв’язки між науковими школами, вченими, країнами, науками, колективами тощо.

Аналіз видової структури потоків дає змогу виявити:

— типи видань;

— зміни в типах видань.

 

 

Дано: масив документів, пошукові образи документів (ПОД), пошуковий образ запиту (ПОЗ) отримувача інормації. Завдання: розшукати такі документи, які відповідають ПОЗ.

Види запиту: інформаційна потреба, вербальний запит, ПОЗ. При переході від інформаційної потреби до ПОЗ відбувається втрата частини інформації.

Ступінь відповідності виданих документів інформаційного запиту називають релевантністю.

Модель пошуку інформації:

 

 

Рис. Х.

 

Пошук здійснюють не в самих документах, а в ПОД. ПОД утворюють шляхом індексування документів. Для індексування ПОЗ і ПОД використовують інформаційно-пошукові мови (ІПМ).

Види ІПМ:

1. Передкоординатні: а) перелічувальні (ієрархічні — УДК, алфавітно-предметні — каталоги); б) фасетні (багатомірні класифікації).

2. Посткоординатні: а) семантичні коди; б) ключові слова (тобто слова, що описують основну тему ПОД чи ПОЗ); в) дескриптори (тобто нормалізовані ключові слова з їх семантичними зв’язками).

3. Бібліографічні посилання (на зразок Science Citation Index).

Всі ці види ІПМ мають як свої переваги, так і свої недоліки (нп: УДК не може заіндексувати найновіші відкриття науки; ключові слова це зробити можуть).

Типи пошукових масивів документів:

— бібліографічний опис (БО);

— БО, ПОД;

— БО, ПОД, реферат;

— БО, реферат;

— БО, повний текст;

— інші комбінації.

Для проведення пошуку до ПОЗ додають критерій видачі (КВ). КВ — це сукупність ознак, на основі якої визначається ступінь схожості (релевантності) між ПОД і ПОЗ та приймається рішення про видачу документа. Найпростіший КВ — повне збігання ПОД і ПОЗ (буває вкрай рідко). Інші види КВ:

— ПОЗ входить у ПОД;

— ПОЗ і ПОД перехрещуються (найчастіше на практиці в ПОД повинно бути більше 25% ключових слів, що збіглися з ПОЗ);

— ПОД входить у ПОЗ.

ПОД і КВ утворюють пошуковий припис (ПП).

Модель визначення ефективності пошуку (рис. Х).

 
 

 


Рис. Х.

 

Критерії оцінювання ефективності пошуку:

— повнота;

— точність.

Повнота пошуку: кількість виданих релевантних / на суму усіх релевантних документів.

Точність пошуку: кількість виданих релевантних / суму усіх виданих документів.

Експериментально встановлено, що між повнотою і точністю пошуку існує обернена функціональна залежність.

На практиці вважається нормальним, якщо повнота пошуку становить 60…70%, а точність 40…50%.

На повноту й точність видачі впливають величина масиву документів і величина видачі.

 


Читайте також:

  1. E) теорія раціонального вибору.
  2. I. Теорія граничної продуктивності і попит на ресурси
  3. IV. Виклад інформаційного матеріалу
  4. IV. Виклад інформаційного матеріалу
  5. V теорія граничної корисності визначає вартість товарів ступенем корисності останньої одиниці товару для споживача.
  6. Балансова теорія визначення статі. Диференціація статі і роль гормонів у цьому процесі.
  7. Біхевіоральна теорія
  8. В межах наукового підходу існує велика кількість концепцій, але найбільш переконлива – еволюційна теорія.
  9. Вдосконалення нормативно-правової бази міста на етапі переходу до інформаційного суспільства
  10. Взаємозв’язок психодинамічної теорії АСПН з іншими теоріями
  11. Вибір засобів забезпечення безпеки даних і інформаційного захисту
  12. Вид інформаційного_ресурсу: //доменне_ім'я_хост_комп'ютера/їм 'я_ каталоги / їм 'я_ підкаталоги /їм 'я_ файла.




Переглядів: 870

<== попередня сторінка | наступна сторінка ==>
Типи наукових документів, сфери їх створення та використання | Технологія проведення інформаційного пошуку за допомогою реферативних журналів

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

  

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.012 сек.