МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах
РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ" ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах Гендерна антидискримінаційна експертиза може зробити нас моральними рабами ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів
Контакти
Тлумачний словник Авто Автоматизація Архітектура Астрономія Аудит Біологія Будівництво Бухгалтерія Винахідництво Виробництво Військова справа Генетика Географія Геологія Господарство Держава Дім Екологія Економетрика Економіка Електроніка Журналістика та ЗМІ Зв'язок Іноземні мови Інформатика Історія Комп'ютери Креслення Кулінарія Культура Лексикологія Література Логіка Маркетинг Математика Машинобудування Медицина Менеджмент Метали і Зварювання Механіка Мистецтво Музика Населення Освіта Охорона безпеки життя Охорона Праці Педагогіка Політика Право Програмування Промисловість Психологія Радіо Регилия Соціологія Спорт Стандартизація Технології Торгівля Туризм Фізика Фізіологія Філософія Фінанси Хімія Юриспунденкция |
|
|||||||
Концепція організації інформаційно-пошукових системПравові інйформаційно-пошукові системи. Лекція №5.
Вирішення великої кількості правових задач залежить від якості результатів інформаційного пошуку — вибору з усієї відомої сукупності документів, текстів, відомостей, фактів і даних тих елементів, які відповідають інформаційним потребам. За умов великих обсягів інформації, серед якої здійснюється пошук, стає доцільним і навіть необхідним використання інформаційно-пошукових систем. Інформаційно-пошукова система (ІПС) — це сукупність методів і засобів, призначених для зберігання та пошуку документів, відомостей про них чи певних фактів. За тематикою виділяють галузеві ІПС, полі- та вузькотематичні. Залежно від типу інформації, що зберігається, розрізняють документальні системи, в яких об’єктом зберігання і пошуку є документ, та фактографічні, в яких зберігаються і розшукуються окремі дані, що характеризують деякі факти — події, процеси, явища. За режимом функціонування виокремлюють: • системи з вибірковим пошуком — ІПС, в яких пошук виконується за постійним набором запитів для певного контингенту користувачів у масиві поточних надходжень документів чи даних, які надходять через певні інтервали часу. При цьому змінюється вміст системи, а запити залишаються без змін; • системи з ретроспективним пошуком, які обслуговують разові запити, що змінюються залежно від інформаційних потреб користувачів, у нагромадженому інформаційному фонді зі значною хронологічною глибиною. Найефективнішим способом пошуку інформації є перегляд кожного документа і визначення його відповідності інформаційному запиту — тексту певною мовою, що відбиває деяку інформаційну потребу. Проте такий пошук є дуже тривалим. Тому насправді пошук здійснюється не за текстами документів, а за їх стислими описами інформаційно-пошуковою мовою — пошуковими образами. Процедура визначення пошукового образу документа (ПОД) називається індексуванням. Взаємодія користувача з ІПС охоплює такі операції: • введення в систему пошукових образів документів і самих документів; • зберігання інформації в системі; • формування запитів, опис і введення у систему пошукових розпоряджень — інформаційних запитів, викладених інформаційно-пошуковою мовою і доповнених допоміжною інформацією; • пошук — порівняння пошукових образів документів з пошуковими розпорядженнями; • прийняття рішення про видачу знайденої інформації залежно від критерію пошуку, визначеного користувачем; • видача інформації, що відповідає інформаційному запиту.
Функціонування ІПС можна оцінити за кількома критеріями: • повнота — здатність відшукувати та видавати релевантні документи, тобто такі, що відповідають запитові користувача; • точність — здатність відсіювати та затримувати нерелевантні документи; (Релевантність — характеристика ступеня відповідності змісту документа, знайденого в результаті інформаційного пошуку, змісту інформаційного запиту) • економічна ефективність — окупність витрат на функціонування системи вигодами від її використання, серед яких важливе значення мають підвищення оперативності та зменшення трудомісткості пошуку.
ІПС може видати документ навіть якщо його ПОД не повністю відповідає пошуковому розпорядженню. У цьому разі результатом пошуку може бути не один якийсь документ, а їх множина, з якої користувач має вибрати ті, які відповідають його потребам найбільше. Це залежить від критерію пошуку, який може змінюватись за бажанням користувача. А загалом ефективність взаємодії користувача з ІПС та робота самої ІПС прямо залежить від якості інформаційно-пошукової мови (ІПМ) — спеціалізованої штучної мови, призначеної для опису центральних тем і формальних характеристик документів, а також опису інформаційних запитів і наступного виконання пошуку. З цією метою не може бути використана жодна з природних мов через їх неструктурованість, велику кількість граматичних винятків, неоднозначність та надмірність. Основні елементи ІПМ такі: 1) алфавіт — система графічних знаків, що використовуються для утворення слів і словосполучень; 2) лексика — сукупність слів, що використовуються в мові; 3) граматика — сукупність засобів та правил побудови висловлювань; 4) парадигматичні (базові, аналітичні) відношення — відношення, які не залежать від контексту використання і спричинені не мовними, а логічними зв’язками. Наприклад, поняття «магнітний диск», «магнітна стрічка», «лазерний диск», «паперовий документ» утворюють тематичну групу «носії інформації», усередині якої можна виділити лексико-семантичні парадигми «паперові носії інформації» та «машинні носії»; 5) правила побудови індексів та їх ідентифікації.
Розрізняють ІПМ таких видів: • передкоординатні в основу яких покладено систематичну класифікацію понять, що відбивають певні парадигматичні відношення. Класифікація може бути ієрархічною, фасетною, алфавітно-предметною; • посткоординатні, в основу яких покладено принцип координатного індексування — зміст документів і запитів виражається набором ключових слів, вибраних з індексованого тексту. Ключові слова — це слова, найбільш характерні для даного тексту або тематики. Пошук і вибір ключових слів є окремою складною проблемою, яка вимагає творчого підходу. Для пра-вової ІПС таку роботу може виконати тільки висококваліфікований юрист широкого профілю. Але навіть повне визначення ключових слів недостатньо для організації ефективного пошуку, оскільки: • ключові слова можуть мати різні варіанти написання та синоніми. Тоді документ, індексований за допомогою певного терміна, не буде виданий у відповідь на запит, складений з використанням терміна-синоніму; • ключове слово може мати різні значення (проблема омонімічності). Запит, в якому присутні омоніми, призведе до видачі документів, які не стосуються вибраної користувачем теми; • набір ключових слів не визначає родово-видові відношення між поняттями, а це звужує пошук. З метою вирішення названих проблем для різноманітних тематик розробляються тезауруси — структуровані списки ключових слів, призначених для однозначного подання концептуального змісту документів і запитів. Тезаурус упорядковується так, щоб встановити прозорі еквівалентні, гомографічні, ієрархічні та асоціативні зв’язки між термінами. Читайте також:
|
||||||||
|