Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Контакти
 


Тлумачний словник
Авто
Автоматизація
Архітектура
Астрономія
Аудит
Біологія
Будівництво
Бухгалтерія
Винахідництво
Виробництво
Військова справа
Генетика
Географія
Геологія
Господарство
Держава
Дім
Екологія
Економетрика
Економіка
Електроніка
Журналістика та ЗМІ
Зв'язок
Іноземні мови
Інформатика
Історія
Комп'ютери
Креслення
Кулінарія
Культура
Лексикологія
Література
Логіка
Маркетинг
Математика
Машинобудування
Медицина
Менеджмент
Метали і Зварювання
Механіка
Мистецтво
Музика
Населення
Освіта
Охорона безпеки життя
Охорона Праці
Педагогіка
Політика
Право
Програмування
Промисловість
Психологія
Радіо
Регилия
Соціологія
Спорт
Стандартизація
Технології
Торгівля
Туризм
Фізика
Фізіологія
Філософія
Фінанси
Хімія
Юриспунденкция






Орфограми

Лінгвістичні норми

Методи контролю. На перших етапах для автоматизації процесів редагування використовували різні методи пошуку орфографічних помилок. Ці методи можна класифікувати на такі чотири групи:

• поліграмні

• методи

• словникові

• методи

• автокореляційні

• кроскореляційні

Поліграмні методи передбачають, що в тексті в кожному слові контролюють сполучення кількох сусідніх літер, наприклад біграм, триграм, складів чи псевдоскладів.

Використання словникових методів базується на тому, що контролюють не окремі частини слів, а відразу цілі слова.

Особливість застосування автокореляційних методів полягає в тому, що для контролю тексту як нормативну базу використовують сам текст, тобто його контроль на основі цього ж таки тексту. Використання кроскореляційних методів полягає у використанні заздалегідь підготованих масивів нормативних елементів.

Можливість використання такого методу базується на тому факті, що помилки є випадковими й практично не повторюються, а, отже, частота слів чи поліграм, в яких допущена помилка, дорівнює одиниці.

Тому для контролю будь-якого тексту достатньо утворити його частотний словник і перевірити лише ті слова, частота яких дорівнює одиниці. Саме серед них будуть усі слова з помилками.

Суть кроскореляційного словникового контролю полягає в тому, що найперше в пам'ять комп'ютера записують словник потрібної мови. Далі кожне слово контрольованого тексту шукають у комп'ютерному словнику і, якщо знаходять, то вважають його правильним, а якщо ні — помилковим. Звичайно, і серед правильних слів можуть бути помилкові (у випадку, коли замість одного правильного слова ввели зовсім інше правильне слово, тобто допустили семантичну помилку), а серед помилкових можуть бути правильні (у випадку, коли такого слова — вузькогалузевого терміна, неологізму тощо — в словнику нема).

Обсяг комп'ютерних словників для контролю тексту в більшості діючих програм перевірки орфографії перебуває в межах кількох десятків тисяч слів. Різке збільшення обсягу цих словників до сотень тисяч веде лише до зниження ефективності контролю (наприклад, частина неправильних слів через наявність у словнику абревіатур ідентифікуються як правильні).

Зрозуміло, що не існує такого комп'ютерного словника, в якому були б усі слова, які використовують у тексті. Адже постійно з'являються нові терміни, неологізми, нові абревіатури тощо. Тому вважають дуже доброю ситуацію, коли покриття тексту комп'ютерним словником становить близько 98%.

Щоби забезпечити максимальне покриття тексту, яке істотно залежить від семантичного наповнення словника, часто чинять так: у комп'ютерному словнику виділяють словник загальновживаної лексики (загальний словник) і лексику окремих галузей знань (галузеві словники). У кожний галузевий словник, крім термінів і номіналій, включають також персонали (власні імена й прізвища людей), географічні назви, скорочення та абревіатури. Далі для контролю тексту якоїсь конкретної галузі використовують загальний словник, а також добирають потрібний галузевий словник. Крім того, деякі програми перевірки орфографії дають користувачам змогу створювати для окремих видань локальні комп'ютерні словники, тобто словники для одного конкретного тексту.

Комп'ютерні словники, які використовують для редагування текстів, класифікують:

— за типом лексичних одиниць — словники словоформ, в яких слова подають у всіх їх словозмінних формах, і словники основ, у яких до основи кожного слова вказують всі її можливі закінчення;

— за наявністю блоків для аналізу морфем (префіксів, суфіксів і закінчень), за допомогою яких від основ можна утворювати нові похідні слова.


Читайте також:

  1. Основні орфограми




Переглядів: 608

<== попередня сторінка | наступна сторінка ==>
Логічні норми | ЛЕКЦИОННЫЙ КОМПЛЕКС

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

 

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.004 сек.