Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Автоматичне кодування.

ВСТУП

Роль прикладної та комп'ютерної лінгвістики в інформаційному суспільстві. Ознакою часу є формування в найрозвиненіших країнах світу інформаційних суспільств, які більше половини валовОго національного прибутку отримують за рахунок продажу інформації. У менш розвинених державах, які називають індустріальними, більше половини такого прибутку надходить від випуску промислової продукції.

Одним з носіїв інформації в суспільстві є мова. І хоча, на відміну від інших — музики, образотворчого мистецтва, скульптури, програмного забезпечення комп'ютерів, — можливості мови дещо обмежені (наприклад, мова у принципі не може передати просторові координати так, як скульптура; звукові співвідношення - так, як музика; графічні форми й кольорові співвідношення - так, як живопис; ланцюжки бітів - так, як комп'ютерна програма), вона все ж залишається основним носієм інформації.

А що таке інформація? Інформація – це «уявлення суб’єкта про навколишнє середовище».

Називаючи мову носієм інформації, ми маємо на увазі те, що людина, яка генерує повідомлення, пов'язує з символом певне значення (певну кількість інформації). Передаючи інформацію в канал (наприклад, повітря), людина надсилає лише символ, закодований певним фізичним сигналом — звуком (саме значення, звісно ж, у канал не надходить). Інша людина, яка сприймає цей сигнал, ототожнює його з відповідними власними символами, а ці символи, своєю чергою, — з такими ж чи приблизно такими ж значеннями, що й людина — відправник повідомлення. Саме таким є механізм передавання інформації мовою. І в цьому розумінні мова є носієм інформації.

Оскільки в суспільстві мова є основним носієм інформації, розвиток мовознавства є вкрай актуальним, а в сучасному мовознавстві одним з найважливіших є розвиток такої його новітньої галузі, як прикладна лінгвістика (ПЛ) (комп'ютерна лінгвістика (КЛ)). Ця галузь мовознавства, зокрема комп'ютерна лінгвістика, досліджуючи й розробляючи технологію конструювання лінгвістичних систем, дає змогу суттєво підвищити продуктивність праці в найрізноманітніших ділянках суспільного виробництва, значно прискорює опрацювання лінгвальної інформації. При цьому прикладна лінгвістика використовує універсальні кібернетичні пристрої опрацювання інформації – комп’ютери, дослідженням яких займається інша наука кібернетика.

 

Насамперед звернімо увагу на гігантські обсяги накопиченої і постійно створюваної інформації, яка потребує опрацювання за допомогою комп’ютерів. Оскільки ця інформація часто організована засобами природної мови, її реальне освоєння можливе лише за умови автоматичного смислового опрацювання текстів, без попереднього препарування їх людиною. Лише тоді відкриється доступ до машини (до комп’ютера) великим масивам організаційно-управлінської, планової, науково-технічної, соціально-політичної, правової, проектної, бібліотечної, довідково-побутової та іншої інформації.

 

Ефективне використання знань, що містяться в текстах, вимагає нових стратегій опрацювання інформації, відмінних від традиційних логічних підходів. Такі стратегії мають враховувати семантичні закони природної мови. Наприклад, із висловлювання Іван повернув мені книгу випливає, що книга раніше була у мене (цей висновок ми робимо на підставі тієї частини тлумачення дієслова повернути, яку називають пресупозицією). Або: з висловлювання Він змусив мотор зупинитися можна зробити висновок «Він зупинив мотор нестандартним способом» (це так звана комунікативна імплікатура, підказана в цьому випадку саме тим способом вираження, який вибрав мовець).

 

Далі, потреба в лінгвістичному забезпеченні зумовлена перспективною настановою на створення людино-машинних систем вирішення інтелектуальних завдань. Зауважимо, що нерідко представники і гуманітарних, природничих та технічних наук грішать розглядом комп'ютера як суто зовнішньої сили, абсолютно відчуженої від людини. Однак серйозна розмова про посилення природних можливостей людського розуму має передбачати налагодження гнучкої взаємодії людини і машини. Оперативна, зручна кооперація під час такої взаємодії буде спиратися на природну мову (точніше, певну підмову, пов'язану з деякою сферою спілкування або класом розв’язуваних завдань).

Особливо належить наголосити на необхідності враховувати лінгвістичну семантику під час побудови мов представлення знань поза системою опрацювання текстів в її повному вигляді. Навіть у цьому випадку природна мову слугує надійною точкою відліку: адже і творці систем, і користувачі говорять, пишуть і думають переважно природною мовою. Урахування цього факту допоможе у вирішенні таких гострих проблем комп'ютеризації, як уніфікація створюваних систем і автоматизація якомога більшої кількості процесів.

У соціальному плані значущість лінгвістичних проблем комп'ютеризації пов'язана з виникненням нових видів масової діяльності, що містять побудову штучних мов і машинних словників, розроблення інформаційних банків, побудови алгоритмів опрацювання текстів, розроблення режимів спілкування в системі, людина - комп'ютер - людина і т. ін. Взагалі, мовний аспект важливий для всіх основних напрямків індустрії опрацювання знань, таких, як збирання, створення, зберігання, систематизація, поширення, інтерпретація інформації.

 

Зауважимо, що й з історичного погляду мова виявляється центральним фактором найважливіших етапів розвитку інформаційних технологій: згадаймо виникнення писемності, винайдення друкарства, створення штучних інформаційних та алгоритмічних мов, що є похідними від природної мови і формалізують деякі з її функцій. Нарешті, з погляду наукознавства, можна констатувати, що лінгвістика входить до ядра комплексу когнітивних наук, які об'єднуються за їх інтересом до проблем організації, подання, опрацювання та використання знань.

 

Мовознавство (лінгвістика) – це наука про природну людську мову загалом і про всі людські мови світу як про індивідуальні її представники. Мовознавство – це наука, яка описує будову й закономірності функціювання та розвитку природної мови людини.

 

Відразу належить зауважити, що

під мовою насамперед розуміють природну людську мову (в опозиції до штучних мов і мови тварин), виникнення й існування якої нерозривно пов’язане з виникненням та існуванням людини – homo sapiens.

Термін мова має принаймні два пов’язаних значення:

1) мова загалом, мова як певний клас знакових систем;

2) конкретна, так звана етнічна, чи ідіоетнічна, мова – деяка реально наявна знакова система, використовувана в певному соціумі, в певний час і в певному просторі.

 

Мовний знак – матеріально-ідеальне утворення, яке репрезентує предмет, властивість, відношення дійсності; у своїй сукупності мовні знаки утворють особливу знакову систему – мову. Мовний знак – це єдність певного мисленнєвого змісту (позначуваного) і ланцюжка фонематично розчленованих звуків (позначника). Найбільш типовим знаком є слово.

 

«Справжнє значення слів» так називається дитяча книга Юджина Іонеско, в якій слова набувають несподіваного значення; вона ілюструє синтаксис і семантику мови, а також те, як поняття про «глибинної структури» і «оперантном навчання» допомагають використовувати мову. З одного боку, синтаксична структура збережена, але на семантичному рівні слова набувають незвичайного значення, що можна пояснити мовою оперантного зумовлення.

 

Зараз Жозетт йде побачитися зі своїм татом до нього в контору. Тато дзвонить по телефону. Він курить і говорить у слухавку: «Алло, так, алло. Це ви? Я ж сказав, щоб ви мені більше не дзвонили. Так, ви мені набридли. У мене немає жодної секунди».

Жозетт запитує свого тата: «Ти розмовляєш по телефону?» Тато кладе слухавку. «Це не телефон», - говорить він. «Ні, телефон, - відповідає Жозетт, - так мені мама сказала. І Жаклін сказала мені те саме».

«І Жаклін, і твоя мама помиляються, - говорить тато. - Ні мама, ні Жаклін не знають, як це називається. Це називається сир».

«Це називається сир? - Запитує Жозетт. - Але тоді люди подумають, що він зроблений з сиру».

«Не подумають, - говорить тато, - тому що сир не називається сиром. Він називається "музична шкатулка". А музична шкатулка називається килимком. Килимок називається "лампа". Стеля зветься підлогою, а підлога - це стеля. Стіна зветься дверима ». Так тато вчить Жозетт справжньому значенню слів. Стілець - це вікно. Вікно - це ручка. Подушка - це кусень хліба. А хліб - це килимок біля ліжка. Ноги - це вуха. Руки - це ноги. Голова - це спина, а спина - це голова. Пальці - це очі. Очі - це пальці.

Потім Жозетт говорить так, як вчив її тато. Вона каже: «Я жую мою подушку і виглядаю зі стільця. Я йду власними очима. У мене десять очей, щоб тримати, і два пальці, щоб дивитися. Я сідаю головою до підлоги. Я кладу спину на стелю. Коли я з'їла музичну шкатулку, я собі на десерт намазала варенням килимок біля ліжка. Тато, візьми вікно і намалюй мені трохи картинок».

 

Мова в першому значенні – це абстрактне уявлення про єдину людську мову, серцевину універсальних властивостей конкретних мов. Конкретні мови – це численні реалізації мови загалом.

Мова загалом – це семіотична (знакова) система, яка виникла природно (на певній стадії розвитку людського суспільства) і яка закономірно розвивається, має властивість соціального призначення, - це система, яка існує насамперед не для окремого індивіда, а для певного соціуму.

Мова - це поліфункційна система, хоча їй властиві цілісність і єдність. Серед функцій мови найважливішими вважають ті, які пов’язані з основними операціями над інформацією (знаннями людини про дійсність) – створенням, збереженням і передаванням інформації.

 

Мови поділяють на природні та штучні.

Штучні мови – це знакові системи, створювані для використання в тих галузях науки і техніки, де використання природної мови обмежене, менш ефективне чи не можливе. Будь-яка штучна мова порівняно з природною мовою – обмежена мова, яка слугує для вирішення певних задач.

 

Вважають, що започаткування лінгвістики (мовознавства) сягає зародження писемності – 2-3 тис. років до н.е. на Стародавньому Сході у Шумері та Вавилоні. Першим практичним результатом були примітивні словники (Месопотамія), а теоретичним – граматики санскриту (Індія, 5 ст. до н.е.).

У Європі засновниками мовознавства вважають Платона (5-4 ст. до н.е.) та Аристотеля (4 ст. до н.е.). У Стародавній Греції мову розглядали з теоретичного погляду у тісному зв’язку з логічним мисленням (Аристотель). Саме ж мовознавство оформилося як наука лише в 17-18 ст. (Гумбольдт), що зумовлено її складністю і браком знань про мову – об’єкт цієї науки. У ХІХ-ХХ ст. відзначають піднесення в галузі мовознавства. Ф. де Соссюр розробляє структурну лінгвістику, Бодуен де Куртене вивчає фонетику та фонологію.

Система основних лінгвістичних дисциплін:

1. Загальне мовознавство – вивчає властивості, притаманні мові загалом, загальні елементи мови.

2. Описове мовознавство – вивчає сучасні мови, їх структуру в цей час.

3. Діалектологія - вивчає місцеві територіальні різновиди однієї мови. Діалектологія- мовознавча дисципліна, що вивчає територіальні діалекти певної мови. Напрямками діалектології є описова, яка досліджує сучасний стан діалектного членування мови, встановлює характер особливостей місцевих діалектів на різних мовних рівнях; історична, що реконструює історію утворення діалектів, пояснює еволюційний характер фонетичних, словотвірних, лексичних особливостей, територіальне поширення й утворення на базі діалектів національних і споріднених мов. Діалектологія пов'язана з етнографією, історією мови, лінгвокультурологією, етнолінгвістикою й соціолінгвістикою. Складником діалектології є діалектографія - галузь лінгвістичної географії, спрямована на створення діалектних атласів різних мов, фіксацію різних діалектних особливостей на географічній карті.

Вивчення діалектів у різних аспектах має давні традиції у всіх лінгвістичних школах світу. Перші спроби їхнього розгляду в етимологічних цілях та класифікації можна віднести до ІІ ст. н. е. (опис грецьких діалектів А. Дисколом). Вірменські діалекти, наприклад, почали вивчатися у V ст. н. е. Е. Кохбаці, а в X ст. вийшли перші діалектні словники вірменської мови. Японські діалекти відтворені у словнику К. Годзана (1775 p.). Перша спроба класифікації діалектів китайської мови віднесена до XVI або початку XVFJI ст. (в епоху Мін). Загалом же фундаментальне розроблення діалектологічної проблематики розпочалося ще в порівняльно-історичній парадигмі мовознавства у XVIII ст., а формування діалектології як окремої галузі мовознавства збіглося із становленням структуралізму (кінець XIX ст.).

 

4. Порівняльно-історичне мовознавствонапрямок мовознавства, якому належить розроблення процедур реконструкції походження мов від правмов, установлення еволюційних змін і закономірностей розвитку споріднених мов шляхом їхнього порівняння на різних етапах порівняння.

 

5. Зіставне мовознавство. Галузь мовознавства, спрямована на синхронійне дослідження спільних і специфічних рис зіставлюваних мов на всіх рівнях, що дає змогу глибше пізнати природу кожної з мов. Головним методом зіставного мовознавства є зіставний метод, що ґрунтується на загальному механізмі порівняння двох мов. Зіставний метод застосовується з різною метою: поглиблення знань про одну з мов на тлі іншої, вияву особливостей взаємодії мов у процесі оволодіння другою мовою тощо.

6. Типологія(універсалізм) – порівняльне вивчення структурних і функційних властивостей з погляду певних вибраних загальних властивостей.

7. Ареальна лінгвістика– досліджує поширення мовних явищ, виявляє ареали мов.

8. Польова лінгвістика - спостерігає за мовою чи діалектом у безпосередньому середовищі носія мови.

9. Дешифрування– досліджує тексти написані незнайомим кодом (мовою) для отримання інформації.

10. Інтернаціональна лінгвістика - вивчає міжнародні мови, зокрема і штучні, як засіб спілкування між людьми.

До кола розробок інтерлінгвістики можна віднести й створення мов комп’ютерного програмування – спеціальних знакових засобів, що дають змогу записувати завдання для комп’ютера і забезпечують взаємодію людини і комп’ютера.

11. Паралінгвістика– вивчає немовні засоби в мовленні. Мовознавча галузь, що вивчає паравербальні засоби комунікації, їхні типи, семіотичну природу, функції, походження, зв’язок із вербальними засобами мовлення і т.ін. Предметом паралінгвістики є паравербальні знаки – супровідні для вербального мовлення знакові засоби, що відіграють значну роль у процесі спілкування.

12. Етнолінгвістика– вивчає мову у її відношенні до культури народу. Маргінальна галузь мовознавства на межі з етнологією, культурологією та психолінгвістикою, спрямована на вивчення віддзеркалення у мові й мовленнєвій діяльності (етнотекстах) етнічної свідомості, менталітету, національного характеру, матеріальної та духовної культури народу.

13. Соціолінгвістика- вивчає роль мови в суспільстві, вплив суспільства на мову. Галузь мовознавства, що вивчає вплив суспільних явищ і процесів на виникнення, розвиток, соціальну й функційну диференціацію й функціонування мов, а також зворотний зв’язок мови й соціуму.

 

Що стосується концептуальних питань (наприклад, визначення прикладної лінгвістики, комп'ютерної лінгвістики тощо), то, зазначимо, потрібно чітко розрізняти три речі: прикладну лінгвістику як науку (галузь мовознавства), прикладну лінгвістику як спеціальність у ВНЗ і прикладну лінгвістику як навчальну дисципліну. Розгляньмо ці три статуси прикладної лінгвістики детальніше.

До складу прикладної лінгвістики як науки й у нас, й у країнах Заходу залучають викладання іноземних мов, перекладознавство, со­ціолінгвістику (мовна політика, явища бі- і полілінгвізму), мовленнєві технології, а також комп'ютерну лінгвістику (чи відносити сюди інші галузі, зокрема психолінгвістику, досі остаточно не вирішено).

Що стосується університетських спеціальностей, то тут у нас і в країнах Заходу є розбіжності.

Перша розбіжність полягає в тому, що в нас викладачів іноземних мов і перекладачів готують за двома окремими спеціальностями (у країнах Заходу — за однією спеціальністю «Прикладна лінгвістика»).

Друга розбіжність по­лягає в тому, що у нас за спеціальністю «Прикладна лінгвістика» готують як тих, хто займається власне прикладною лінгвістикою (наприклад, соціолінгвістикою, мовленнєвими технологіями), так і тих, хто займається комп'ютерною лінгвістикою (у країнах Заходу — це дві чітко розмежовані спеціальності: «Прикладна лінгвістика» і «Комп'ютерна лінгвістика»). Така ситуація наявна попри те, що комп'ютерна лінгвістика за методами дослідження (методами точних наук) суттєво відрізняється від решти компонентів прикладної лінгвістики, де використовують традиційні для філології методи. Відсутність же в Україні спеціальності «Комп'ютерна лінгвістика» викликає певне відставання нашої держави в цій ділянці.

 

Навчальну дисципліну «Прикладна лінгвістика» і в країнах Співдружності незалежних держав, й у країнах Заходу розуміють практично однаково. Порівняймо хоча б уже два згадані підручники: з одного боку — The Oxford Handbook of Applied Linguistics / Ed. by R. Kaplan. NY: Oxford University Press, 2002 — із другого — Прикладное языкознание: Учебник. СПб: Изд-во С.-Петербург, ун-та, 1996; Баранов А. Н. Введение в прикладную лингвистику: Учебное пособие. М.: Эдиториал УРСС, 2001.

 

Розуміння терміна прикладна лінгвістика.

Термін прикладна лінгвістика багатозначний. У вітчизняній та західній лінгвістиці він має зовсім різні інтерпретації. У західній лінгвістиці (applied linguistics, angewandte Linguistik) його пов’язують із викладанням іноземних мов. На наших теренах цей термін стали активно вживати у 50-ті роки 20 ст. у зв’язку з розробленням комп’ютерних технологій та появою систем автоматичного оброблення інформації (автоматизованих систем керування, систем інформаційного пошуку, автоматизованих систем оброблення тексту тощо). З огляду на це в україномовній (російськомовній) літературі замість терміна прикладна лінгвістика в тому ж значенні часто використовують терміни комп’ютерна лінгвістика, обчислювальна лінгвістика, автоматична лінгвістика, інженерна лінгвістика. Не варто ототожнювати ці терміни, оскільки кожна з цих лінгвістик має свій предмет і методи в межах прикладної лінгвістики як ширшого напрямку.

Однак через майже одночасне виникнення прикладної й комп'ютерної лінгвістики та спрямування їх на прикладні задачі ці галузі спершу ототожнювалися.

 

Становлення комп'ютерної лінгвістики відбувалося у 50-ті рр. XX ст. на базікомп'ютерної науки (обґрунтування та створення перших кібернетичних систем Норбертом Вінером (американський математик-теоретик і прикладний математик. Творець основ кібернетики, пов'язаних із теорією інформації та теорією керування («батько кібернетики»).) і Джоном фон Нейманом у 40-і pp. (американський математик угорського походження, що зробив значний внесок у квантову фізику, функціональний аналіз, теорію множин, інформатику, економічні науки та в інші численні розділи знання. Він став засновником теорії ігор разом із Оскаром Моргенстерном у 1944 році. Розробив архітектуру (так звану «архітектуру фон Неймана»), яка використовується в усіх сучасних комп'ютерах)), теорії інформації (К. Шеннон, Н. Вівер) і структурно-математичної лінгвістики. Проте, як зазначають дослідники, прикладна лінгвістика перебуває з комп'ютерною лінгвістикою в різних епістемологічних площинах: комп'ютерна вказує на інструментарій досягнення наукового результату, а прикладна лінгвістика орієнтована на результат.

На думку В.А.Звегінцева, під прикладною лінгвістикою найчастіше розуміють усі види автоматичного оброблення мовної інформації (Language-data Processing) –

машинне розпізнавання усного мовлення,

машинний переклад,

автоматичне класифікування технічних та інших документів,

автоматичне анотування текстів,

Однак, на думку цього ж вченого, не варто обмежувати прикладну лінгвістику лише цією проблематикою. На думку Б. Городецького, до галузей прикладної лінгвістики належать:

лінгводидактика,

лексикографія,

практична стилістика,

теорія перекладу,

термінознавство,

теорія штучних мов,

прикладна риторика,

теорія масової комунікації,

текстологія,

нормування мови та мовне планування,

польова лінгвістика,

теорія писемності,

методи лікування мовних порушеньтощо (Городецький, 1983, с. 7). Сьогодні основна ознака прикладної лінгвістики – це міждисциплінарність.

 

Отже, сьогодні прикладну лінгвістику розуміють широко – як діяльність із використання наукових знань про побудову й функціювання мови в нелінгвістичних наукових дисциплінах й у різних сферах практичної діяльності людини, а також як теоретичне осмислення такої діяльності.

 

Коло завдань прикладної лінгвістики.

Коло проблем, які постають перед прикладною лінгвістикою, не можна вважати зовсім новими для мовознавства. Перед мовознавством із самого початку його існування постало завдання оптимізації функцій мови – чи то формування і підтримування традиції читання й розуміння сакральних текстів (екзегетика та герменевтика), чи забезпечення контактів між різними народами.

Оптимізація – надання чому-небудь оптимальних, найбільш сприятливих властивостей, співвідношень.

Розрізняють комунікативну, епістемічну й когнітивну функцію мови, які, своєю чергою, поділяються на дрібніші функції.

Комунікативна функція містить фатичну (контактовстановлювальну) та інформаційну (за вузьким розумінням) функції, функцію впливу, соціальну функцію (яка виявляється в мовній політиці).

З погляду епістемічної функції мовна система постає як спосіб збереження й передавання знань, а також як відображення специфічно національного погляду на світ – відображення національної самосвідомості.

Епістемологія – розділ філософії, що вивчає сутність пізнання та критерії його істинності.

 

Когнітивна функція пов’язана з мисленням людини й пізнанням дійсності. За допомогою мови знання інтерпретуються, що приводить до породження нових знань.

З функційного погляду прикладну лінгвістику можна визначити як дисципліну, яка вивчає й розробляє способи оптимізації функціювання мови.

 

Оптимізацією комунікативної функції мови займаються такі дисципліни, як теорія перекладу, машинний переклад, теорія і практика викладання рідної та нерідної мови, теорія і практика інформаційно-пошукових систем, створення інформаційних і, ширше, штучних мов, теорія кодування.

Під кодуванням в широкому значеннірозуміють процес перетворення повідомлень на сигнал. Як під час передавання, так і під час зберігання та оброблення інформації значні переваги дає дискретна форма представлення сигналів.

У зв'язку з цим термін "кодування" відносять звичайно до дискретних сигналів і під кодуванням у вузькому сенсі розуміють відображення дискретних повідомлень сигналами у вигляді певних поєднань символів.

Соціальна функція мови - як частина комунікативної – втілюється в соціолінгвістиці та мовній політиці, в орфографії та орфоепії, в теорії впливу, в політичній лінгвістиці.

Епістемічна функція в той чи інший спосіб виявляється в лексикографії (зокрема комп’ютерній), в термінології й термінографії, в корпусній та польовій лінгвістиці.

 

Оптимізація когнітивної функції зосереджена в комп’ютерній лінгвістиці, в лінгвістичній кримінології, у психолінгвістиці й афазіології, у квантитативній лінгвістиці.

 

Комп'ютерна лінгвістика є настільки частиною прикладної лінгвістики, наскільки вона може розв'язувати конкретні завдання повсякденного життя людини й суспільства. Сьогодні не підлягає сумніву той факт, що широкий спектр проблем прикладної лінгвістика вирішується за допомогою комп’ютерів.

Комп'ютерна лінгвістика спрямована на розроблення автоматизованих методів зберігання, опрацювання, перероблення й використання лінгвістичних знань, а її метою є реконструкція знань про мову й у мові, які б забезпечували автоматизацію інтелектуальних функцій і когнітивної діяльності людини, автоматизованого породження мовлення та його комп'ютерне опрацювання й розпізнавання.

За допомогою комп'ютерних технологій прикладна лінгвістика вирішує проблеми, які мали багатовікову історію та спершу ґрунтувалися на механічних засобах. Це стосується, наприклад, синтезу звукового мовлення, ідея якого виникла ще у XVIII ст. і була втілена у перші механічні синтезатори мовлення (однією з перших машин, яка могла вимовляти п'ять голосних, був синтезатор створений працівником Санкт-Петербурзького університету В. Кранценштейном наприкінці XVIII ст., приблизно в цей же час Вольфганг фон Кемпелен спроектував машину, яка відтворювала 20 мовоподібних звуків).

У 1788 році Кемпелен створив машину, яка говорить, що складалася з чотирикутної дерев'яної скриньки, довжиною близько 1 м і шириною 0,5 м, виготовлену з хутра, ця скринька мала складну систему клапанів, штифтиків тощо; ця машина відтворювала голос дитини 3-4 років. Близько 1828 цю машину удосконалив механік Пош в Берліні.

У 1922 р. Стюарт опублікував результати розроблення статичного електросинтезатора-форманта. Першим електричним синтезатором був вокодер американця Гомер Дадлі (20—30-ті pp.), який спочатку здійснював спектральний аналіз мовленнєвого сигналу й виділяв його акустичні параметри, а потім синтезував вихідний сигнал на підставі цих параметрів. Вокодером керував оператор за допомогою клавіш, які пов'язувалися з 10 смуговими фільтрами, що охоплювали весь спектр звукових частот. За таким самим принципом будувався формантний синтезатор, який базувався на звукових формантах.

Сучасні синтезатори звукового мовлення мають автоматизовану основу, є комерційними, застосовуються у навігації, військовій техніці, банківській справі, транспорті, зв'язку, діловодстві тощо. Вони необхідні людям, що погано бачать чи або втратили зір, для німих, для створення автовідповідачів, довідкових систем у місцях загального користування, управління складними об'єктами в аварійних ситуаціях, комп'ютерних ігор тощо. Синтез і розпізнавання звукового мовлення є проблемами прикладної фонетики.

 

Отже, лінгвістичне забезпечення автоматизованих систем - це сукупність засобів, що дозволяють здійснювати комп'ютеризацію мовної діяльності, що супроводжує (в явній або прихованій формі) практично будь-яку інтелектуальну діяльність людини. З технологічного та системного погляду мова йде про створення того чи іншого типу автоматизованої системи опрацювання тексту (АСОТ)- деякого процесора, на вході і на виході якого є текстова інформація природною мовою. Типи АСОТ різноманітні і можуть бути націлені на моделювання різних мовних процесів, таких, наприклад, як діалогова взаємодія, стиск інформації, реферування тексту, логічне опрацювання змісту, переклад на іншу природну мову тощо. З власне лінгвістичного погляду процеси, що здійснюються в машині під час вирішення подібних задач, зводяться до перезапису інформації тими чи іншими (природними і штучними) мовами. Зовнішні критерії, якими керуються творці АСОТ, підводяться під загальну формулу «оптимізація спілкування людини і машини». Саме цю задачу вирішує така комплексна наукова дисципліна, як комп’ютерна (обчислювальна) лінгвістика і її найбільш істотна частина - обчислювальна семантика. Прикладні результати, очікувані в цій галузі, - це семантичні алгоритми та семантична метамова, тобто моделі процесів (здобування інформації з тексту та втілення її в текст) та відповідних мов представлення знань (яких зберігається та переробляється інформація, витягнута з текстів).

 

Потужним напрямом прикладної лінгвістики є машинний переклад, головними завданнями якого є

1) формування теоретичної й експериментально-статистичної бази перекладу, яка передбачає розроблення синтаксичних, морфологічних, семантичних, словникових систем і їхніх аналізаторів, трансформаційних правил і їхніх обмежень, моделей трансферних мов-посередників, підходів до синтезу вихідного тексту або фрази;

2) створення практичних моделей бінарного перекладу, орієнтованих на дві мови, або інваріантних, які працюють незалежно від типу мов;

3) забезпечення релевантності вибору еквівалентів на базі багатоваріантних рішень і їхньої лексико-синтаксичної фільтрації (шляхом розробки моделей синтаксичного керування, зворотного зв'язку між смислом і текстом, багаторівневої організації мови);

4) розроблення діючих автоматичних або автоматизованих систем машинного перекладу;

5) удосконалення чинних моделей за рахунок інтелектуалізації машинного перекладу на підставі введення когнітивних компонентів декларативних і процедурних знань (знаньпро світ, галузь науки або техніки, процедур інференції, прогнозування розвитку описуваних ситуацій з огляду на наявність структур інтерпретації ситуації і т. ін.).

Поряд із використанням автоматизованих систем, прикладна лінгвістика має й інші вектори практичного застосування знань про мову й мовлення.

По-перше, це патопсихолінгвістичнийнапрямок, завданнями якого є розроблення методик діагностики й мовленнєвої симптоматики психічних захворювань із патологією мовлення.

Наприклад, афазія – це захворювання, яке полягає в порушеннях мовлення, що виникають через ураження кори головного мозку (насамперед кори лівої півкулі - у правшів). Ураження мають органічний характер, виникаючи в результаті травм, поранень, судинних захворювань, пухлин головного мозку. Вивченням типів афазії займався Олександр Романович Лурія, який і склав одну з класифікацій типів афазії, в якій враховувалися особливості патології мовлення.

Результати досліджень, під час яких широко використовувалися дані лінгвістичної теорії, показують, що кора головного мозку розділена на різні ділянки, що утворюють дві взаємопов'язані системи. Перша система утворена задніми (тім'яними-потилично-скроневими) відділами; вона відповідає за приймання, перероблення і зберігання інформації. Друга система пов'язана з роботою передніх відділів кори головного мозку, що відповідають за формування намірів, планів і програм поведінки людини. Структура парадигматичних представлень кодується задніми відділами лівої півкулі. При ураженні цих ділянок головного мозку хворі допускають помилки в парадигматичних відносинах, при тому що синтагматичні відносини збережені. Якщо порушуються передні відділи, то парадигматичні відношення збережені, але синтагматика висловлювання порушена. Звідси випливає, що парадигматичні та синтагматичні відносини обслуговуються різними системами головного мозку.

Р. Якобсон описав відмінності парадигматичні та синтагматичні відмінності в афазії в термінах протиставлення «селекції», яка відображає парадигматичний аспект мовної системи, і «комбінації», що представляє синтагматичні відносини [Якобсон 1985 б, с. 289; Якобсон 1996]. Роман Якобсон обговорює цікавий з лінгвістичного погляду приклад хвороби російського письменника Гліба Івановича Успенського. Його ім'я та по батькові розділилося в його свідомості на дві зовсім різні істоти: Гліб наділявся в уявленні Успенського усіма його позитивними якостями, а Іванович - втілював всі його вади [Якобсон 1996, с. 50 і далі]. Очевидно, що в даному випадку порушення належать до сфери синтагматики.

Р. Якобсон сформулював гіпотезу, згідно з якою процес розпаду мовлення при афазії повторює в зворотному порядку процес становлення мовлення в онтогенезі, а відновлення мовної здатності афатиків в процесі лікування повторювати процес засвоєння мови дитиною. З цього випливає, що найбільш складні аспекти мовної компетенції і мовленнєвої поведінки втрачаються в першу чергу, а відновлюються самими останніми. В основному гіпотеза Р. Якобсона отримала експериментальне підтвердження.

Лінгвістичні дані дозволяють робити висновки і про інших психічні розлади. Наприклад, мовлення шизофреників на ранніх стадіях характеризується нечіткістю, нескладністю, порушеннями артикуляції, невмотивованим варіюванням гучності виголошення. Письмовий текст, стійкі словосполучення втрачають цілісність, висловлювання погано мотивовані і тематично не співвідносяться одне з одним. Маніакально-депресивні психози супроводжуються спрощенням синтаксичної структури речення, помилками в реалізації моделей керування дієслів. Руйнування здібності до планування призводить до помилкового вибору лексеми із синонімічного ряду - Він врізав їй під очі замість Він врізав їй під око. Лінгвістичний експеримент виявляється важливим чинником діагностики психічних захворювань.

Можливості програми лінгвістичних знань у цій галузі аж ніяк не обмежуються діагностикою. Курс реабілітації хворих вимагає серії спеціальних лінгвістичних вправ.

 

По-друге, це судова лінгвістика, орієнтована на розв'язання практичних завдань сфери судочинства й криміналістики, як-от: установлення авторства усного й письмового текстів, оцінка комунікативних намірів тексту, отримання інформації про адресанта тексту (його віковий, статевий, соціальний, національний статус, емоційно-психологічний стан), визначення способу створення тексту (запису під диктовку, наявності постредагування, навмисного викривлення письмового тексту і т. ін.), мовного забезпечення судової справи тощо.

Зародженням галузі „судової лінгвістики” вважається публікація Яна Свартіка „Справа для судової лінгвістики”, що була опублікована у 1968, але, звісно, сам лінгвістичний аналіз свідчень та спроби того, що ми зараз називаємо „судово-лінгвістичною експертизою”, були ще задовго до того дня. Проте лише з виокремленням судової лінгвістики у самостійну галузь прикладної лінгвістики почалося швидке формування і розвиток методів. Науковці намагалися підкріпити свої теоретичні гіпотези та припущеннями реальними фактами та прикладами. Почали з’являтись публікації та системи комп’ютерної підтримки таких експертиз.

Лінгвістичні свідчення спираються на фонетичний, синтаксичний, лексичний аналіз, аналіз почерку, дискурс та соціолінгвістичний аналіз. Кожен з них сприяє зниженню ступеня суб’єктивності свідчень експерта в суді.

Таким експертом можна вважати прикладного лінгвіста, котрий дає свої свідчення в суді. Звісно, такий експерт не обов’язково має встановити винен підсудний чи ні, але на основі проведеного аналізу і зібраних даних він висловлює припущення, що спирається на його теоретичні знання та досвід експерта, і має на меті показати суду і присяжним ті лінгвістичні прогалини, які є невидимими для ока пересічної людини – не лінгвіста.

До дискурс-аналізу в юридичній сфері належать виправлення стенограм. З лінгвістичного погляду, жодну із наявних стенограм не можна назвати «точною». Тому їх розбивають на розмовні елементи, виявляючи, наприклад, сумнівні чи таємно записані мовні злочини. Більша частина аналізу взаємозв’язків зафіксованих у таких стенограмах містить соціолінгвістичний розгляд соціального контексту розмови, розуміння учасниками одне одного, що походить від вибору ними теми, відповідей на запитання, коментарі та репліки, які можна вважати «лінгвістичними підказками». За словами M. Култарда [Coulthard 1996, 171], часто проводять дискурс-аналіз поліцейських рапортів або свідчень підсудних, що передбачає застосування таких методів, як порівняння текстів сумнівного і безсумнівного авторства, показує стислість свідчень, які вважались дослівними, та „звернення до ймовірності” [Coulthard 1992, 252] – під ймовірністю тут мається на увазі логічні висновки із опрацьованого матеріалу (наприклад, малоосвічений підозрюваний скоріш за все не може сказати синтаксично складного речення, яке фігурує у рапортах поліції).

Один із прикладів застосування дискурс-аналізу містить насмішку з максими кількості, одна із таких максим – максима Грайса, описана ним у статті 1975 року, „Логіка і розмова” [Coulthard 1993]. Згідно з цією максимою, будь-яка розмова не має містити більше інформації, ніж необхідно. Наприклад, у сумнівному свідченні Вільяма Повера, один із свідків захисту у відомій справі „Бірмінгемської Шістки” у Великій Британії, сказав: „Я бачив як Хагі дав Вокеру свою сумку,” тимчасом як у поліцейському рапорті було зазначено: ”Хагі дав Джоні Вокеру його білу пластикову сумку” (прим. авт. – plastic bag (англ) – пакет (укр.), з метою дотримання контексту та ілюстрації прикладу застосовано дослівний переклад). У контексті своїх свідчень Вокер міг припустити, що поліція знає ім’я Вокера. А тим більше, під час допиту, прикметники білий і пластиковий виникали б поступово (якщо взагалі). Неприродна повторюваність таких деталей у поліцейській версії є явною ознакою „надмірної чіткості”, що є типовою для „надуманих”, неприродних текстів. Виявилось, що Повер видав набагато більше інформації, ніж хто-небудь це зробив би за нормальних умов.

Крім надмірної чіткості, дискурс-аналіз виявив, що оці суперечні рапорти поліції не містили запитань, що зазвичай виникли б при звичайній розмові. Звиклі допити вміщають „пов’язані з темою послідовні обміни”, в яких тема згадується відповідно до питання, після чого задаються подальші питання для уточнення заданої теми. Таким чином утворюється певна логічна послідовність [Coulthard 1996, 166].

 

По-третє, це розроблення і вдосконалення методик навчання рідній й іноземній мові, які потребують оптимізації з метою досягнення успішного ефективного результату.

По-четверте, це лінгвістика комунікативного впливу, яка передбачає розроблення методик і моделей нейролінгвістичного програмування, мовленнєвих технологій у сферах бізнесу, управління, ЗМ1, іміджмейкерства, рекламної справи, PR-технологій тощо.

По-п'яте, це лінгвопроектування, спрямоване на створення штучних мов різного ґатунку (апріорних й апостеріорних, комп'ютерних).

По-шосте, прикладна лінгвістика має лексикографічне та прескриптивне спрямування (створення систем транскрипції та транслітерації, упорядкування термінології, формування машинних фондів мови, словників тощо).


Читайте також:

  1. Автоматичне і ручне створення об’єктів.
  2. Автоматичне регулювання витрати помпових станцій
  3. Автоматичне регулювання.
  4. Автоматичне розвантаження по струму.
  5. Єдина система класифікації та кодування. Категорії класифікаторів
  6. ЗАВДАННЯ ШКОДИ В СТАНІ КРАЙНЬОЇ НЕОБХІДНОСТІ ЯК ПІДСТАВА ВИНИКНЕННЯ ЗОБОВ’ЯЗАНЬ ЇЇ ВІДШКОДУВАННЯ. Необхідна оборона
  7. За­палювання. Автоматичне регулювання залежно від навантаження на двигун відбувається за рахунок вакуумного регулятора.
  8. Напівавтоматичне та автоматичне дугове зварювання під флюсом
  9. Підстави звільнення страховика від виплати страхової суми чи відшкодування.
  10. Погашення судимості-це автоматичне її припинення при встановленні певних, передбачених законом умов.




Переглядів: 2431

<== попередня сторінка | наступна сторінка ==>
Космогонічні міфи як зразкова модель міфології | Методи прикладної лінгвістики.

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

  

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.038 сек.