Студопедия
Новини освіти і науки:
МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах


РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання


ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ"


ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ


Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків


Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні


Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах


Гендерна антидискримінаційна експертиза може зробити нас моральними рабами


ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ


ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів



Типи математичних моделей.

Існують різні класифікації математичних моделей. Ми відзначимо тут декілька окремих типів, які будуть зустрічатись далі і мають специфічні ознаки. математичні моделі реальних технологічних систем можуть мати ознаки різнихх типів.

Детерміновані (визначені) математичні моделі. Всі співвідношення а також параметри в детермінованій математичній моделі є однозначно визначеними. Результат рішення також дає групу однозначних чисел – значень вихідних параметрів Y1, Y2,Y3…YN . Переважна більшість математичних моделей, які будуть розглянуті далі, є детермінованими.

Стохастичні математичні моделі на відміну від детермінованих містять параметри або окремі співвідношення імовірного характеру. Ці моделі описують стохастичні (випадкові) процеси, в яких значення параметрів є випадковими і підлягають дії статистичних законів і теорії імовірності. В різних технологіях стохастичними є процеси виготовлення штучної продукції. В безперервному дискретному потокові виробів , наприклад, однотипних деталей після процесу гальванопокриття, окремі вироби відрізняються один від другого своїми вихідними характеристиками (товщина покриття, рівномірність, блиск, адгезія, тощо). Вхідні параметри також випадкові – локальна густина струму, швидкість конвекції і гранична густина струму, локальна концентрація при слабому перемішуванні електроліту. В математичному моделюванні таких систем для обробки результатів використовують методи теорії імовірності та математичної статистики.

Математичні моделі систем з розподіленими параметрам. В багатьох задачах, де розглядають функціонування електрохімічних систем, процеси розподіляються нерівномірно в геометричному просторі модельованого об’єкта. Наприклад, нерівномірно розподілені густини струму на поверхні великогабаритних електродів, концентрації учасників електрохімічних реакцій вздовж потоку розчину в електрохімічних апаратах витискування, концентрації і густини струму в пористих електродах, тощо. Такі об’єкти описують системами диференційних рівнянь другого порядку, які належать до математичної теорії поля.

Важливою ознакою математичних моделей цього типу є наявність похідних по геометричних координатах робочого простору і залежність вихідних характеристик системи від її геометричних параметрів – геометричної форми, габаритних розмірів тощо.

Математичні моделі систем з розподіленими параметрами використовують для вирішення задач електрохімічної макрокінетики. Цим терміном позначають комплекс теоретичних положень про визначення інтегральної швидкості електрохімічного процесу для електрохімічних пристроїв, де має місце значна нерівномірність розподілу локальної швидкості процесу всередині пристрою.

Математичні моделі систем з зосередженими параметрами. На відміну від попереднього варіанту в цій групі розглядають технічні об’єкти в цілому, в умовах, коли можна вважати розподіл процесу у внутрішній частині об’єкта рівномірним. Тоді в математичній моделі координати внутрішнього простору відсутні, а з геометричних факторів враховують практично лише площі електродів для визначення струму, міжелектродну відстань та об’єм робочої частини. Ці параметри входять в математичні моделі як константи.

Математичні моделі динамічних систем. До динамічних систем відносять такі технічні об’єкти (технологічні процеси), стан яких, тобто група характерних вихідних параметрів Y1, Y2,Y3…YN, закономірно змінюється з часом. Математична модель містить диференційні рівняння з похідними d Y /dt.

Процес, стан якого з часом змінюється, називають нестаціонарним. Мета моделювання – знайти динамічні характеристики об’єкта, тобто часові залежності невідомих параметрів Yn= f(t).

Математичні моделі статичних систем. На відміну від динамічних, в статичних системах (технологічних процесах) стан системи не змінюється протягом необмеженого часу. Такі процеси називають стаціонарними, в їх математичні моделі час як параметр не входить. Проте часова тривалість процесу при цьому може фігурувати в математичній моделі як константа.

Імітаційні моделі.

 

 

2. математична модель в системі управління

 

Математичне моделювання і розрахунки, які виконуються в технології, є лише окремим елементом двох видів діяльності. Перший – створення деякого технічного об’єкта, в тому числі технологічного процесу (це робота проектантів, конструкторів, технологів, дослідників), другий - оптимальна організація роботи технічної системи і управління технологічним процесом (робота експлуатаційників).

Проблеми управління технологічним процесом виходять за межі спеціальних дисциплін і складають предмет окремого розгляду в рамках понять технічної кібернетики. Не розглядаючи тут кібернетику в цілому, ми відокремимо декілька зв’язаних понять і закономірностей управління, які необхідно розуміти для того, щоб усвідомлено оцінювати місце, роль і завдання математичного моделювання в предметній технічній галузі – в даному випадку в електрохімії та електрохімічній технології.

 

2.1. Головні поняття технічної кібернетики

Кібернетика –наука про управління. Термін походить від грецького слова «кібер»- руль корабля, його ввів ще старогрецький філософ Платон, а французький фізик Ампер (1834 р) назвав так науку про управління державою. Сучасна кібернетика як наука веде свій початок з 1948 р, коли вийшла з друку книга професора математики Масачусетського технологічного інституту (США) Норберта Вінера «Кібернетика, або управління і зв'язок в тварині і машині»

Кібернетична системасистема, яка діє для досягнення мети. Сюди належать всі біологічні об’єкти та технічні системи, які спеціально сконструйовані для виконання деякої конкретно визначеної функції. Такі системи є кібернетичними виключно в процесі виконання відповідної функції. Функцією біологічних об’єктів є саме життя.

У всіх кібернетичних систем, як біологічних так і технічних, спільною є загальна структура, елементи цієї структури і схема управління в процесі виконання функції, наведена на рис.2.1.

 

Рис. 2.1. Функціональна схема кібернетичної системи, або системи управляння.

Головним елементом в кібернетичній схемі є сам об’єкт, який функціонує для досягнення деякої конкретної мети. В технологічних системах ця мета очевидна –виробництво продукту. Стан об’єкта, при якому він вважається задовільно функціонуючим, в процесі функціонування змінюється з часом. На схемі рис. 2.1 це показано стрілкою «збурення», що означає неконтрольований (а часто невідомий чи випадковий і непередбачуваний) вплив оточуючого середовища на систему. Наприклад, з часом зменшуються каталітичні властивості електродної поверхні, зменшується гідравлічна проникність сепаратора і зростає його електричний опір, накопичуються шкідливі домішки в електролітах, і багато інших, найчастіше відомих і якісно передбачуваних явищ, рівень дії яких прогнозувати неможливо .

Стан об’єкта – це окрема неповторна комбінація кількісних та якісних значень параметрів, Y1, Y2,Y3…YN , х1…хМ, фіксованих контролюючими органами (приладами), така, що відрізняється від інших можливих комбінацій. Це визначення означає, що відхилення числового значення навіть одного параметра на величину, яку помічає відповідний контролюючий прилад, вважається як перехід об’єкта до іншого (сусіднього) стану.

Важливою характеристикою об’єкта є кількість його можливих станів NCT. Вона залежить від того, скільки параметрів контролюється у об’єкта, і з якою різницею Dx, DY відповідний прилад здатний гарантовано розпізнати два сусідні значення кожного параметра:

(2.1)

З наведеного виразу можна зробити висновок, що чим більша чутливість вимірювальних та регулюючих приладів (тобто чим менші значення Dx, DY) , тим більшу кількість станів зможе розрізняти управляюча система і тим точнішим і ефективнішим буде управління об’єктом .

дозволені і забороненістани. Стани об’єкта, які визначаються розрахунками математичної моделі, можуть бути дозволені і заборонені (законами природи). Забороненими, наприклад, будуть стани з концентрацією речовини в розчині, яка перевищує межу розчинності (за виключенням особливих ситуацій існування термодинамічно нестійких пересичених розчинів). На рис.2.2 наведено простий приклад електроліту LiOH в водно-літієвих хімічних джерелах струму як керованої системи з двома параметрами електроліту Y, його характеризуючими – температурою та концентрацією. Кожний окремий стан на рисунку зображується точкою на площині графіка в координатах Y1-Y2 В даному випадку дозволену двохкоординатну область існування станів можна відобразити на площині. Вона має форму чотирикутника і обмежена чотирма лініями: відрізком осі температур (відокремлює дійсні концентрації від недозволених від’ємних), верхньою лінією температури кипіння і нижньою –температури замерзання розчину LiOH, а також правою лінією межі розчинності LiOH в воді. За межами чотирикутника розташована область заборонених станів. Заборонені стани можуть виникати в результаті неточних або невірних розрахунків математичної моделі, але реально вони не існують.

Регламентована область. В області дозволених станів не всі стани є прийнятними для даної технологічної системи. Наприклад, в роботі джерела струму при температурах, які перевищують 50оС, або при низьких концентраціях LiOH літій бурхливо і неконтрольовано взаємодіє з водою. При великих же концентраціях, близьких до межі розчинності LiOH має місце надмірно низька швидкість процесу. Тому в межах дозволеної області в технологічних системах завжди існує ще менша за розміром робоча або регламентована(тобто обмежена технологічним регламентом) область станів.

Оптимальна область. Традиційні технологічні регламенти процесів вказують верхню і нижню межі допустимих коливань кожного параметра. Але навіть в рамках регламентованої області різні стани розчину нерівноцінні. Без доказів можна стверджувати, що всередині регламентованої області повинна існувати ще менша за розмірами область найкращих (оптимальних) станів, або навіть єдиний оптимальний стан. Окремі незалежні алгоритми пошуку таких станів складають предмет розгляду розділу «оптимізація технологічних систем».

 

 

Рис.2.2. Стани розчину гідроксиду літію

Фазові траєкторії. Таким терміном позначають поступовий дрейф параметрів об’єкта від деякого початкового стану. Дрейф, або поступове зміщення станів виникає як результат постійної дії різних зовнішніх чи внутрішніх факторів (збурень), або як реакція об’єкта на миттєву регулюючу дію (наприклад, вмикання або вимикання або зміну величини струму). Такі траєкторії потрібно знати для того, щоб передбачити можливість самовільного виходу об’єкта в нерегламентовану, або навіть потенційно аварійну область станів, а також для того, щоб знати способи примусового переводу об’єкта в потрібний стан. Можливі типові траєкторії, які виникають після примусової регулюючої дії на об’єкт, наведені на рис. 2.3.

На рис. 2.3а показаний найбільш характерний для більшості технологічних процесів тип фазових траєкторій. Сукупність таких траєкторій, які відрізняються положенням початкового стану і заповняють всю область станів, називають фазовим портретом об’єкта. Характерна особливість цієї системи траєкторій є те, що з якого б початкового стану не починалась траєкторія руху об’єкта після короткочасних збурень (примусового переводу в різні початкові стани), вона закінчується в одному і тому ж стані. Цю точку на графіку називають сингулярною точкою, їй відповідає стаціонарний режим роботи об’єкта.

 

Рис. 2.3. Можливі фазові траєкторії станів системи з двома параметрами

 

Аналіз фазових траєкторій дає важливу інформацію про поведінку об’єкта. Наприклад, якщо рисунок 2.3.а розглядати як фазовий портрет електроліту LiOH в джерелі струму, тоді теоретичні (розраховані на математичній моделі) траєкторії 1-3 треба вважати небезпечними, бо вони хоч і ведуть до нормального стаціонарного режиму, але проходять через небезпечну область, обмежену температурною межею (на рисунку показана штриховою лінією).

Перехід до стаціонарного стану може мати вигляд спіралі, що скручується в напрямку до сингулярної точки, як на рис. 2.3.б. При цьому динамічні характеристики об’єкта Y1(t),Y2(t) матимуть такий вигляд як штрихова лінія на рис.2.3г – затухаючі періодичні коливання. Об’єкт, що веде себе таким чином (фазові траєкторії а,б), з точки зору управління є стійким, бо короткочасні випадкові збурення приводять його через деякий час (або одразу, або через декілька коливань) в попередній стан стаціонарного режиму.

На рис. 2.3в наведена фазова траєкторія об’єкта в формі спіралі, що розкручується. Тут параметри об’єкта після короткочасного збурення коливаються, а амплітуда коливань з часом зростає. Оскільки зростання не може бути безмежним, то це означає , що через деякий час об’єкт перейде в нерегламентовану область станів, або навіть в аварійний стан. В даному випадку система нестійка. В технології такі системи нечасто, але зустрічаються в тих випадках, коли в системі існує додаткове внутрішнє джерело енергії.

Аналогічні, але помірніші ефекти можна проілюструвати на фазовій траєкторії рис.2.3д. Об’єкт стійко працює в стаціонарному режимі, і при невеликих збуреннях повертається до нього. Така ситуація позначається терміном «стійкий в малому». При значних же збуреннях фазова траєкторія об’єкта також має вигляд спіралі, що скручується всередину, але переходить не до стаціонарного режиму, а в режим незатухаючих коливань параметрів. На фазовому портреті об’єкта йому відповідає замкнутий контур, показаний штриховою лінією.

Управляюча система – система, яка коригує відхилення стану об’єкта управління від мети функціювання. Управляюча система діє за програмою управління. Складовою частиною цієї програми і є інформація про властивості об’єкта, тобто його модель, яка в сучасних технічних системах з комп’ютерним управлінням має форму звичайної математичної моделі (1.1) .

Для того, щоб кібернетична система безперервно працювала, управляюча система також безперервно (регулярно з деяким часовим інтервалом Dt ) повинна одержувати освідомлювальну інформацію про стан об’єкта в даний момент часу, тобто поточні тимчасові значення параметрів Y1,Y2,Y3…YN. Вони або ж залишаються на заданих рівнях, або змінюються під дією зовнішніх чи внутрішніх збурень. Цю інформацію управляюча система в технології одержує за допомогою різних приладів. Після кожного її оновлення система управління переробляє одержані дані у відповідності з алгоритмом управління. Головною частиною цього алгоритму є вирішення математичної моделі (1.1) для того, щоб визначити необхідні значення регульованих параметрів х1…хМ. Ця вихідна інформація як команда і поступає на виконавчі механізми.

Виконавчі механізми – технічні пристрої, за допомогою яких регулюють кількісні рівні параметрів (струми, напруги, швидкості потоків, тощо), вмикають або вимикають електричні прилади, крани та вентилі на гідравлічних лініях, тощо.

Таким чином, в схемі функціонування кібернетичної (синонім слова «керованої, управляємої» ) системи здійснюється безперервний потік інформації в двох протилежних напрямках –прямий потік управляючої інформації (команди) від управляючої системи до об’єкта, і зворотний потік освідомлювальної інформації від об’єкта до управляючої системи.

 

Закономірності роботи кібернетичних систем

А. Головний механізм впливу збурень, показаних на схемі кібернетичної системи рис. 2.1 , формулює 2-й закон термодинаміки: в ізольованій системі всі самовільні процеси приводять до зростання ентропії, дезорганізації і безпорядку. Самовільними процесами в системах електрохімічної технології є корозійні процеси, старіння матеріалів та електролітів, пасивація електродів і каталізаторів, хімічні реакції за участю компонентів навколишнього середовища, тощо.

В кінці дії таких процесів система переходить в неробочий стан, а ентропія досягає максимуму. Максимум ентропії означає, що об’єкт з однаковою імовірністю може виявитись в будь-якому з дозволених станів. З точки зору управління процесом це ж твердження можна сформулювати точніше: при максимальній ентропії імовірність того, що стан об’єкта виявиться в робочій області, близька до нуля.

Б. Ступінь організованості.Кібернетичну систему можна назвати управляємою (організованою) , якщо вона здатна протягом тривалого часу утримувати об’єкт в межах робочої (регламентованої або оптимальної) області станів. Ступінь організованості системи тим більша, чим менший розмір робочої області, максимальною вона могла б бути, якщо б об’єкт утримувався в якомусь єдиному оптимальному стані.

Ступінь організованості кібернетичної системи, тобто якість управління, неважко визначити кількісно. Можна також визначити ступінь «неорганізованості», як структурну ентропію, скориставшись формулою Больцмана, яка була виведена в рамках молекулярно-кінетичної теорії будови речовини для статистичних систем з великої кількості станів (10 і більше порядків):

 

, (2.2)

де k=1.38×10-23 Дж/К , W- термодинамічна імовірність стану, в даному випадку – кількість станів. Математичну імовірність стану можна визначити як результат ділення кількості станів у відповідній області (робочій або оптимальній) на загальну кількість станів NCT.

 

В. Завдання управлінняоб’єктомполягає в тому, щоб при безперервній дії збурень утримувати об’єкт в межах робочої області або в ще меншій оптимальній області станів.

Таким чином, дія постійно діючих збурень у відповідності з 2-м законом термодинаміки намагається вивести об’єкт з регламентованої області станів, а система управління протидіє цьому шляхом періодичних короткочасних регулюючих дій, які виконуються виконавчими органами за командами управляючої системи.

Г. Управляюча системапо функціональному відношенню до об’єкта є частиною «зовнішнього середовища» – її дія на об’єкт також має форму короткочасного збурення. Різниця полягає лише в тому, що «зовнішнє середовище» діє непередбачуваним чином, а управляюча система виконує точно розраховану дію, внаслідок якої об’єкт переходить в заданий стан. Сам по собі ізольований об’єкт не здатний функціонувати без управляючої системи.

Д. Існування кібернетичної системи неможливе без інформаційних потоків. В управлінні циркулює інформація двох типів:

Ознайомлювальна інформація про те, в якому стані знаходиться об’єкт в момент спостереження. Цю інформацію дають вимірювальні прилади та органи чуття.

– Інформація про те, як управляти станом об’єкта. Ця інформація також містить три головні частини:

· знання властивостей об’єкта і траєкторій його руху, які містяться в математичній моделі об’єкта;

· знання способів знаходження оптимальних станів;

· знання способів переходу від одного стану до заданого іншого, наприклад, оптимального. Це і є власне алгоритм управління.

 

 

Всі дії управляючої системи по збиранню інформації, її опрацюванні, формулюванні управлінського рішення і команди в сукупності складають програму управління.

Алгоритми управління можна грубо розділити на дві групи.

Детерміновані алгоритми управління. Вони працюють на основі математичної моделі, яка дає точну залежність між регульованими вхідними и нерегульованими вихідними параметрами, однозначно визначає поведінку об’єкта в різних умовах. Математична модель дає можливість точно визначити дію, яка приведе об’єкт в заданий стан. Недолік детермінованого алгоритму – нечутливість до дії факторів, які не передбачені в математичній моделі. Такий алгоритм не здатний виконувати правильні дії по управлінню об’єктом в умовах, коли з часом змінюється поведінка «навколишнього середовища».

Адаптивні алгоритми управління. На відміну від детермінованих, в адаптивних алгоритмах математична модель об’єкта (1.1) не використовується взагалі, а зв’язки між параметрами Y1, Y2,Y3…YN та х1…хМ встановлюються лише шляхом пробних дослідів на самому об’єкті, тобто в процесі управління. Сам алгоритм простий - він пробує різні випадкові дії, аналізує результат цієї дії, і обирає найкращий варіант. Одночасно запам’ятовує свої дії і їх результати, тобто в процесі управління «навчається».

Адаптивні алгоритми мають ту перевагу, що вони здатні правильно реагувати на будь-які непередбачувані ситуації, навчатись в процесі управління і вдосконалюватись. Недоліком адаптивних алгоритмів є повільність їх роботи – для навчання потрібно витрачати час.


2.2. Інформація та інформаційні процеси

 

 

2.2.1. Загальні характеристики інформації.

В кібернетичних системах здійснюються процеси, які можна віднести до трьох категорій – матеріальні (наприклад, хімічні перетворення в технологічній послідовності операцій), енергетичні (на здійснення будь-яких процесів потрібно витрачати енергію) та інформаційні (обмін інформацією з системою управління). Таким чином, інформація є невід’ємним елементом функціонування управляємих систем, і тому потрібно розуміти її характеристики, орієнтуватись в тому, які процеси здійснюються за її участю і які вимоги до неї ставить система управління.

Інформація відображує таку властивість об’єкта , як різноманітність– чим більш різноманітний об’єкт (кількість вимірюваних параметрів, кількість станів по кожному з параметрів), тим більше слів потрібно використати для його описання і тим більше об’єм інформації.

Інформація, на відміну від матерії та енергії, не підлягає дії закону збереження – вона може утворюватись чи зростати, і може зникати.

Поняття інформації має сенс лише в сполученні з поняттям «управління». Будь-які знання запам’ятовують для того, щоб використати для якоїсь мети, а це і є елемент управління. В неорганічному світі інформація цілеспрямовано не використовується. В найпростіших біологічних організмах вже є механізми використання інформації з навколишнього середовища (наприклад, реакція рослин на зміну температури або освітленості). Найвищого рівня здатність видобувати інформацію розвинена у людини.

Інформація нематеріальна сама по собі, але проявляється завжди в матеріальній формі – на матеріальних носіях.

Носій інформації – це фізичний процес (наприклад, струм в провіднику, звукові чи світлові хвилі) або фізичний об’єкт (папір, дискета, магнітна стрічка).

Сигнал – це сукупність повідомлення та його фізичного носія . Повідомлення – сама інформація, яка міститься на носії.

Мова – система, яка пов’язує носія та повідомлення.. Мова містить чотири головних елементи:

· знаки (букви, звуки, цифри);

· слова ( сполучення знаків, які мають смислове значення);

· словник (повний комплект слів та їх значень);

· граматика, або синтаксис – правила використання букв та знаків.

 

Сучасна теорія інформації, основи якої були закладені американським математиком Клодом Шенноном в 1949 р, розглядає і аналізує різні питання інформатики на 3-х рівнях:

· синтаксичний рівень аналізує внутрішні властивості мови як системи букв (знаків). Параметрами цього рівня є кількість знаків, кількість слів у мові, швидкість передавання інформації через канали зв’язку. Ці проблеми важливі для техніки зв’язку , економічності передавання інформації та роботи обладнання, бо чим більший потік знаків через канал зв’язку, тим більші економічні, енергетичні та матеріальні витрати. Завдання теорій інформатики синтаксичного рівня – оптимізація і економічність передавання інформації, мовні механізми її захисту від пошкодження в каналі зв’язку .

· семантичний (змістовний) рівень. На цьому рівні розглядаються проблеми відношень між словами та змістом. Головна мета теорій цього рівня – оцінювання кількості інформації в повідомленні.

· Прагматичний (практичний) рівень - оцінювання інформації з точки зору системи управління, коли важливим є лише зміст інформації та його практичні характеристики – актуальність (важливість і своєчасність), точність, повнота, цінність з точки зору ефективності управління. Математичне моделювання – це робота з інформацією (вхідними даними) на прагматичному рівні.

 

Вимірювання кількості інформації. Одиниця вимірювання кількості інформації на синтаксичному рівнібіт (від binary digitдвійкова одиниця). Біт – найменша кількість інформації, яка міститься в повідомленні «так» або «ні». Використовують і інші одиниці вимірювання кількості інформації на синтаксичному рівні:

· 1 Байт = 8 біт. Це довжина кодового слова в перших поколіннях ЕОМ.

· 1 кілобайт (Кб) = 210 = 1024 байт = 8192 кілобіт (~ 1000 байт).

· 1 мегабайт (Мб)= 106 байт

 

 

Частіше в техніці використовують одиницю «байт», яка дорівнює 8 біт.

Розглянемо штучну (машинну) «мову», створену для дискретного періодичного передавання показань термометра з температурним інтервалом 0-128 оС від вимірювального приладу до управляючої системи. Мову оберемо двійкову, тобто вона має лише два знаки (букви)– «0» та «1», які є синонімами виразів звичайної мови «ні» і «так». Кількість слів мови (словник) – 128, якщо сусідні значення температури відрізняються на 1 оС. Потрібно визначити довжину одного слова мови, тобто кількість знаків-букв в слові – порції інформації, яка відображує значення температури в переданому сигналі-слові. Вимога до мови – слова повинні відрізнятись між собою щонайменше однією буквою.

Проілюструвати механізм вирішення цієї задачі можна простим прикладом, показаним на рис.3.1. Припустимо, що потрібно передати значення температури 70 оС з точністю до 1оС, перетворене в форму одного слова мови. Слово складається лише з нулів та одиниць. Завдання полягає в тому, щоб визначити, скільки там має бути знаків, і як вони повинні бути розташовані.

Щоб відповісти на це питання, досить було б задати 7 питань, на які відповідь має складатись лише з двох значень – «так» або «ні», 0 або 1 (рис. 3.1).

Рис.2.2.1. Схема двійкового кодування повідомлення

 

Розділимо інтервал, в якому може знаходитись відповідь, на дві частини Перше запитання записане на рисунку в нижньому рядку: чи знаходиться температура в лівій половині повного інтервалу 1-128 оС, тобто на ділянці 1-64 оС ? Негативна відповідь дає першу букву слова – «0», і інформацію про те, що вірне значення розташоване в правій половині інтервалу, 65-128 оС. Далі аналогічну процедуру повторюємо для інтервалу 65-128 оС, поділивши його надвоє точкою 96 оС і одержуємо другу букву «1» в слові. Зрозуміло, що в повному інтервалі можливих температур 1-128 оС потрібно задати стільки запитань, скільки разів потрібно виконати ділення надвоє, щоб досягти ширини інтервалу 1оС. Можна бачити, що ділень потрібно 7, а це і означає довжину слова – 7 біт, саме ж слово має вигляд 0111011.

Якщо точність оцінювання температури збільшити вдвічі (відстань між сусідніми значеннями 0.5 оС ), зросте і кількість «слів»- сигналів вдвічі, до 256. Але довжина слова зросте лише на 1 біт і буде дорівнювати 8 біт.

Співвідношення між максимальною кількістю слів мови N, довжиною слова H і кількістю знаків-букв S дає відома формула Хартлі, яку можна записати в ступеневій або логарифмічній формі:

 

або (2.2.1)

В формулі Хартлі всі значення мають однакову імовірність. Якщо ж урахувати в наведеному прикладі, що окремі значення температури мають різну імовірність, можна суттєво скоротити довжину слова. Наприклад, якщо справа ідеться про температуру навколишнього середовища, то можна відкинути значення температур, які перевищують 60оС, тоді кількість слів N буде меншою. Точно це завдання вирішується за формулою Шеннона, яка враховує імовірність р1, р2, …рN кожного з n=1…N повідомлень

. (2.2.2)

 

Формула Хартлі є частковим випадком формули Шеннона. Дійсно, якщо всі імовірності мають однакове значення p=1/N, тоді одержуємо:

. (2.2.3)

На рис.2.2.2 наведено графік функції, яка входить в квадратні дужки в формулу Шеннона (2.2.3).

Рис.2.2.2 Залежність кількості інформації, яку несе повідомлення, від його імовірності.

З графіка можна зробити важливий висновок, який робить поняття інформації більш зрозумілим: повідомлення, яке має імовірність «0» ( стан неможливий) або «1» (стан достовірний, як 2´2=4) – ніякої інформації не несуть, і їх використання для цілей управління не дає ніякої користі. Отже, інформація це виключно такі повідомлення, які знімають з об’єкта невизначеність.

В теорії інформації величину «Н», яка визначається за формулами Хартлі або Шеннона, називають «ентропія інформації». Цей термін означає повну кількість потенціального знання, яке до одержання повідомлення ще є «незнанням». Н – апріорна величина, яку можна підрахувати, взагалі не одержуючи повідомлення, вона є лише наслідком властивостей даної мови. А інформація, яка міститься в повідомленні – це та частина невизначеності («незнання»), яку повідомлення знімає з об’єкта. Вона є різницею між початковою та кінцевою ентропією, яка залишилась після одержання повідомлення:

. (2.2.4)

В частковому випадку, коли повідомлення вичерпне, кінцева ентропія дорівнює нулю, а І=Н. Але можлива ситуація, коли повідомлення неповне або неточне, тоді в загальному випадку І< Н0 . Наприклад, якщо датчик температури дає підвищену помилку, не 1 оС, як передбачено, а 4оС, НК=2 біт, і кількість одержаної інформації буде І=7-2=5 біт.

Таким чином з наведених прикладів зрозуміло, що кількість циркулюючої в системах управління інформації – це величина, яка залежить від структури самої системи управління. Чим вона складніша (містить більшу кількість параметрів, більшу кількість вимірюваних станів) – тим більший об’єм інформації, але тим точнішими і кращими будуть результати управління.

 

2.2.2. Інформаційні процеси

Формування інформації.Вхідну інформацію для систем управління (а для об’єкта вона є вихідною) формують різноманітні вимірювальні прилади. Кожний з них формує сигнал, який несе зашифроване на відповідному носії повідомлення . В сигналі інформація зашифрована інформаційним параметром.

З точки зору інформатики і незалежно від типу носія, сигнали відрізняються типом інформаційного параметра і характером сигналу.

Інформаційних параметрів використовують головним чином три типи:

· амплітуда (величина, або числове значення параметра);

· частота коливань параметра з постійною амплітудою;

· фаза (положення сигнала-імпульса на точно визначеному відрізку часу - такті).

 

Рис. 2.2.3. Типи інформаційних параметрів: амплітуда (а), частота (б) і фаза (в)

 

Сам сигнал може бути в двох формах – безперервним (аналоговим) або дискретним (періодичним). При цьому безперервність або навпаки дискретність може бути як по амплітуді, так в часі.

Рис. 2.2.4. Сигнали, дискретні і безперервні за часом (а) і амплітудою (б)

Безперервний (аналоговий) сигнал такий, що значення інформаційного параметра можуть бути будь-яким числом, а сусідні значення відрізняються нескінченно малими величинами. Безперервний в часі сигнал означає, що прилад дає сигнал в будь-який момент часу (наприклад, діаграмна стрічка на самопишучому приладі)

Дискретність (періодичність) сигналу по амплітуді означає, що існує кінцева кількість рівнів сигналу. Кожний рівень містить в собі деякий кінцевий інтервал DU значень амплітуди сигнала. Кількість таких рівнів і є кількістю станів параметра U. Наприклад, якщо цифровий термометр дає показання, які представлені лише цілими числами без десяткової частини ( з точністю до 1оС) , то це означає, що сигнали мають дискретні рівні 0-1, 1-2, 2-3, 3-4 оС і т.д. Будь-які нецілі числа такий прилад не розрізняє і вони виявляються в одному з інтервалів.

Дискретність за часом означає, що інформаційний сигнал поступає періодично, з деяким часовим інтервалом Dt. Таку форму мають, наприклад, регулярні записи в журналі спостережень.

Дискретність або безперервність сигналу може бути властивістю об’єкта або властивістю приладу. Наприклад, сигнал напруги електролізера в записі на діаграмній стрічці є безперервним в часі , а в записі в журналі – дискретним. Сигнали про вхід-вихід завантажувального пристрою в лінії гальванопокрить - дискретні і в часі, і по амплітуді (кількість пристроїв, оброблених в лінії за годину).

Існують прилади, які автоматично перетворюють дискретні сигнали в безперервні, і навпаки, безперервні в дискретні – аналого-цифрові та цифро-аналогові перетворювачі. Операція перетворення дискретного сигналу в безперервний виконуються за допомогою математичних операцій апроксимації числового ряду, інтерполяції. Зворотне перетворення називають квантуванням. Необхідність таких операцій зумовлена тим, що ЕОМ працюють з дискретними потоками даних, а прилади (датчики та виконавчі механізми типу електродвигунів) – з безперервними електричними сигналами .

Кодування інформації.Кодуванням інформації називають переклад повідомлення з одного носія на інший. Процес кодування здійснюється, наприклад, коли струм в телефонному провіднику перетворюється спочатку в механічні коливання мембрани, а потім коливання мембрани – в звукові коливання повітря. Кодом можна назвати будь-яку мову або комп’ютерну програму. Кодуванням є також розглянутий вище процес перетворення сигнала від електричного термометра в двійкову форму.

Кодування в техніці є процесом на синтаксичному рівні – воно виконується як механічна операція, заснована на властивостях мови, і не зачіпає змісту повідомлення.

В теоріях кодування використовуються формули Хартлі і Шеннона. Завдання теорії кодування в проектуванні різних кібернетичних систем – створити код (мову), яка була б досить економічною і одночасно захищеною від спотворень. Якщо в мові, яку ми розглянули для термометра, в повідомленні-слові буде невірним хоч один знак – повідомлення буде помилковим. Захист кодів від порушень заснований на надлишковості коду. Надлишковість – це властивість мови, яка означає, що довжина одного слова HФАКТ перевищує необхідну мінімальну величину Н при заданих значеннях S (кількість букв) та N (кількість слів мови), визначену формулою Хартлі, тому при наявності помилкових букв зміст повідомлення можна прочитати. Звичайні європейські мови надзвичайно надлишкові. При S~30 та Н~ 5 згідно формули Хартлі можна було б очікувати N=305=24.3×106 слів у мові, тоді як реально, наприклад, найбільші словники не перевищують 30 тис слів. Таким чином, коефіцієнт надлишковості звичайних мов складає ~24.3 ×106/ 30×103 ~ 1000! Це і дає можливість використовувати великі скорочення слів і розпізнавати тексти з великою кількістю помилок. В технічних мовах надлишковість набагато менша, але вона є необхідною умовою захисту інформації від пошкоджень, які виникають при передаванні інформації через технічні системи (канали зв’язку). Наприклад, можна кожну букву повторювати тричі, тоді один помилковий символ легко розпізнати.

Передавання інформації. Сукупність технічних засобів, призначених для передавання інформаційних сигналів від джерела до приймача, називають «каналом передачі» або «каналом зв’язку» (рис. 3.4). Елементами каналу зв’язку є технічні пристрої для кодування та декодування сигналів.

.

Рис. 2.2.5. Структура каналу зв’язку для передавання інформації

Швидкість передавання сигналів в каналах обернено пропорційна тривалості одного імпульсу : , і вимірюється в біт/с, її називають «смуга пропускання частот». В електричних лініях зв’язку обмежена мінімальна тривалість одного імпульсу t*, а внаслідок цього і максимальна швидкість передавання, бо через наявність електричної ємності та індуктивності провідників короткий імпульс прямокутної форми спотворюється і тому приймач електричних сигналів його не розпізнає.

В каналах передавання сигналів завжди під дією зовнішніх впливів і внутрішніх неконтрольованих процесів виникають шуми (самовільні додаткові сигнали), які і є причиною появи помилок в сигналах. Тому швидкість передавання сигналів насправді менша теоретично можливої. Запобігають цим шкідливим явищам за допомогою технічних пристроїв, наприклад, підсилювачів сигналу, і програмними методами, наприклад, використанням захисних кодів, стійких до зовнішніх пошкоджень.

Зберігання інформації. Інформація не завжди використовується в момент її одержання, найчастіше її потрібно деякий час зберігати. В окремих випадках (музеї, архіви) термін зберігання досягає багатьох років. Тому важливим елементом функціонування будь-яких кібернетичних систем є наявність якісних систем зберігання інформації. Якість техніки зберігання інформації характеризує і якість управління і рівень самої кібернетичної системи . Процес зберігання інформації настільки важливий, що поява принципово нових технічних систем зберігання означає початок нової технічної революції. Таке значення мало винайдення паперу (Єгипет, 2 тисячоліття до н.е.), перфораційної карти для ткацького станка (1741 р, Ада Лавлейс – дочка відомого англійського поета Дж.Байрона, її ім’ям названа одна з мов програмування –АДА), фотографія (1839), кіно (1895), магнітний запис (1928), запис променем лазера (1980).

Існує декілька вимог до системи зберігання.

· Компактність, тобто висока щільність запису і малий об’єм фізичного носія. На папері щільність запису невисока, одна сторінка типової книги містить приблизно 50-60 рядків і стільки ж букв в рядку, тобто 2500-3000 байт (2.5-3 кілобайт). Дискета 3.5´´ на магнітній плівці вміщує 1.4 мегабайт, тобто приблизно до 500 сторінок звичайного тексту – ціла книга (без малюнків). Дискета з лазерним записом містить вже 700 мегабайт, тобто цілу бібліотеку з 500 книг. Правда, рисунки кодуються інакше, і займають набагато більше пам’яті – високоякісний кольоровий малюнок може мати більше 5-10 Мб, набагато більше, ніж ціла книга (це особливості кодування різнотипної інформації на синтаксичному рівні).

· Надійність. Це важлива властивість, яка означає стійкість носія до зовнішніх впливів і внутрішніх процесів. Вона особливо важлива для систем тривалого зберігання. Дуже надійними були неолітичні системи збереження інформації - малюнки, вибиті на кам’яних стінах печер та скель, вони збереглись протягом десятків тисяч років. Такі ж надійні шумерські таблички з обпеченої глини, які збереглись протягом 3-4 тисяч років. На жаль, інформаційна ємність таких технічних систем дуже низька (на синтаксичному рівні, на відміну від також надзвичайно високої змістовної ємності на семантичному рівні). Відомі проблеми тривалого зберігання паперових документів – окислення, старіння, дія біологічних чинників, вологи, освітлення, тощо. Магнітна стрічка також недосить стійка. Полімерний носій (лавсанова плівка) з часом втрачає механічні властивості і стійкість, магнітний шар руйнується механічно, інформація на магнітному шарі руйнується під впливом електромагнітних полів полів, радіаційних випромінювань. Лазерні диски також вимагають дуже обережного поводження, їх полімерна основа з часом здатна руйнуватись, не витримує механічних пошкоджень і різких температурних впливів, може втратити прозорість. Робочий шар також дуже чутливий до механічних впливів. Ідеально надійної системи зберігання інформації не існує.

· Сумісність. Ця властивість може бути представленою як «читабельність» - вона означає здатність повідомлення на даному носії до того, щоб бути зчитаним різними користувачами – людиною, різними ЕОМ, іншими машинами (сканер). З точки зору сумісності паперові документи якісні – їх здатна читати людина, ЕОМ (через сканер), факс. Розвиток інформаційних технологій призвів до високої спеціалізації нових сучасних систем запису та зчитування інформації, тобто погіршення сумісності. Модернізація техніки і програмного забезпечення створює нову проблему – інформація, записана на фізичних носіях раніше, може не читатись на нових ЕОМ або новими програмами і стає недоступною для використання, тобто фактично втрачається, незважаючи на фізичну непошкодженість.

· Швидкість доступу. Ця властивість особливо важлива для виконання управлінських функцій. З точки зору швидкості доступу до інформації різні носії відрізняються на багато порядків. В бібліотеках час доступу складає хвилини –години, на зовнішніх магнітних носіях – до 10-2 с, лазерних – до 10-5 с, а на електронних мікросхемах – до 10-7 с.

Представлення інформації.Інформація-сигнал на виході каналу зв’язку може бути представлена в різній формі (на різних носіях), в залежності від того, хто чи що є одержувачем. Одержувачем може бути людина, тоді інформація може бути представлена на екрані монітора, на папері, на фотоплівці. У випадку, коли інформаційний сигнал призначений для використання технічними пристроями, він має відповідну закодовану структуру команди для даного пристрою (наприклад, системи комп’ютерного управління технологічними процесами).

Переробка інформації. Це найважливіший інформаційний процес, який здійснюється на більш складному семантичному (змістовому) рівні. В цьому процесі змінюється сама інформація – з вхідної вона перетворюється в нову інформацію (народжується нова інформація).

 

Існують три типи процесів переробки інформації.

· Перетворення інформації. Це процес перетворення вхідної інформації за визначеними математичними алгоритмами. Саме до цього типу належить математичне моделювання, де вхідні дані х1…хМ перетворюються в вихідні Y1, Y2,Y3…YN, а також алгоритми перетворення сигналів вимірювальних приладів в числові значення рівнів параметрів. Наприклад, перетворення сигналу електричного термометра (напруга) в значення температури, апроксимація дискретного ряду показань в безперервний, тощо.

· Класифікація та логічний аналіз. Процес аналогічний тому, який відбувається в бібліотеці – розподіл інформації на групи за сформульованими ознаками, для зручності збереження і пошуку.

· Пошук інформації. Процес, зворотний по відношенню до класифікації. Два останніх процеси здійснюються на основі положень математичної логіки. Існують спеціальні алгоритмічні мови для програмування логіко-математичних операції. Вони використовуються для побудови систем управління комп’ютерними базами даних , алгоритмів штучного інтелекту, адаптивних алгоритмів управління, тощо.

Використання інформації. Цей інформаційний процес здійснюється вже на найвищому прагматичному рівні, він являє собою використання повідомлень (незалежно від типу носія) для цілей управління. Інформація, тобто відокремлене від носія повідомлення використовується управляючою системою в математичній моделі об’єкта управління. Властивості інформації на цьому рівні – актуальність, повнота, точність.

Академік АН України В.М.Глушков вперше сформулював поняття про два інформаційних бар’єри, які виникають в кібернетичних системах в процесі використання інформації.

· Якщо потік вхідної інформації перевищує швидкість її переробки управляючою системою, надлишкова її частина не може бути використана для управління і ігнорується (бар’єр насичення).

· Ресурси кібернетичної системи (енергетичні, матеріальні, фінансові) розподіляються на дві частини – на виконання головної функції об’єкта і на управління. В процесі функціонування кібернетичної системи з часом зростає об’єм циркулюючої інформації і як наслідок –витрати ресурсів на цей процес. Витрати здійснюються за рахунок виконання головної функції. При таких умовах наступає момент, коли всі ресурси витрачаються на управління, а головна функція не буде виконуватись (бар’єр розвитку).

Вказані два бар’єри описують механізми негативних явищ, які потрібно враховувати при проектуванні і експлуатації технічних систем.

 

 


2.3. Оптимізація

 

2.3.1. Загальні поняття та терміни

Математичні моделі технологічних систем вирішують одну задачу – з деякої групи довільно заданих значень вхідних параметрів х1…хМ знаходять відповідну групу значень вихідних параметрів Y1, Y2,Y3…YN . Повний комплект значень всіх параметрів характеризує деякий конкретний стан об’єкта. З технологічних міркувань значення параметрів об’єкта можуть коливатись в деяких межах без негативного впливу на процес (коливання дозволені технологічним регламентом).

Проте в самій математичній моделі не існує відповіді на питання – який стан об’єкта з усіх дозволених регламентом найкращий. Відповідь на нього можна одержати лише в рамках більш широкої задачі управління, аналізуючи мету функціонування об’єкта.

Критерій оптимізації. Для того, щоб кількісно оцінювати якість кожного стану об’єкта (в шкалі добре-погано), вводять ще один параметр – так звану цільову функцію або інакше – критерій оптимальності Ф. Зміст цього параметра і його математичне вираження формулюють в процесі створення програми управління. Важливо те, що формула для визначення критерія Ф ураховує не тільки параметри об’єкта, але також інші параметри, які характеризують мету його функціонування і до самого об’єкта відношення не мають. Наприклад для технологічних процесів виробництва продукції зручно використовувати економічні критерії – собівартість продукції або прибуток в розрахунку на одиницю кількості продукту (гривень/кг). Наприклад, якщо в розрахунку на один електрохімічний апарат, що працює з напругою U і струмом I за деякий час t виробляється кількість продукту mПР , а витрачається сировини і матеріалів mС, заробітна плата персоналу складає за той же час Z гривень, тоді два вказаних критерії могли б мати в спрощеному вигляді (без урахування інших витрат на технологічні потреби) приблизно такий вигляд:

 

, (2.3.1)

, (2.3.2)

 

де SС, SПР, SЕ – ціни на сировину, продукти, електроенергію. Знаки сум в формулах означають, що в технологічному процесі може використовуватись декілька типів сировини і матеріалів, і вироблятись декілька продуктів.

В ці формули входять ціни на речовини та енергію. Вони є характеристикою оточуючого середовища, а не об’єкта, і безпосередньо зв’язані з метою функціонування об’єкта – виробляти заданий продукт з найменшою собівартістю або з найбільш можливим прибутком. Обидва критерії таким чином оцінюють вплив навколишнього середовища на мету функціонування об’єкта – воно або погіршує цільову функцію Ф (витрати зростають, прибуток зменшується, мету досягти важко), тобто робить виробництво менш доцільним, або покращує (зменшує витрати, збільшує прибуток). Такі зовнішні параметри фактично можна розглядати як фактори «зовнішнього збурення», що неконтрольовано змінюються в часі.

Обидва критерії, незважаючи на протилежність свого змісту (собівартість має негативний зміст, прибуток – позитивний), однаково правильно оцінюють зміну якісного стану об’єкта при управлінських діях стан погіршується чи покращується, стан найгірший чи найкращий. Але через протилежність змісту мета функціонування об’єкта формулюється для негативного критерія як «мінімальна» собівартість продукту, а для позитивного як «максимальний» прибуток. Щоб позбутись цієї незручності, мету функціонування об’єкта для узагальнення формулюють як виробництво продукту при екстремальному значенні критерія оптимізації.

У багатьох випадках критерій Ф має екстремальне значення лише в деякому одному стані об’єкта (х1…хМ , Y1, Y2,Y3…YN). Відхилення від цього стану в будь-який бік приводить до відхилення і від екстремуму критерія Ф, тобто його погіршенню (збільшення собівартості, зменшення прибутку). Це можна проілюструвати на прикладі формули (2.3.1). Якщо процес електролізу вести при дуже малому струмі І®0, тоді знаменник і перші два доданки в чисельнику будуть також наближатись до нуля (не витрачаються сировина і енергія, не виробляється продукт), а в чисельнику постійним числом залишається лише заробітна плата Z. Тому при І®0 критерій Ф необмежено зростає, Ф ®¥. І навпаки, якщо процес вести при надмірно великому струмовому навантаженні, чисельник буде необмежено зростати за рахунок перших двох доданків, а знаменник буде наближатись до постійної величини, яка визначається густиною граничного дифузійного струму (зменшується вихід за струмом). В цьому випадку також формально цільова функція має тенденцію необмеженого зростання , Ф ®¥. Таким чином очевидно, що в цілому залежність критерія Ф від струму навантаження повинна мати форму увігнутої лінії з мінімумом при деякому конкретному значенні струму.

Для технологічного об’єкта можна формулювати декілька різних критеріїв оптимізації. Наприклад, крім двох наведених вище можна скористуватись чисто технічними критеріями – мінімальні витрати електроенергії на одиницю продукту, мінімальні витрати сировини на одиницю продукту, максимальна питома енергія або максимальна питома потужність хімічного джерела струму. Характерно, що кожному критерію відповідатиме окремий оптимальний стан об’єкта. Наприклад, хімічне джерело струму має максимальну енергію U×I×t при дуже малих навантаженнях, І®0, а потужність U×I при цьому наближається до нуля. Максимум же потужності спостерігається найчастіше при великому струмі, наближеному до струму короткого замикання.

Таким чином, критеріїв можна формулювати багато, але для конкретної оптимізації критерій оптимальності повинен бути обраним лише один.

 

Резюмуючи сказане , можна точніше сформулювати деякі поняття оптимізації.

Оптимізація – дії управляючої системи, спрямовані на те, щоб перевести об’єкт управління в оптимальний стан. Дія полягає в тому, щоб розрахувати і видати команду про встановлення на оптимальному рівні значень групи вхідних (безпосередньо регульованих) параметрів х1, х2,…. Образно кажучи, оптимізація об’єкта – це встановлення регуляторів в найкращих положеннях.

Більш вузький зміст терміна «оптимізація», який часто можна зустріти в літературі – сам математичний алгоритм пошуку оптимального стану. Розділ прикладної математики, де розглядають алгоритми оптимізації, має назву «нелінійне програмування».

Використання алгоритму оптимізації для визначення оптимального стану об’єкта є лише частиною дії управляючої системи.

Оптимальний стан – такий стан об’єкта, при якому критерій оптимальності Ф досягає екстремуму (максимального значення позитивного критерію, мінімального – негативного).

Оптимізовані (оптимізуємі) параметри – деякі вхідні регульовані параметри х1…хМ , які приймають участь в процесі пошуку оптимального стану. Звичайно регульованих параметрів на технологічних об’єктах декілька, але оптимізують їх не всі, а лише деякі з них, саме ті, вплив яких на якість технологічного процесу найважливіший. Кількість оптимізованих параметрів F £ N називають числом ступенів свободи оптимізаційної задачі. Число F визначає і математичний тип задачі – одновимірні (F =1 -один оптимізуємий параметр), двовимірні (F =2 –два оптимізуємих параметри), тривимірні і т.д.

Координати оптимуму - числові значення оптимізованих вхідних параметрів х1.

 

2.3.2. Графічне відображення оптимізації

 

Процес пошуку оптимального стану об’єкта можна наочно відобразити графічним способом, якщо кількість оптимізуємих параметрів F – один або два .

В одновимірній оптимізації (F=1) залежність критерія оптимальності Ф від значення єдиного оптимізуємого параметра х можна відобразити простим графіком залежності Ф(х), який матиме мінімум або максимум.

В двовимірних задачах цільову функцію Ф(х12) можна відобразити як двовимірну поверхню в координатній системі ( Ф,х12). На площині таку поверхню простіше зображувати горизонтальними перетинами, які мають назву «ізолінії Ф=const». Це лінії, на кожній з яких значення критерія Ф залишається постійним. Якщо екстремум один, тоді система ізоліній матиме вигляд концентричних замкнутих ліній, вкладених одна в другу. Аналогічні ізолінії однакових висот чи глибин рисують на географічних картах.

 

Рис. 2.3.1. а- Графічне зображення поверхні цільової функції Ф(х12)), б– проекції її горизонтальних перетинів (ізоліній Ф=const) на координатну площину (х12).

 

2.3.3. Алгоритми оптимізації

Всі алгоритми оптимізації (а їх існує велика кількість) зводяться до виконання деякої ітераційної (повторюваної) процедури, кожний крок якої складається з послідовності таких операцій:

· Обирається за певним правилом деяка конкретна комбінація значень оптимізуємих параметрів х1, х2,..хF (попередній стан об’єкта) і значення всіх 1…m параметрів змінюються на величину кроку Dх ( наступний стан) :

2.3.3)

де верхній індекс n означає номер кроку , нижній - номер параметра в списку.

Правилами вибору наступного стану якраз і відрізняються різні алгоритми

· Виконується розрахунок на математичній моделі значень вихідних параметрів Y1, Y2,Y3…YN та підраховується значення критерія оптимальності Ф ;

· Значення критерія оптимальності, підраховане на крокові «М» (ФM), порівнюється зі значеннями критерія Ф на попередніх найближчих кроках (ФM-1, ФM-2,…), одним або декількома, і з цих даних робиться висновок про те, в якому напрямку слід зробити наступний крок (тобто як змінити значення всіх оптимізуємих параметрів і перевести об’єкт в новий стан, більш близький до оптимального).

В залежності від способу вибору напрямку кроку Dх методи оптимізації можна розподілити на дві групи – градієнтні та без градієнтні.

 

Градієнтні методи засновані на підрахуванні та аналізі часткових похідних критерія оптимальності за параметрами х1,….хm:

(2.3.4)

Кожна похідна підраховується за значеннями критерія оптимальності Ф в двох точках – хn та хn+1. Знак та величина похідної показують, наближується чи віддалюється значення критерія Ф від екстремуму при виконанні одного кроку. В формулі (2.3.4) похідна виражена приблизним дискретним (різницевим) способом, тому чим меншим буде крок m , тим точнішим буде значення похідної, але тим більше кроків потрібно виконати до досягнення екстремуму функції Ф(х12..). В алгоритмах часто спочатку крок обирають великим, а в процесі пошуку при наближенні до екстремуму поступово зменшують.

Значення параметрів х1, х2,.. – це числа з різними розмірностями, які неможливо порівнювати між собою. До того ж числа можуть набагато відрізнятись між собою за величиною. Тому в градієнтних методах значення параметрів потрібно нормалізувати, тобто представити у безрозмірній формі з інтервалом коливань 0…1. Нормалізація виконується діленням розмірного значення параметра хn на різницю між найбільшим і найменшим розмірним значеннями (інтервал змінювання в задачі) :

. (2.3.5)

Розглянемо декілька прикладів градієнтних методів .

Метод релаксації . Спочатку підраховують всі часткові похідні по змінним х (dF/dx1,і dF/dx2), і вибирають ту змінну (наприклад, х1) , у якої модуль похідної максимальний, тобто найшвидше змінюється критерій Ф. Саме в напрямку цієї координати х1 і рухаються, змінюючи лише один цей параметр. Рух продовжується до того моменту, коли буде знайдено найбільше значення критерія Ф (точка * на рис.2.3.2.а на лінії руху 1). В точці максимуму значення похідної дорівнює нулю, і більшою за модулем стає інша похідна, в двовимірній задачі - . Зі знайденої точки максимуму (х1*) функції Ф(х1) починають рухатись в напрямку осі х2, доки не буде знову знайдено максимальне значення функції Ф(х2). Далі всі операції повторюються. Якщо таким чином змінювати по черзі напрям руху, поступово стан зміщується до оптимального від будь-якої початкової точки.

 

а б

Рис.2.3.2. Траєкторії руху стану до оптимального з різних початкових точок в методі релаксації (а) та методі градієнта. (б)

 

Метод градієнта відрізняється від релаксаційного тим, що на кожному крокові одночасно змінюються значення усіх параметрів, кожний з них пропорційно модулю відповідної часткової похідної, або . Тому напрямок руху буде співпадати з напрямком вектора градієнта функції Ф(х1,х2), тобто по найкоротшій траєкторії, перпендикулярно до ізоліній Ф= const.

 

Метод найшвидшого спуску є комбінацією двох попередніх методів, який дещо зменшує недоліки обох – неоптимальну траєкторію пошуку в релаксаційному методі і необхідність підрахування всіх часткових похідних в методі градієнта. Тут також спочатку підраховують всі часткові похідні, обирають напрямок руху уздовж напрямку градієнта , і рухаються в цьому напрямку до того моменту, поки не зміниться знак приросту критерія оптимальності (Ф n+1 – Ф n ), тобто коли буде досягнуте екстремальне значення в цьому напрямку. В цій точці знову підраховують всі часткові похідні критерія Ф, обирають новий напрямок руху і рухаються до чергової точки екстремуму.

Безградієнтні методи засновані на порівнянні значень критерія оптимальності в результаті виконання декількох кроків і не вимагають підрахування часткових похідних.

Пошук екстремуму однієї змінної . Це найпростіша одновимірна задача. Вона зводиться до пошуку мінімуму чи максимуму на залежності Ф(х) в області визначення параметра х (інтервал між найменшим xMIN та най


Читайте також:

  1. Аналіз розв’язків спряжених економіко-математичних задач
  2. Використання математичних методів у дослідженнях
  3. Вимоги до математичних моделей
  4. Застосування генетико - математичних методів у тваринництві
  5. Застосування у розрахунках ризику імовірнісних структурно-логічних моделей.
  6. Класифікація інформаційних моделей.
  7. Лекція 5. Правова охорона винаходів і корисних моделей.
  8. Лекція 5.Правова охорона винаходів і корисних моделей.
  9. Наведемо декілька рикладів побудови моделей.
  10. Перевірка гіпотези про рівність математичних сподівань нормальних генеральних сукупностей.
  11. Передумови та постановка задачі однофакторного дисперсійного аналізу в контексті перевірки статистичної гіпотези щодо рівності математичних сподівань багатьох вибірок
  12. Побудова багатофакторних моделей.




Переглядів: 3919

<== попередня сторінка | наступна сторінка ==>
Математичне моделювання | REAL I,MA,MB,J1,J2

Не знайшли потрібну інформацію? Скористайтесь пошуком google:

  

© studopedia.com.ua При використанні або копіюванні матеріалів пряме посилання на сайт обов'язкове.


Генерація сторінки за: 0.063 сек.