МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах
РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ" ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах Гендерна антидискримінаційна експертиза може зробити нас моральними рабами ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів Контакти
Тлумачний словник |
|
|||||||||||||||||||||||||||||||||||||
Розв’язування матричних ігор в змішаних стратегіяхНехай гра задана матрицею (табл. 3.4.) Таблиця 3.4
Через p1, p2, ..., pm позначені ймовірності, з якими гравець A використовує чисті стратегії A1, A2, ..., Am.; , , а через ймовірності, з якими гравець використовує чисті стратегії , Визначення 3.9. Впорядкована множина P=(p1; ...; pm), елементи якої задовольняють умовам , і повністю визначають характер гри гравця A, називається його змішаною стратегією. Таким чином, змішаною стратегією гравця A є повний набір ймовірностей застосування його чистих стратегій. Будь-яка його чиста стратегія Aі може розглядатися як частинний випадок змішаної стратегії, i-такомпонента якої дорівнює 1, а решта – 0, тобто Визначення 3.10. Впорядкована множина Q=(q1;...; qn), елементи якої задовольняють співвідношенням і повністю визначають характер гри гравця В, називається його змішаною стратегією. Нехай гравці A і B застосовують змішані стратегії P і Q. Це означає, що гравець A використовує стратегію Aі з ймовірністю рі , а гравець B - стратегію Bj з ймовірністю qj. Оскільки гравці вибирають свої чисті стратегії випадково і незалежно один від одного, то ймовірність вибору комбінацій стратегій (A ,Bj) буде дорівнювати добутку ймовірностей piqj. При використанні змішаних стратегій гра набуває випадкового характеру. Випадковою стає і величина виграшу гравця A (програшу гравця B). Тому тепер йдеться лише про середню величину виграшу (математичне сподівання). Ясно, що ця величина є функція від змішаних стратегій P і Q і визначається за формулою: (3.3) Визначення 3.11. Функція f(P,Q) називається платіжною функцією гри з матрицею (aij)m´n. Гравець A,змінюючи свої змішані стратегії P, намагається максимізувати середній виграш f(P,Q), а гравець B, змінюючи свої змішані стратегії Q –зробити цей виграш якомога меншим. Для розв’язку гри з точки зору гравця A необхідно знайти такі змішані стратегії P і Q, при яких би забезпечувався середній виграш, що дорівнює Визначення 3.12. Величина називається верхньою ціною гри, а величина – нижньою. Визначення 3.13. Змішані стратегії P* і Q* гравців A і B, які задовольняють рівність (3.4) називаються оптимальними. Визначення 3.14. Величина , яка визначається формулою (3.4), називається ціною гри. Дамо ще одне еквівалентне визначення оптимальних змішаних стратегій. Визначення 3.15. Змішані стратегії P* і Q* гравців A і B відповідно називаються оптимальними змішаними стратегіями, якщо вони утворюють сідлову точку для платіжної функції f(P,Q), тобто задовольняють нерівності (3.5) З нерівностей (3.5) випливає, що в сідловій точці (P*, Q*) платіжна функція f(P,Q) досягає максимуму по змішаних стратегіях P гравця A і мінімуму по змішаних стратегіях Q гравця B. Виявляється, що якщо використовувати змішані стратегії, то для будь-якої матричної гри можна знайти оптимальні стратегії і ціну гри. В цьому полягає зміст наступної теореми, яка в теорії ігор вважається основною і яку ми формулюємо без доведення. Теорема 3.2. В змішаних стратегіях будь-яка скінченна матрична гра має сідлову точку. Наступна теорема дає відповідь на питання: в якому випадку набір буде розв’язком гри. Теорема 3.3. Для того, щоб змішані стратегії і були оптимальними для гравців A і B в грі з матрицею і ціною гри , необхідно і достатньо виконання нерівностей , (3.6) . (3.7) Дана теорема стверджує, що якщо гравець A застосує оптимальну змішану стратегію P*, а гравець B – будь-яку чисту стратегію Bj, то виграш гравця A буде не меншим від ціни гри . Якщо гравець B використовує оптимальну змішану стратегію Q*, а гравець A – будь-яку чисту стратегію Aі, то програшгравця B не перевищить ціну гри . Розв’язок гри можна суттєво спростити, якщо своєчасно виявити в матриці гри домінування одних стратегій над іншими, оскільки це дозволяє скоротити розмірність матриці. Зауваження 3.1. Якщо в матриці гри елементи k-го рядка не менші за відповідні елементи s- го рядка, тобто , то виграш гравця A при стратегії Ak буде більшим, ніж при стратегії , якою б стратегією не користувався гравець B. Тому для гравця A стратегія Ak буде вигіднішою, ніж стратегія . В зв’язку з цим кажуть, що стратегія Ak домінує над стратегією . Зауваження 3.2. Аналогічно, якщо елементи -го стовпчика не більші за відповідні елементи r-го стовпчика, тобто , то гравцю B при будь-яких умовах невигідно застосовувати стратегію Br, оскільки в цьому випадку він буде програвати більше, ніж при використанні стратегії . Приклад 3.3. Виконати всі можливі спрощення платіжної матриці . Розв’язок. Користуючись зауваженнями 3.1 і 3.2, отримаємо Наступна теорема широко використовується при спрощенні платіжних матриць. Теорема 3.4. Нехай P* і Q*– оптимальні змішані стратегії гравців A і B в грі I з матрицею (aij)m´ n і ціною . Тоді P*і Q* будуть оптимальними і в грі I¢ з матрицею (baij+c)m´ n (b>0) і ціною Приклад 3.4. Спростити платіжну матрицю . Розв’язок. Розділивши елементи матриці на 100 і додавши до одержаних значень 3, отримаємо .
Читайте також:
|
||||||||||||||||||||||||||||||||||||||
|