МАРК РЕГНЕРУС ДОСЛІДЖЕННЯ: Наскільки відрізняються діти, які виросли в одностатевих союзах
РЕЗОЛЮЦІЯ: Громадського обговорення навчальної програми статевого виховання ЧОМУ ФОНД ОЛЕНИ ПІНЧУК І МОЗ УКРАЇНИ ПРОПАГУЮТЬ "СЕКСУАЛЬНІ УРОКИ" ЕКЗИСТЕНЦІЙНО-ПСИХОЛОГІЧНІ ОСНОВИ ПОРУШЕННЯ СТАТЕВОЇ ІДЕНТИЧНОСТІ ПІДЛІТКІВ Батьківський, громадянський рух в Україні закликає МОН зупинити тотальну сексуалізацію дітей і підлітків Відкрите звернення Міністру освіти й науки України - Гриневич Лілії Михайлівні Представництво українського жіноцтва в ООН: низький рівень культури спілкування в соціальних мережах Гендерна антидискримінаційна експертиза може зробити нас моральними рабами ЛІВИЙ МАРКСИЗМ У НОВИХ ПІДРУЧНИКАХ ДЛЯ ШКОЛЯРІВ ВІДКРИТА ЗАЯВА на підтримку позиції Ганни Турчинової та права кожної людини на свободу думки, світогляду та вираження поглядів
Контакти
Тлумачний словник Авто Автоматизація Архітектура Астрономія Аудит Біологія Будівництво Бухгалтерія Винахідництво Виробництво Військова справа Генетика Географія Геологія Господарство Держава Дім Екологія Економетрика Економіка Електроніка Журналістика та ЗМІ Зв'язок Іноземні мови Інформатика Історія Комп'ютери Креслення Кулінарія Культура Лексикологія Література Логіка Маркетинг Математика Машинобудування Медицина Менеджмент Метали і Зварювання Механіка Мистецтво Музика Населення Освіта Охорона безпеки життя Охорона Праці Педагогіка Політика Право Програмування Промисловість Психологія Радіо Регилия Соціологія Спорт Стандартизація Технології Торгівля Туризм Фізика Фізіологія Філософія Фінанси Хімія Юриспунденкция |
|
|||||||||||||||||||||||||||||||||||||
Розв’язування матричних ігор в змішаних стратегіяхНехай гра задана матрицею (табл. 3.4.) Таблиця 3.4
Через p1, p2, ..., pm позначені ймовірності, з якими гравець A використовує чисті стратегії A1, A2, ..., Am.; , , а через ймовірності, з якими гравець використовує чисті стратегії , Визначення 3.9. Впорядкована множина P=(p1; ...; pm), елементи якої задовольняють умовам , і повністю визначають характер гри гравця A, називається його змішаною стратегією. Таким чином, змішаною стратегією гравця A є повний набір ймовірностей застосування його чистих стратегій. Будь-яка його чиста стратегія Aі може розглядатися як частинний випадок змішаної стратегії, i-такомпонента якої дорівнює 1, а решта – 0, тобто Визначення 3.10. Впорядкована множина Q=(q1;...; qn), елементи якої задовольняють співвідношенням і повністю визначають характер гри гравця В, називається його змішаною стратегією. Нехай гравці A і B застосовують змішані стратегії P і Q. Це означає, що гравець A використовує стратегію Aі з ймовірністю рі , а гравець B - стратегію Bj з ймовірністю qj. Оскільки гравці вибирають свої чисті стратегії випадково і незалежно один від одного, то ймовірність вибору комбінацій стратегій (A ,Bj) буде дорівнювати добутку ймовірностей piqj. При використанні змішаних стратегій гра набуває випадкового характеру. Випадковою стає і величина виграшу гравця A (програшу гравця B). Тому тепер йдеться лише про середню величину виграшу (математичне сподівання). Ясно, що ця величина є функція від змішаних стратегій P і Q і визначається за формулою: (3.3) Визначення 3.11. Функція f(P,Q) називається платіжною функцією гри з матрицею (aij)m´n. Гравець A,змінюючи свої змішані стратегії P, намагається максимізувати середній виграш f(P,Q), а гравець B, змінюючи свої змішані стратегії Q –зробити цей виграш якомога меншим. Для розв’язку гри з точки зору гравця A необхідно знайти такі змішані стратегії P і Q, при яких би забезпечувався середній виграш, що дорівнює Визначення 3.12. Величина називається верхньою ціною гри, а величина – нижньою. Визначення 3.13. Змішані стратегії P* і Q* гравців A і B, які задовольняють рівність (3.4) називаються оптимальними. Визначення 3.14. Величина , яка визначається формулою (3.4), називається ціною гри. Дамо ще одне еквівалентне визначення оптимальних змішаних стратегій. Визначення 3.15. Змішані стратегії P* і Q* гравців A і B відповідно називаються оптимальними змішаними стратегіями, якщо вони утворюють сідлову точку для платіжної функції f(P,Q), тобто задовольняють нерівності (3.5) З нерівностей (3.5) випливає, що в сідловій точці (P*, Q*) платіжна функція f(P,Q) досягає максимуму по змішаних стратегіях P гравця A і мінімуму по змішаних стратегіях Q гравця B. Виявляється, що якщо використовувати змішані стратегії, то для будь-якої матричної гри можна знайти оптимальні стратегії і ціну гри. В цьому полягає зміст наступної теореми, яка в теорії ігор вважається основною і яку ми формулюємо без доведення. Теорема 3.2. В змішаних стратегіях будь-яка скінченна матрична гра має сідлову точку. Наступна теорема дає відповідь на питання: в якому випадку набір буде розв’язком гри. Теорема 3.3. Для того, щоб змішані стратегії і були оптимальними для гравців A і B в грі з матрицею і ціною гри , необхідно і достатньо виконання нерівностей , (3.6) . (3.7) Дана теорема стверджує, що якщо гравець A застосує оптимальну змішану стратегію P*, а гравець B – будь-яку чисту стратегію Bj, то виграш гравця A буде не меншим від ціни гри . Якщо гравець B використовує оптимальну змішану стратегію Q*, а гравець A – будь-яку чисту стратегію Aі, то програшгравця B не перевищить ціну гри . Розв’язок гри можна суттєво спростити, якщо своєчасно виявити в матриці гри домінування одних стратегій над іншими, оскільки це дозволяє скоротити розмірність матриці. Зауваження 3.1. Якщо в матриці гри елементи k-го рядка не менші за відповідні елементи s- го рядка, тобто , то виграш гравця A при стратегії Ak буде більшим, ніж при стратегії , якою б стратегією не користувався гравець B. Тому для гравця A стратегія Ak буде вигіднішою, ніж стратегія . В зв’язку з цим кажуть, що стратегія Ak домінує над стратегією . Зауваження 3.2. Аналогічно, якщо елементи -го стовпчика не більші за відповідні елементи r-го стовпчика, тобто , то гравцю B при будь-яких умовах невигідно застосовувати стратегію Br, оскільки в цьому випадку він буде програвати більше, ніж при використанні стратегії . Приклад 3.3. Виконати всі можливі спрощення платіжної матриці . Розв’язок. Користуючись зауваженнями 3.1 і 3.2, отримаємо Наступна теорема широко використовується при спрощенні платіжних матриць. Теорема 3.4. Нехай P* і Q*– оптимальні змішані стратегії гравців A і B в грі I з матрицею (aij)m´ n і ціною . Тоді P*і Q* будуть оптимальними і в грі I¢ з матрицею (baij+c)m´ n (b>0) і ціною Приклад 3.4. Спростити платіжну матрицю . Розв’язок. Розділивши елементи матриці на 100 і додавши до одержаних значень 3, отримаємо .
Читайте також:
|
||||||||||||||||||||||||||||||||||||||
|