RSS

Да поговорим за математиката

24 Септ
Да поговорим за математиката

The Mathematics of Poker by Bill Chen

Глава 11: Покер на половина – игра на половин улица

Започваме да изучаваме покер игрите, които могат да бъдат решени, със серия спомогателни игри, които тук и по-нататък ще наричаме „игри на половин улица“. Те имат следните свойства:

  • Първият играч (играч Х) винаги чеква
  • Вторият играч (играч У) може или да чекне, или да направи залог, размерът на който се оговаря в правилата на играта.
  • Ако залогът е направен, тогава играчът Х може да колне, след което се случва шоудаун. Освен това, играчът Х може да фолдне (но не и да рейзне). Ако играчът У чеква, тогава участниците в играта отварят картите си.

Тук ще се възползваме от даденото по-рано определение на цената на играта. Това е математическото очакване за играча У при условие, че той и опонентът му играят оптимално. Също така ще отчитаме само онези пари, които в резултат на някои действия в играта са преминали от единия участник към другия.

С други думи, предметът на нашия анализ в повечето случаи ще е екс-шоудаун стойност. Тя включва в себе си залози и колове, направени на разглежданата улица, както и преминаването на пота от единия към другия играч в резултат на успешния блъф.

Работата е там, че ние не се интересуваме нито от очакването на играчите „преди“, нито от това, как се е изградил пота. По-скоро, ще се опитваме да определяме математическото очакване от действията на участниците в анализираната ситуация.

Също така трябва да се отбележи, че играчът У не може да има отрицателно очакване в игрите с половин улица, тъй като за него винаги е гарантирано като минимум нулево екс-шоудаун стойност в случай на чек (в този случай парите не преминават от единия играч към другия и нито един от тях не взима пота след успешния блъф).

Игрите на половин улица имат изключително важно свойство: те могат да бъдат решени. Нещо повече, можем да изведем оптимални стратегии фактически за всяка игра с половин улица, тъй като като цяло те са достатъчно примитивни. Както ще покажем по-късно, игрите на няколко улици често са неразрешими и за тях можем да получим само приблизителни отговори. Сега, обаче, е важно да се разбере, че възможността да се реши дори проста игра е огромно преимущество, тъй като получените резултати след това могат да се използват за анализа на по-сложни ситуации.

За начало ще разгледаме игра срещу ясновидещ. Ще наричаме участниците в играта частично ясновидещи, ако те могат да видят картите на опоненти, но не могат да знаят, какви карти ще излязат, и просто ясновидещи, ако на тях са им известни и двете. В първият ни пример картите няма да излизат, така че изборът на конкретното определение не е толкова важен.

Пример 11.1 – Игра с ясновидещ
  • Играта е с половин улица
  • Размерът на пота е Р единици
  • Размерът на залога е 1 единица
  • Играчът У е ясновидещ

Скритата ръка на играча У се създава по случаен начин от диапазон, който се състои наполовина от нътс (които винаги печелят), наполовина от блъфове (които винаги губят срещу ръката на играча Х).

Очевидно е, че в тази игра участниците трябва да вземат само едно решение. Така, играчът У трябва да избере, с какъв диапазон той ще залага, а неговият опонент – да реши, с какви ръце ще колва. Трябва да се отбележи, че „диапазонът“ на играча Х ще се състои само от една единствена ръка. При това, тук няма никакво противоречие – смесените стратегии са еднакво използваеми както за отделни ръце, така и за диапазони.

Играчът У има значително информационно преимущество – той може да прави стойностни залози с всичките нътс и да блъфира с най-слабите си ръце. При това всеки път той ще знае точно, какво трябва да прави. Матрицата с екс-шоудаун плащанията за тази игра ще изглежда по следния начин (за играча У):

Играч У Играч Х Чек-кол Чек-фолд
Нътс Бет, чек +1 0
Бет, чек 0 0
Блъфове Бет, чек -1 +Р
Бет, чек 0 0

За начало да разгледаме няколко чисти стратегии. Да предположим, че играчът У залага за стойност с всичките си силни ръце, но чеква с всичките си блъфове. Тогава, играчът Х ще отговори чрез стратегия фолд с целия диапазон. Обаче, опонентът му може да започне да залага с всичките си ръце без изключение. Тогава, играчът Х може да предложи контр-стратегия: кол с целия диапазон, при което на играча У ще се наложи да се върне към първоначалната си стратегия (бет с всичките нътс и чек – с блъфове).

В резултат получваме вече познатия ни цикъл от стратегии, което, на своя ред, означава, че оптималните стратегии в разглежданата игра ще са смесени. За да определим тези стратегии, трябва да отговорим на два въпроса: колко често играчът Х трябва да колва и колко често играчът У трябва да блъфира.

Нека с е процент от ръце, с които играчът Х ще колва, а b е честотата на блъфа на играча У.

Когато играчът Х следва оптимална стратегия, опонентът му трябва да е безраличен към блъфа. С други думи, в този случай чек и блъф с мъртва ръка за играча У трябва да има еднакво очакване. Ако блъфът проработи, играчът У ще вземе целия пот (Р залози), но ще загуби 1 единица в случай на кол.

Тогава:

(пот)(честотата на фолда на играча Х) = (залог)(честотата на кола на играча Х)

Р(1 – с) = 1 с

С = Р/(Р + 1)

Както можете да забележите, честотата на кола на играча Х ще нараства заедно с увеличаване на размера на пота. Това е следствие на по-привлекателните пот-шансове, както и на ограничения размер на залога – фактически, играчът Х ще трябва да колва по-често, за да попречи на опонента да вземе голям пот с помощта на малък залог.

На своя ред, играчът У трябва да блъфира достатъчно често, та за играча Х да му е все едно: да колва или да фолдва. Играчът Х ще губи залог срещу стойностните ръце и ще печели Р + 1 срещу блъфовете.

1 = (Р + 1)b

B = 1/(P­­ + 1)

Величината 1/(Р + 1) е много важна в покерния анализ. Ще въведем за нея едно специално означение, което ще използваме и по-нататък: α (алфа).

α = 1/(P + 1)    (за лимитни игри)    (11.1)                                                                                                 (11.1)

Играчът Х трябва да направи опонента си безразличен към блъфа, за това той ще колва залога Р/(Р + 1) пъти или (1 – α). Съответно, ние можем да кажем, че α е честотата на фолда на играча Х срещу залога на опонента.

Играчът У трябва да блъфира α пъти с мъртвите си ръце, а тъй като с нътс той ще залага винаги, тогава α ни дава отношение на блъфове към стойностни залози, при което на опонента (в нашия случай – играчът Х) ще е безразлично, какво да прави: да фолдне или да колне.

1 – α = 1 – 1/(P + 1)                  (11.2)

1 – α = P/(P + 1) (за лимитни игри)

Можем да обобщим получените изрази за случаи със залози с произволен размер:

α = s/(1 + s) (за залози с призволен размер)    (11.3)

Тук s е отношението на размера на залога към размера на пота (например, залагайки $50 в пот от $100, получаваме s = ½ )

От формулата за пресмятането на α следва, че в големите потове играчът У трябва да блъфира по-рядко. На пръв поглед, това противоречи на здравия смисъл, обаче, тази закономерност е важен принцип в оптималната игра:

В оптималната стратегия блъфът често не е печелившо действие само по себе си. Вместо това, комбинацията от блъфовете и стойностните залози трябва да гарантира на оптималната стратегия някакво очакване независимо от реакцията на опонента. Честите фолдове правят блъфовете в оптималната стратегия по-печеливши, а честите колове – напротив, облагодетелстват стойностните залози.

Получихме чифт оптимални стратегии за разглежданата игра:

  • Играчът У залага с всичките си нътс и блъфира с α мъртви ръце (или α/2 от целия диапазон).
  • Играчът Х колва с (1 – α) от всичките му ръце.

Екс-шоудаун очакване за играча У ще е следното. Той печели един залог, когато залага за стойност (тези ръце са половината от неговия диапазон) и получава кол. Освен това, удачният блъф ще му позволи да спечели целия пот, в противен случай – той губи 1 единица. Както вече определихме, играчът Х ще колва достатъчно често, за да бъде играчът У безразличен към блъфа (очакването от него ще е нула). Получаваме:

<Y> = (честота на стойностни залози)(размер на залога)(честота на кола)

<Y> = (1/2) (P / (P + 1)) <Y> = P / 2(P + 1)

Както виждате, с увеличаването на размера на пота, преимуществото на играча У става все по-значително. Работата е там, че на играча Х ще му се наложи да колва по-често (вече го отбелязахме горе), при това в диапазона на неговия опонент ще има все по-малко и по-малко блъфове.

Разпределение [0, 1]

През цялата трета част на книгата ще анализираме различни игри, използващи разпределението [0, 1]

В тях ръцете са представени като случайни числа от 0 до 1. При това всеки играч има еднакъв шанс да получи абсолютно всякакво число от този диапазон. За да улесним пресмятанията, ще приемем, че на шоудауна печелят онези „ръце“, които са по-близки до нулата. Съответно, най-силната ръка ще е 0, а най-слабата – 1.

Основното отличие на [0, 1] игрите от игрите с ясновидещ се състои в това, че оптималните стратегии не са задължително смесени. Наистина, тъй като имаме работа с безкрайното множество възможни ръце, използването на смесени стратегии за някои от тях няма да има смисъл.

Затова ще разглеждаме няколко интервала, където се използват чистите стратегии. Тези области се разделят от така наречените прагове – точки в диапазона [0, 1], които фиксират границите между различните действия.

Забележка: Например, с ръце от 0 до 0.4 ще залагаме за стойност, с ръце от 0.4 до 1 – ще чекваме. Прагът тук е точката 0.4 в интервала от 0 до 1 (който определя силата на ръцете).

Решавайки игрите [0, 1], ние често ще използваме следният алгоритъм:

  • Правим предположение за структурата на решението
  • Решаваме играта, предполагайки, че нашето предположение е вярно
  • Проверяваме получения отговор – ако сме намерили оптималната стратегия, тогава нито един от играчите не може да подобри очакването си едностранно.

За нашите предположения за структурата на решението на играта ще използваме термина параметризация. Например, решението на една хипотетична [0, 1] игра може да изглежда така: играчът У залага с всичките си най-добри ръце между 0 и у1, чеква със средните ръце между у1 и у0 и блъфира с най-слаби ръце между у0 и 1. Другата параметризация може да бъде такава: играчът У залага със средно-силни ръце, но чеква с най-добрите и най-слабите ръце. По принцип, можем да направим абсолютно всякакви предположения за структурата на решението (да зададем всякаква параметризация).

Забележка: Не бива да се плашите от термина „параметризация“. Фактически, авторите казват, че ние трябва да се опитаме да отгатнем, как ще изглежда решението на играта, а след това да съставим съответните уравнения. Естествено, ако се окаже, че нашите предположения са неверни, ще ни се наложи да съставим нови уравнения за нова параметризация и да решаваме именно тях. Но всеки път изчисленията се правят въз основата на само един набор от предположения относно решението на разглежданата игра.

След като сме определили параметрицазията, трябва да съставим уравнения, които се базират върху безразличието на всичките прагове, и да намерим оптималните стратегии. С други думи, сега всеки играч ще се опитва да направи опонента си безразличен към избора на действието на всеки праг.

Забележка: Нека в една игра [0, 1] прагът 0.4 за играча У разделя действията чек и бет. Тогава неговия опонент, играчът Х, ще се опитва да колва толкова често, че за играча У ще е безразлично, какво да прави в точката 0.4

Защо? Първо, по определението на диапазона [0, 1] е очевидно, че силата на някаква конкретна ръка ще е близка до силата на безкрайното множество от нейните съседни ръце. Тогава и очакването от разиграването на всичките ръце трябва да се подчинява на същите закони, тъй като то се състои от шоудаун и екс-шоудаун стойност (последната е константа). По-просто казано, математическото очакване от Чек/Кол с ръка 0.6 ще е много близко до очакването на ръката 0.6000001.

Всеки праг в интервала [0, 1] разделя две чисти стратегии, едната се намира отляво, другата – отдясно. Да предположим, че разглеждаме някакъв праг R, при това в тази точка едно от действията има по-високо очакване (тоест, не се постига безразличие). Тогава може да се твърди, че в областта на второто действие (вдясно от R), можем да намерим няколко ръце, безкрайно близки до разглеждания праг, с които може да започнем да играем с алтернативна линия (тъй като тя донася повече пари). Обаче, ако това наистина е така, тогава намерената стратегия (праг) няма да е оптимална, тъй като ние ще имаме възможността да увеличим очакваната си печалба едностранно. Следователно, оптималните стратегии предполагат безразличие на играча към избора на действие на всеки от праговете.

Забележка: Представете си, че имаме някаква ръка 0.6 и тя е прагът в разпределението [0, 1], който отделя чистата стратегия Чек от чистата стратегия Бет. Тоест, с ръцете от интервала [0, 0.6] ние ще залагаме, а с всички останали – ще чекваме. Обаче, при проверката на решението се оказа, че именно за ръката 0.6 очакването от действието Бет е по-високо, отколкото очакването от действието Чек. При това няма значение с колко – да речем с 0.000001 част от блинда. Тогава, можем да намерим някаква ръка от интервала [0.6, 1], в който ние правим чек, която ще бъде безкрайно близка до 0.6 – нека това да е 0.60000000000000000000002. И за нея очакването от залога също ще се окаже по-високо от очакването от чека. Следователно, намерената от нас стратегия не е оптимална, а точката 0.6 не е прагът за оптималната стратегия и трябва да проверим пресмятанията си.

 В повечето от нашите параметризации ще има фиксиран брой прагове (между различните стратегии). За всеки праг ще съставим уравнения за безразличие – решавайки системите от тези уравнения ще намерим стойностите на самите прагове и ще изведем оптималната стратегия при зададена параметризация.

Ако сме сгрешили с параметризацията, тогава в уравненията ни ще се срещат различни противоречия, в това число и невъзможни стойности на праговете (например, праг в точка 1.5, която е извън разпределението [0, 1] и така нататък.

Освен това, понякога ще успеем да намерим оптималната стратегия и да докажем правилността й, но ще се окаже, че за друга параметризация съществува решение с още по-високо математическо очакване. Затова, за всяка параметризация също така трябва да се докаже, че именно полученият резултат е най-добрият избор за всеки от играчите.

Пример 11.2 – Игра [0, 1] №1

Това е много лесна игра на половин улица, където играчът Х винаги трябва да чек/колва срещу залог с фиксиран размер. Съвсем е очевидно, че в подобни игри размерът на пота няма никакво значение.

Тук играчът Х не взима никакви решения, а стратегията на играча У се състои само от един избор – да заложи или да чекне. Той знае, че неговият опонент винаги ще колва, така че в диапазона му за залог ще бъдат всички ръце с положително или нулево очакване срещу случайна ръка.

Математическото очакване (отново ще разглеждаме само екс-шоудаун стойност) от залога с някаква ръка у ще е следното:

Ръцете на играча Х Резултат за играча У
[0, y] -1 (играчът Х колва с по-добрата ръка)
[y, 1] +1 (играчът Х колва с по-слабата ръка)

Тъй като всичките числа от диапазона [0, 1] са разпределени равномерно, вероятността играчът Х да държи някаква ръка х е равна на дължината на разглеждания интервал.

Забележка: Много е важно да се разбере смисълът на долното уравнение. Фактически, ние смятаме, че ръката на играча У е фиксирана – той залага с ръка у. Залогът е направен, сега играчът Х взима решение. Колко често той ще е с по-добрата ръка? Точно у пъти. Колко често той ще е с по-слабата ръка? Точно (1 – у) пъти.

<Y, бет> = p(играчът Х с по-добрата ръка)(-1) + p(играчът Х с по-слаба ръка)(+1)

<Y, бет> = (y – 0)(-1) + (1 – y)(1) <Y, бет> = 1 – 2y

А сега ще намерим всичките ръце на играча У, за които математическото очакване е по-голямо или равно на 0 (алтернативата е чек, очакването от който по екс-шоудаун е нула):

1 – 2y >= 0

y <= ½

По този начин, играчът У трябва да залага с най-добрата половина от ръцете си. Когато ръката на играча Х попада в интервал [0, ½ ], общото очакване на неговия опонент ще е равно на нула (тъй като вероятността да получи ръката от този диапазон за всеки играч е абсолютно еднаква), а когато тя е в интервал [1/2, 1] – тогава играчът У ще печели един залог.

Полученият резултат може да се изобрази във вид на графика:

%d0%bf%d1%80%d0%b8%d0%bc%d0%b5%d1%80-11-1

Фигура 11.1 Игра №1 – половин улица, без фолдове

Цената на играта (тоест очакването на играча У при условие, че той играе оптимално) е ¼.

Тази лесна игра е добра илюстрация на идеята за разпределението [0, 1], а също така тя дава известни основания за размишления. Така, тук става очевидно, че, ако нашият опонент не взима никакви решения и играе по някаква предварително определена чиста стратегия, тогава оптималната стратегия за нас ще е максимизацията на собственото очакване. Нещо повече, ако нашият диапазон ще е толкова силен, колкото и този на опонента (при условие, че ние не можем да получим рейз, а само кол), ние трябва да залагаме с по-добрата половина от ръцете.

Пример 11.3 – [0, 1] Игра №2

В предишния пример зададохме специално правило, което обикновено не се среща в покера – играчът Х нямаше възможност за фолд. Показахме, че в игра без „фолдове“ не съществуват блъфове, а диапазонът за залог на играча У просто се състои от най-добрите 50% от ръцете му.

Обаче, покера е игра, която винаги се асоциира с блъф, затова леко ще променим условията от примера 11.2, позволявайки на играча Х да фолдва.

Както, вероятно, вече сте разбрали, размерът на пота отново започва да играе първостепенна роля, тъй като решението на играча Х за кол изцяло зависи от очакваната печалба (фактически, от пот-шансовете). Ще приемем, че потът е Р единици, а размерът на залога е 1 единица.

В предния пример стратегията на играча У имаше само един праг. Обаче, в тази игра всичко ще е малко по-сложно. Тук и занапред ще използваме следните условни означения:

  • xn – е прагът между стратегии, които правят n-ти залог и стратегии, които правят (n – 1) залог за стойност.
  • x0 – е прагът между блъфа и чека
  • xn* – е прагът между кол и n-ти залог и фолд срещу него.

Така, в примера 11.2 стратегията на играча У включваше само праг y1 (между бета и чека), а прагът y0 не е съществувал (или можем да сметнем, че той е бил равен на 1). Същевременно, x1* беше равно на 1, тъй като играчът Х винаги трябваше да чеква, а след това да колва.

Забележка: Можем да смятаме, че у0 в първата игра е равно на 1, защото диапазонът за блъф винаги ще се намира вдясно от диапазона за чек. Обяснение за това е много просто: ние винаги можем да чекваме с по-силни ръце (и понякога да печелим), докато блъфовете в игрите [0, 1] имат смисъл, когато се правят с безнадеждни ръце. Тоест, диапазонът за блъф ще се намира по-близо до 1, а диапазонът за чек – близо до 0. Тъй като в предния пример ние никога не сме блъфирали, стойностите вдясно от 1 ще са невъзможни, съответно, и диапазонът за блъф няма да съществува. Същото се отнася и за прага за кол за играча Х.

В този пример в стратегията на играча Х ще съществува праг х1*, отделящ диапазона за кол (от най-силната ръка, т.е. 0, до х1*) от диапазона за фолд (от х1* до най-слабата ръка, т.е. 1).

Можем да покажем, че в стратегията на играча У ще се появят блъфове, по следния начин.

Ако и двамата играчи следват оптимални стратегии, тогава х1* ще бъде избрано така, че да се максимизира математическото очакване срещу стратегията на играча У. Нека да погледнем, какво ще се случи, ако играчът У ще използва същата стратегия, както и в предишната игра, залагайки на интервала от 0 до у1. Тогава най-добрият отговор на играча Х ще е кол с всички ръце, които имат положителното очакване срещу диапазона за залог.

Очакването на играча Х се определя от неговия праг за кол. Така, той ще печели залога, когато опонентът му има ръка от интервала между у1 и х1*. И обратно, ако играчът У има ръка от интервала от 0 до х1*, тогава играчът Х ще губи един залог.

<Х> = (размер на пота в случай на победа)(вероятност за победа) – (1 залог)(вероятност за загуба)

<Х> = (Р + 1)(у1 – х1*) – 1(х1* – 0)

Забележка: И отново имаме работа със същия тип уравнение, което коментирахме по-рано. Играчът У прави залог и играчът Х се кани да го колва. Колко често той ще печели? Кога неговата ръка е по-добра от прага за залог (тъй като вероятността за получаване на всякаква ръка е еднаква и за двамата играчи)? Колко често той ще губи? Кога ръката на неговия опонент е по-добра от неговия праг за кол, а вероятността за това е х1*? Важно е да се разбере, че тук решаваме уравнението именно за залога с гранична ръка.

Очевидно е, че играчът Х ще колва само тогава, когато очакването му е по-голямо от нула:

(P + 1)(y1 – x1*) – 1(x1*) > 0

(P + 1)(y1) – (P + 2) x1* > 0

x1* < y1(P + 1)/(P + 2)

По този начин, играчът Х ще колва с някаква част от диапазона за залог на опонента, при това отношението на броя колове на играча Х и броя на залозите на играча У се определя от израза:

(P + 1)/(P + 2).

Лесно можем да покажем, че това е вярно. Нека размерът на пота е равен на размера на залога и е 1 единица. За нулев кол на играча Х му е нужно да има по-добра ръка в 1/3 от случаите (съгласно неговите пот-шансове). В този случай прагът х1* трябва да е 2/3 от интервала от 0 до у1.

%d0%bf%d1%80%d0%b8%d0%bc%d0%b5%d1%80-11-3

Фигура 11.2 Неоптимална стратегия за играча У в [0, 1] игра №2

Обаче, ако играчът Х следва тази стратегия, тогава неговия опонент едностранно може да подобри очакването си. За тази цел е достатъчно да започне да чеква с ръце от интервала от х1* до у1, заменяйки ги с равното количество ръце от района на единицата. Постъпвайки по този начин, той подобрява очакването си, карайки играча Х да фолдва значително по-силна ръка (спрямо целия диапазон за залог).

Следователно, намерената от нас стратегия не може да се смята за оптимална и играчът У трябва да има диапазон за блъф.

Ще въведем следната параметризация за играча У:

  • Залог с диапазон от силни ръце от 0 до у1
  • Чек с диапазон от средни ръце от у1 до у0
  • Залог с диапазон от слаби ръце от у0 до 1.

Също така, за тази параметризация ще предполагаме, че х1* лежи вдясно от у1.

Забележка: Тук има една много съществена разлика от предишните игри – заради вероятността на блъфа от страната на опонента, играчът Х е принуден да колва с диапазон, който е по-широк от този за залог на играча У.

%d0%bf%d1%80%d0%b8%d0%bc%d0%b5%d1%80-11-4

Фигура 11.3 Оптимална стратегия за [0, 1] Игра №2

Знаем, че, ако и двамата участници следват оптимални стратегии, тогава на играча Х в точката х1* ще е безразлично, какво да прави: да колва или да фолдва.

Безразличието в х1* може да се опише по следния начин:

%d1%82%d0%b0%d0%b1%d0%bb%d0%b8%d1%86%d0%b01

Забележете, че не отчитаме ръцете на играча У в интервала [y1, y0], тъй като с тях той не залага, и следователно, играчът Х не е длъжен да взима никакво решение.

Крайните стойности в колоните „Очакване“ трябва да са равни:

-y1 + (P + 1)(1 – y0) = 0

y1 = (P + 1)(1 – y0)

1 – y0 = y1(1/(P + 1))

1 – y0 = α*y1                 (11.4)

В нашата параметризация 1 – у0 е дължината на интервала за блъф, като у1 представлява интервал от ръце за стойностен залог. Както можете да забележите, съотношението между тези величини е коефициент α, също както и в играта с ясновидещ.

А сега да пресметнем праговете за играча У.

Безразличието в у1 (прагът между стойностен залог и чек):

%d1%82%d0%b0%d0%b1%d0%bb%d0%b8%d1%86%d0%b02

Получаваме уравнение:

х1* - 2 у1 = 0

у1 – х1*/2                  (11.5)

Безразличието в у0 (прагът между чека и блъфа):

%d1%82%d0%b0%d0%b1%d0%bb%d0%b8%d1%86%d0%b03

Ру0 – (Р + 1)х1* = 0

Както вече знаем от уравнението 11.4, (1 – у0) = α у1, тогава:

P (1 – α y1) = (P + 1) x1*

x1* = (1 – α y1)(P/(P + 1))

Същевременно (1 – α) = P/(P + 1):

x1* = (1 – α)(1 – α y1)        (11.6)

x1* = (1 – α)y0

Този резултат също е важен, тъй като той определя честотата на кола в игрите [0, 1]. За да бъде играчът У безразличен към блъфа в у0, неговият опонент трябва да колва с (1 – α) ръце, способни да бият блъф.

Обединявайки и трите уравнения за безразличие, можем да намерим решението на играта.

x1* = (1 – α)(1 – α y1)            (11.6)

y1 = x1*/2                         (11.5)          

x1* = 2y1

2y1 = (1 – α y1)(1 – α)

2y1 = 1 – α y1 – α + α 2y1

1 – α = 2y1 + α y1 – α 2y1

1 – α = y1 (2 – α)(α + 1)

y1 = (1 – α)/(2 – α)(α + 1)

Отчитайки, че x1* = 2y1:

x1* = 2(1 – α)/(2 – α)(α + 1)

1 – y0 = α y1

1 – y0 = α (1 – α)/(2 – α)(α + 1)

Джон фон Нейман и Оскар Моргенщерн са разгледали подобна игра в труда си „Теория на игрите и икономическото поведение“ (1944).

Какви изводи можем да направим въз основа на този пример? Първо, възможността за избор между кол и фолд при играча Х променя структурата на стратегията на играча У. В примера 11.2 той просто е залагал за стойност с горната част от неговия диапазон и това беше достатъчно. Обаче, тук играчът Х може да фолдне най-слабите си ръце, експлоатирайки по този начин стратегията на опонента си.

Като отговор, играчът У започва да блъфира с долната част от диапазона си – по този начин той кара играча Х да колва с ръце, които са по-слаби от прага за стойностни залози.

И отново коефициентът α играе важна роля. Както и в игрите с ясновидещ, играчът Х трябва фолдва α брой ръце, способни да бият блъф, а играчът У залага за стойност и блъф със съотношението α.

В тази игра има още една важна страна. Какво е очакването от блъфа? В играта с ясновидещ то беше равно на нула – ако У чеква, тогава той просто губи пота. Обаче тук отговорът не е толкова очевиден.

В точката у0 на играча У му е безразлично дали да блъфира или да чеква – тази ситуация съвпада с онази, която решихме в играта с ясновидещ (от гледната точка на екс-шоудаун). Но, например, в точка 1 очакването от блъфа за У е същото, както очакването му в у0 (тъй като играчът Х ще колва само с ръцете, които са преди х1*). Излиза, че У не е безразличен към блъфа в 1! Нещо повече, той повишава очакването си, блъфирайки с всичките ръце, които са по-слаби от у0.

Забележка: Тук имаме предвид, че при блъф в точка у0 и 1 очакването на играча У ще е еднакво. Обаче, ръка в у0 е значително по-силна от единица. Съответно, имаме същото очакване, макар че силата на ръката ни се е намалила.

В тази глава представихме няколко сравнително прости игри на половин улица. Видяхме, че ясновидещият залага за стойност и блъфира с абсолютно точно оптимално съотношение, докато играчът, чиято ръка е известна, колва и губи в свързано съотношение, което прави ясновидещия безразличен към блъфа. В първата [0, 1] игра въведохме разпределение [0, 1] и показахме, че, когато единият от играчите няма стратегически избор, опонентът му трябва да се стреми да максимизира очакването си (и това ще е оптималната му стратегия). В третата игра се сблъскахме с важността на диапазона за блъф, който караше играча Х значително да разшири диапазона си за кол – неговият праг беше много по-наляво от прага за залог на играча У.

Трябва да се запомни

–          В игрите на половин улица стойностните залози и блъфовете (за оптимални стратегии) са в съотношение α = 1(P + 1). Блъфирайки точно с такъв дял мъртви ръце, ние можем да направим опонента си безразличен към кол.

–          В игрите на половин улица честотата на фолда за играча Х се опредля чрез коефициент α. Фолдвайки такова количество своите блъф-кетчъри, той прави опонента си безразличен към блъфа.

–          Ако единият от играчите няма стратегически алтернативи, неговият опонент трябва да се опитва да максимизира очакването си и това ще е оптимална стратегия.

–          Правилният баланс между стойностни залози и блъфове ни гарантира положително очакване срещу опонента независимо от стратегията му. Ако той ще фолдва прекалено често, нашите блъфове ще бъдат по-печеливши, и обратно, ако той започне да колва по-често, тогава стойностните ни залози ще се изплащат по-често.

–          Оптималните стратегии невинаги са наистина безразлични към блъфове – това е вярно само за праговите (гранични) ръце. В същото време, блъфовете с нашите най-слаби ръце често ще имат положително очакване (в сравнение с чека).

 

 

 

Advertisements
 
Вашият коментар

Posted by на 09/24/2016 in Theory

 

Етикети: ,

Вашият коментар

Попълнете полетата по-долу или кликнете върху икона, за да влезете:

WordPress.com лого

You are commenting using your WordPress.com account. Log Out / Промяна )

Twitter picture

You are commenting using your Twitter account. Log Out / Промяна )

Facebook photo

You are commenting using your Facebook account. Log Out / Промяна )

Google+ photo

You are commenting using your Google+ account. Log Out / Промяна )

Connecting to %s

 
%d bloggers like this: