RSS

Да поговорим за математиката

07 Февр
Да поговорим за математиката

The Mathematics of Poker by Bill Chen

Глава 17: Да си спомним за блъфа – игра [0, 1] с ограничен пот

В примерите, които разгледахме в глава 16, имаше едно правило, което обикновено е неприложимо в покера – нито един от играчите не можеше да фолдне ръката си. Важна характеристика на тези игри е пълното отсъствие на блъфове: двамата участници конструираха диапазоните си така, че да извлекат максимална стойност със силните си ръце.

Блъфовете в покера, на своя ред, имат не само ключова роля, но и усложняват играта. Затова ще разгледаме игри на пълна улица с ограничен размер на пота, където в оптималните стратегии ще има и блъфове.

Пример 17.1 – игра [0, 1] #9
  • Играта е на пълна улица
  • Един залог
  • Размерът на пота Р единици
  • Размер на залога 1 единица

Както, вероятно, си спомняте, когато решавахме първата [0, 1] игра с ограничен пот в глава 11 (пример 11.2), освен прага уn (който беше обект на нашето внимание в глава 16), ние също така разглеждахме у0, прагът между чек и блъф, както и х1*, прагът между чек/кол и чек/фолд за играча Х. При това и играчът У, и играчът Х се стремяха да блъфират с най-слабите си ръце и да залагат за стойност – с най-добрите.

В игра на пълна улица играчът Х може да направи залог, създавайки по този начин в стратегията си праговете х1 и х0. На своя ред, играчът У трябва да добави към праговете си и у0*, който ще разделя кола и фолда в отговор на залог от опонента. Очевидно е, че стратегията за кол с най-слабите ръце винаги ще е доминирана от стратегията за фолд.

Изхождайки от казаното горе, можем да зададем параметризация за вероятно решение:

Стратегията на играча Х ще се състои от следните прагове:

  •                 Х0 – праг между чек/фолд и блъф
  •                 Х1* – праг между чек/кол и чек/фолд
  •                 Х1 – праг между стойностен залог и чек/кол

Стратегията на играча У също така ще включва три прага:

  •                 У0 – праг между чек и блъф (ако играчът Х чеква)
  •                 У1* – праг между кол и фолд (ако играчът Х залага)
  •                 У1 – праг между стойностен залог и чек (ако играчът Х чеква).

Колкото до разположението на тези прагове в интервала от 0 до 1, то, позовавайки се на резултатите от анализа на миналите игри, можем да предположим, че диапазонът за залог на играча У след чека на опонента ще е по-широк от диапазона за залог на играча Х. Това означава, че у1 > х1. Как ще покажем по-късно, α, коефициентът, който задава отношението на блъфовете към залозите за стойност (уравнение 11.1), в този пример ще е идентичен на α в игра [0, 1] #2 и за двамата играчи. И тъй като областите за блъф ще са равни съответно на αх1 и αу1, можем да поставим у0 вляво от х0. Праговете за кол при всеки играч ще се намират между праговете за блъф и залог за стойност на опонента (по този начин ще се постига безразличието). Тогава, х1 < у1* < х0 и у1 < х1* < у0. На своя ред, зависимостта между у1* и х1* няма никакво значение. Когато ще съставяме уравненията за безразличие за определени прагове, ще отчитаме само един от тях.

Нашата параметризация сега има следния вид:

0 < х1 < у1 < х1*, у1* < у0 < х0 < 1

17-1

Фиг. 17.1 – Структура на стратегия за игра [0, 1] #9

Остава само да съставим уравнения за безразличие за всеки праг. Решихме да не включваме в таблицата долу интервали, в които разглежданите действия са невъзможни. Например, в точка у1 играчът У трябва да избира между чек и бет, обаче, ако ръката на опонента е в интервала [0, x1] или [x0, 1], тогава той ще трябва да взима решение за кол или фолд. Следователно, при съставяне на уравнение за точка у1, можем да не разглеждаме интервалите [0, x1] или [x0, 1].

Забележка: С ръце от интервала [0, x1] или [x0, 1] играчът Х ще залага за стойност и ще блъфира. В този случай играчът У не може да чекне или да бетне. В предната глава авторите оставиха в таблиците тези ситуации, отбелязвайки ги с N/A.

В точка у1 (безразличие между чек и бет):

1721

-2y1 + x1 +x1*= 0

y1 = (x1 + x1*)/2

Напълно е разбираемо, че играчът У ще залага с всичките ръце, с които опонентът му би заложил за стойност. Освен това, той ще залага с половината от ръцете, с които играчът Х ще играе чек/кол. По този начин, прагът у1 ще се намира точно по средата между х1 и х1*.

В точка у1* (безразличие между фолд и кол):

17-3

(P+1) (1-x0) -x1 = 0

1-x0 = αx1

Това уравнение показва зависимостта между големината на областите за стойностен залог (х1) и блъфа (1 – х0).

В точка х1* (безразличие на играча Х към чек/кол и чек/фолд):

17-4

(P + 1)(1 – y0) – y1 = 0

1 – y0 = α y1

В точка у0 (безразличие между чека и блъфа):

17-5

-(x1* – x1) + (P) (y0 – x1*) = 0

x1* – x1 = P(y0 – x1*)

x1* = α(py0+ x1)

x1* = (1 – α) (y0) + ax1 + (x1 – x1); (Тук: първо, р заменяме от формулата за α; получава се р = (1 – α)/α и остава само (1 – α). Второ, неизвестно защо, добавяме и изваждаме х1, от което уравнението не се променя, но явно това е необходимо за получаването на крайния резултат).

x1* = (1 – α) (y0) – (1 – α)x1 + x1

x1* = (1 – α) (y0 – x1) + x1

Във втората [0, 1] игра, която разгледахме (пример 11.3), коефициентът α не само задаваше съотношението на блъфове към стойностни залози, но и честотата на кола с блъф-кетчъри, (1 – α). Обаче, в нашия случай играчът Х взима решение за кол след залог с някаква част от неговите ръце, затова видът на уравнението е друг.

Диапазонът за чек на играча Х се намира в интервала от х1 до х0, при за блъф-кетчъри ще се смятат само ръцете над прага у0. Следователно, можем да твърдим, че прагът х1* е равен на (1 – α) от ръцете, които могат да бият блъф, плюс х1.

В точка х0 (безразличие за играча Х между чек/фолд и блъф):

17-6

(P + 1) y1* – P = 0

y1* = P/(P+1)

y1* = 1 – α

Тук се сблъскваме с аналогична ситуация. Единствената разлика се състои в това, че диапазонът на играча У (след залога на опонента) все още не е ограничен от нищо, затова той трябва да колва с (1 – α) от всичките възможни ръце. Тук не уточняваме „които могат да бият блъф“, тъй като решението на играча Х се състои от избор между блъф и чек/фолд. Ако той предпочете второто, той пак ще загуби срещу най-слабите ръце на играча У, тъй като те ще влязат в диапазона за блъф на последния.

В точката х1 (безразличие между чек/кол и бет) имаме следното:

17-7

y1* – y1 – (1- y0) = 0

y1* – y1 = 1- y0

Ако играчът Х направи чек, той ще спечели един залог, тъй като ще накара опонента си да блъфира. Ако той заложи, тогава ще извлече стойност от онези ръце на играча У, които не биха заложили, но същевременно са принудени да колват. Следователно, в една оптимална стратегия размерът на тези две области ще е еднакъв (по този начин се постига безразличие).

Получихме шест уравнения, всяко от които описва някаква част от оптимална стратегия. Сега остава само да решим системата от уравнения и да намерим стойностите на всичките прагове.

Нека да разгледаме получените прагове в един конкретен пример. Нека размерът на пота е 4 единици. Тогава, съгласно уравнението 11.1, α = 1/5. Както вече знаем, играчът Х ще залага за стойност с определена част от ръцете си, срещу което играчът У ще отговори с кол с диапазон, който е малко по-широк от диапазона за блъф на играча Х. Ако блъфът е успешен, играчът Х ще спечели 4 залога, а ако не е – ще загуби 1 залог. По този начин, за да направи опонента си безразличен към блъфа, играчът У трябва да колва четири пъти по-често, отколкото да фолдва – 4/5 от разпределението [0, 1] или 1 – α.

В същото време играчът Х трябва да балансира своите стойностни залози и блъфове така, че играчът У да не може да го експлоатира. Например, ако играчът Х няма да блъфира никога, неговия опонент би трябвало да колва само с много тесен диапазон. Тогава, за да извлече стойност със своите нътс, на играча Х ще се наложи да залага с някакво количество блъфове, принуждавайки опонента си да колва с гранични ръце (които се намират между прага за блъф и стойностен залог на играча Х).

При пот от 4 единици, играчът Х ще загуби с блъфа си 1 единица в случай на кол от играча У, но ще спечели 4, ако опонентът му фолдне. За да бъде опонентът му безразличен към кола, играчът Х трябва да залага за стойност четири пъти по-често, отколкото да блъфира. Получаваме праг αх1.

Както вероятно вече сте разбрали, ако играчът Х чекне, тогава играчът У ще трябва да балансира своите стойностни залози с блъфове от диапазона [y0, 1].

А сега да определим, колко често играчът Х трябва да залага за стойност. На прага между залога и чек/кола, той може или да заложи и да вземе стойност от играча У, когато ръката на последния се намира в интервала между у1 и у1* (тук той колва залога с ръка, която е по-слаба, но никога не залага сам); или да чекне и да принуди опонента си да заложи с блъф от диапазона от у0 до 1. И тъй като играчът Х ще бъде безразличен към избора на действие в този праг, интервалът [y1, y1*] трябва да е равен на [y0, 1].

Знаем, че размерът на последния интервал е αу1, а на първия е (1 – α – у1). Следователно, можем да съставим и да решим уравнение за у1 (диапазон, с който играчът У ще заложи при чек от опонента). Както беше показано в горното решение, този праг е равен на (1 – α)/(1 + α). Да използваме размера на пота от 4 единици. Тогава у1* ще е равно на 4/5, а (1 – у0) ще е 1/5 от у1. Получаваме

4/5 – у1 = (1/5)у1 или у1 = 2/3.

По този начин можем да потвърдим решението за праговете х1* и х1. Както вероятно си спомняте, в игрите без фолдове получихме правило, че играчът У трябва да залага с половината от диапазона за чек на играча Х (при условие, че той не може да рейзне). Обаче, тук, когато играчът У избира между чек и бет в точка у1, той следва малко по-друг принцип. Така, той печели един залог, ако ръката на играча Х се намира между у1 и х­1*, но губи залога, ако тя е в диапазона от х1 до у1. И тъй като тези две области трябва да са еднакви, прагът у1 трябва да се намира точно в средата между х1 и х1*.

С други думи:

Ако вашия опонент можеше да заложи, но вместо това чеква (сега той може или да колне, или да фолдне, но не и да рейзне), тогава оптимална стратегия ще е бет с всички ръце, с които опонентът би заложил сам, както и с половината от ръцете от неговия диапазон за кол.

Очевидно е, че тази концепция е следствие от правилата за игри без фолдове. В тях опонентът няма възможност за фолд, затова се ориентирахме към неговия диапазон за чек. Обаче, в този пример играчът Х може да фолдне, затова отправната точка в анализа е неговия диапазон за кол.

Освен това, играчът Х трябва да избере прага х1* така, че да защити своя диапазон за чек от блъфовете на опонента. При това в този случай той избира съответните ръце не от цялото разпределение [0, 1], а само от [х1, х0], защото с останалите ръце той сам ще залага. Излиза, че той трябва да колва с (1 – α) ръце от диапазона [х1, х0]. А това, на своя ред, означава, че прагът х1* трябва да отстои от х1 с (1 – α).

При пот от 4 единици, у2 = 2/3 се намира по средата между х1 и х1*, докато х1* се намира на разстояние 4/5 от х1 към 1 – (1/5)х1. Нека с е разстояние между х1 и х0, а е разстояние между х1 и у1, b е разстояние между 0 и х1, тогава ще е вярно следното:

17-8

Получаваме точно същите резултати, както и за горните формули (b = x1). Разбирането на описаната горе игра е много важно за решаването на по-сложни примери от тази глава. Опитахме се максимално достъпно да разкрием смисъла на всяко от изведените уравнения, затова няма да обясняваме толкова подробно по-нататък.

Следващата игра много прилича на игра 6 (пример 16.3), където играчите могат да направят определен брой рейзове.

Пример 17.2 – [0, 1] игра #10
  • Играта е на пълна улица
  • Остават 2 залога
  • Не може да се прави чек-рейз
  • Размерът на пота е Р единици
  • Размерът на залога е 1 единица

Вероятно, сте се досетили, че в тази игра отново ще се върнем към прага у2. Освен това, ще въведем последния елемент, който е необходим за решаването на игрите [0, 1] като цяло – това е диапазонът за блъф-рейз.

Представете си, че играчът Х прави залог. Как би трябвало да изглежда стратегията на играча У? Най-простият отговор (но не е задължително той да е верен) ще е следният: с нътс той ще рейзва за стойност, с малко по-слаби ръце ще колва, а с долната част на разпределението ще фолдва.

Но, ако това е така, как тогава играчът Х трябва да реагира срещу рейз? Съвсем е очевидно, че правилна контрастратегия ще е фолд с всички ръце, които са по-слаби от прага за рейз на опонента. Следователно, играчът У трябва да защитава своите стойностни рейзове с някакво количество блъфове.

Следващия въпрос, на който трябва да отговорим, е какви ръце ще влизат в диапазона му за блъф-рейз?

Нека да помислим малко за природата на блъфовете. Когато според правилата се разрешава само един залог, ние трябва да блъфираме с най-слабите ръце, защото те имат минимална ценност на шоудауна и винаги ще губят, ако направим чек-бихайнд.

Какво ще се промени, ако опонентът ни вече е направил залог и имаме възможността да рейзнем? Както вече отбелязахме горе, има смисъл да рейзваме с всичките най-силни ръце и да колваме със средни, тъй като искаме да използваме тяхната доста добра шоудаун стойност, затова нашият диапазон за блъф ще се състои само от ръце, в които не виждаме никаква стойност на шоудауна. При това размерът на блъф-рейза ще зависи от размера на залога, размера на пота, както и от нашия стойностен диапазон.

Вероятно, сега интуицията ви подсказва, че в този случай ние трябва да спазваме същите правила, както и в примерите, където беше позволен само един залог – тоест, да блъфираме с най-слабите ръце. Общо взето, когато слизаме под прага у1*, от гледната точка на оптимална стратегия за играча У вече е безразлично, с какво да блъфира. Но тук има няколко забележки.

Първо, ние ще фолдваме онези слаби ръце, които няма да са в диапазона за рейз. Второ, тъй като говорим за областта, която е под прага за кол, тогава дори с горната част от този диапазон няма да виждаме шоудауна. Затова, стратегията за рейз с най-силните ръце от онези, с които не можем да колнем, винаги ще е доминираща.

По този начин получихме нов праг. При това, трябва леко да преразгледаме представата си за праговете в игрите с рейзове:

yn* сега е праг между кол на n-тия залог и блъф или фолд, ако (n + 1)-ия залог и фолдът са позволени от правилата.

yn# е прагът между диапазона за блъф срещу n-тия залог и диапазона за фолд срещу (n – 1)-ия залог.

Забележка: Представете си ситуация, когато играчът Х залага, и играчът У трябва да вземе решение. Ако той може или да фолдне, или да рейзне (тоест да направи (n+1)-вия залог), тогава прагът yn* ще разделя областта за кол на залога на играча Х и областта, където ние или блъфираме, или фолдваме ръката си. На своя ред, прагът yn# слага разделителна линия между диапазона за фолд срещу залога на играча Х и диапазона за блъф-рейз.

Ще покажем по-надолу, че праговете yn* и yn+1# са тясно свързани помежду си. В тази игра за пръв път се сблъскваме с разклонено дърво на решения и това съществено ще влияе върху използваната параметризация. С други думи, тук за всеки възможен сценарий ще има собствен набор от прагове, който не е свързан с другите клонове, тъй като в отделно взета ситуация ще имаме работа само с определена линия за отиграване.

Например, прагът х1* ще се появява само когато играчът Х чеква. В този случай у1* и у2# са безсмислени. И макар че ние можем да намерим местоположението на точка х1* спрямо у1*, това няма да има никакво практическо значение.

Да въведем параметризацията за игра [0, 1] #10:

0, у2, х2*, х1, у1, х1*, у1*, у2#, у0, х0, 1

17-9

Фиг. 17.2 – Структура на стратегия за игра [0, 1] #10

На езика на стратегиите играта изглежда по следния начин:

За играча Х:

  • Залог за стойност и кол на рейза с ръце [0, x2*].
  • Залог за стойност и фолд срещу рейз с ръце [x2*, x1].
  • Чек и кол на залога с ръце [x1, x1*].
  • Чек и фолд срещу залог с ръце [x1*, x0].
  • Блъф с ръце [x0, 1].

За играча У:

Ако играчът Х залага

  • рейз за стойност с ръце [0, y2].
  • кол с ръце [y2, y1*]
  • блъф-рейз с ръце [y1*, y2#]
  • фолд с ръце [y2#, 1]

Ако играчът Х чеква:

  • Залог за стойност с ръце [0, y1]
  • Чек с ръце [y1, y0]
  • Блъф с ръце [y0, 1]

Прочетете и обмислете още веднъж всичките изброени стратегии. Това е много важно за разбиране на по-сложни игри. Например, в една от следващите задачи ще се сблъскаме с праг х4#, който отделя диапазона за трети рейз (ако играчът Х решава да направи чек/рейз) от диапазона за фолд срещу втори рейз.

Във всичките предишни игри, където се позволяваше само един залог, ние използвахме фундаменталната константа α, която е равна на 1/(Р + 1). Тя определяше съотношения на блъфове и стойностни залози, както и диапазони за кол. Обаче в ситуации, където са възможни два залога (бет и рейз), имаме работа с по-големи потове; освен това, стойността на блъфа може да нарасне до размера на два залога. Затова ще въведем нова константа:

α2 = 1/(P + 3)

В по-сложни игри ще използваме общият вид αn (за n-ти залог):

17-10                            (17.1)

От това уравнение лесно можем да получим коефициента α, който получихме за играта #2 (при n = 1). За да опростим пресмятанията, ще приемем, че α (без никакви индекси) е α1.

В тази игра имаме доста сложна задача – трябва да намерим 9 променливи. За всяка от тях ще съставим собствено уравнение за безразличие, а след това ще се опитаме да решим получената система от уравнения.

Безразличие за играча У в точка у2:

17-11

Играчът У губи с един залог повече, ако направи рейз срещу нътс на опонента. Но при това той и печели повече, ако играчът Х колва с малко по-слаба ръка. Тъй като играчът Х не може да направи ри-рейз, играчът У трябва да рейзва с половината от диапазона за кол на неговия опонент:

y2 = x2* – y2

y2 = x2*/2

В точката у1 ние се сблъскваме със същата ситуация, каквато беше в играта #9 (пример 17.1), тъй като играчът Х все още не може да прави чек/рейз. Следователно и уравнението за безразличие ще е същото:

y1 = (x1* + x1)/2

И отново, у1 трябва да е по средата между праговете за кол и бет за играча Х.

Безразличие за играча У в точката у1*:

17-12

17-13

Тук, за първи път се сблъскваме с използването на α2. Размерът на областта за залог за играча Х (х1) пряко зависи от областта му за бет/кол. Нещо повече, той трябва да избира линията бет/фолд точно α2 пъти, тъй като той трябва да направи опонента си безразличен към блъф-рейза. Забележете, че използваме α2 заради нарасналия пот (след залога на играча Х и рейза на играча У).

Безразличие за играча У в точката у2#:

17-14

За начало, да използваме малко алгебра:

17-15

Можем да опростим лявата част на това уравнение, като преобразуваме отношението α/α2:

Знаем, че α = 1/(Р + 1), а α2 = 1/(Р + 3); тогава:

17-16

Тогава ще получим:

((1 + 2α) – α)*х1 = х1 + 1 – х0;

(1 + α)*х1 = х1 + 1 – х0; х1 + α*х1 = х1 + 1 – х0; или

αх1 = 1 – х0;

Спомняте ли си как казахме, че диапазонът за блъф-рейз на играча У по принцип може да се намира в която и да е част от неговия диапазон за фолд? Ние все още настояваме да се използват недоминирани стратегии, затова сега намерихме безразличие между блъф-рейза и фолда. Трябва да отбележим, все пак, че бихме могли да използваме друга параметризация и да търсим праг между кола и фолда. Тогава щяхме да получим същото уравнение, без междинните опростявания, към които ние се наложи да прибегнем горе.

За пореден път се сблъскваме с познато уравнение (пример 11.4 и след това), което определя отношение между областта за бет и областта за блъф за играча Х.

В точката у0 можем да използваме уравнение за безразличие от играта 9 (пример 17.1). Причината е същата – играчът Х все още не може да направи чек/рейз.

x1* = (1 – α) (y0 – x1) + x1

Безразличие за играча Х в точката х2*:

17-17

Забележете, в този пример стратегиите на играча Х стават малко по-сложни. Така, вече не можем да говорим за отделни действия – принудени сме да имаме работа с очакванията от линиите за отиграване, например: Бет/Кол, Бет/Фолд и т.н.

А х2* е един от новите прагове, разделящ диапазона за кол и фолд в отговор на рейз. Играчът Х ще загуби един залог, ако колне рейза за стойност на опонента си, но ще спечели, ако това ще е блъф. Както ще видим по-късно, тъй като блъф-рейзът ще струва на играча У два залога, честотата на кола за играча Х ще има малко необичайна форма.

y2 = (P + 3)(y2# – y1*)

α2y2 = (y2# – y1*)

Това уравнение фактически повтаря уравнението 11.4, но с корекция за по-голям брой възможни залози. Според него размерът на областта за блъф-рейз (у2# – у1*) е размерът на областта за стойностен рейз у2, умножен по съответната константа α2. Не е трудно да се досетите, че правилата, включващи в себе си константата α, се повтарят във всичките игри [0, 1] с ограничен размер на пота.

Безразличие за играча Х в точката х1:

17-18

y1* – y1 = (P+ 1)(y2# – y1*) + (1 – y0)

Тук получаваме уравнение, което описва зависимостта на областта, с ръцете от която играчът У ще колва, но никога няма да заложи сам (у1* – у1), от областите му за блъф и блъф-рейз. Фактически, това уравнение показва последиците от различните варианти за отиграване за играча Х: той може или да чекне и да се опита да хване блъфа на опонента си, или да бетне, но тогава се появява вероятността за блъф-рейз от страна на играча У.

Уравнение за безразличие за играча Х в точката х1* има вече привичен за нас вид:

1 – y0 = αy1

А в точката х0:

17-19

Това уравнение прилича на това, което получихме за у1* в игра [0, 1] #9 (пример 17.1) – играчът У ще фолдва α на брой ръце срещу залог от опонента.

Имаме девет уравнения, някои от които са взети от вече решените от нас игри.

17-20

Сега можем да решим тази система от уравнения и да намерим стойностите за всичките прагове. Добрата новина за вас  е – ще пропуснем по-голямата част от опростявания, но все пак не можем да подминем една много важна зависимост, която се открива по време на заместванията.

Можем да обединим уравненията 17.3 и 17.4. Ще получим:

y2 = x1(1 – α2)/2                                                                                                                   (17.11)

Както и в играта #6 (пример 16.3), можем да презапишем това уравнение, както следва:

y2 = Rx1

С други думи, получихме зависимостта между диапазона за залог на играча Х и диапазона за рейз на играча У. Тук R = (1 – α2)/2. Лесно се забелязва, че при много големи Р тази константа се стреми към ½ – именно тази стойност разглеждахме в играта [0, 1] #6.

За да решим тази тромава система, трябва да сведем всичките й компоненти към у1 и х1. Така, уравненията 17.2 и 17.6 ще сведем към х1, след което ще ги приравним – ще получим един израз, който съдържа само х1 и у1. След това ще се обърнем към уравнението 17.8. Значението на у0 можем да изразим чрез у1 с помощта на уравнение 17.9. На своя ред, у2# е константа (както следва от уравнението 17.10).

В крайна сметка имаме следното:

x1 = (1 – α)2/[1 + α + (2 – α)(1 – a2)R]                                                                                         (17.12)

Това уравнение има голяма роля в решаването на игри без чек/рейзове, тъй като то работи и в игрите, където са позволени три и повече залога. Работата е там, че допълнителните рейзове променят само стойността на R, докато останалите зависимости между долните прагове остават непроменени. Както ще видите в следващите примери, това уравнение значително ще опрости решаването на игра с безкраен брой рейзове.

Пълното решение за всичките прагове има следния вид:

17-21

Нека да погледнем намерените прагове при различни размери на пота. В дясната колонка се разглежда случай с безкрайно малък пот Р (в математиката подобни числа се означават с ε) – съвсем очаквано в този случай играчите трябва да се откажат от всякакви залози.

17-22

Сега е момента да отговорим на въпрос: какво ще се промени, ако играчът Х има възможността да чек/рейзне?

Пример 17.3 – игра [0, 1] #11
  • Играта е на пълна улица
  • Остават два залога
  • Играчът Х може да чек/рейзне
  • Размерът на пота е Р единици
  • Размерът на залога 1 единица

В тази и следващите игри вече няма да описваме толкова подробно целия процес за получаване на уравнения за безразличие за всеки праг. Вече сте разбрали от горния пример, решенията за игри с ограничен размер на пота могат да бъдат доста тромави. Затова ще се ограничим само с анализа на разликите между стратегиите във вече разгледаните игри и техните по-сложни аналози.

Заедно с новата стратегическа възможност в тази игра се появяват и нови прагове. Обаче, повечето от тях могат да бъдат пропуснати, тъй като техните зависимости вече бяха изучени. Например, играчът Х сега ще прави блъф чек-рейз с ръце, които са между х2# и х1*. Но ние вече знаем, че размерът на тази област ще е равен на диапазона за чек/рейз за стойност (х2), умножен по съответната константа α2. Същото важи и за диапазони за бет/кол и бет/фолд за играча У – той ще фолдва (1 – α2) от стойностните си залози в отговор на рейз, правейки опонента си безразличен към блъфа.

Най-големия интерес тук представляват стойностните диапазони и на двамата участници, тъй като промените в тях съществено влияят върху долните прагове. Но, тъй като вече знаем, в какви съотношения трябва да се намират тези области със стойностни прагове, можем да не изписваме всичките уравнения за безразличие, като ще се съсредоточим върху по-важните аспекти в стратегиите на играчите.

Съвсем е очевидно, че в тази игра вероятността за чек/рейз от играча Х ще влияе съществено върху стратегията за стойностни залози на играча У. Нещо повече, ще се промени и неговата област за стойностни рейзове, тъй като сега играчът Х вероятно ще залага с малко по-слаб диапазон (защото някаква част от силните му ръце ще е в диапазона за чек/рейз). Както вероятно си спомняте, в игрите без фолдове това доведе до значителни размествания в стратегиите – играчът У залагаше с по-тесен диапазон (заради появила се опасност от чек/рейз), а играчът Х, напротив, трябваше да залага доста по-често, за да извлече стойност от средните ръце на опонента. Това, на своя ред, караше играча У да рейзва по-либерално.

Игрите с чек/рейз и без него са пряко свързани помежду си. Нека да разгледаме безразличието на играча Х в точката х2.

17-23

Да намерим у2* – за целта трябва да напишем уравнение за безразличие за прага х2#:

17-24

Също така знаем, че областта у2# – у1* е равна на α2у2. Получаваме:

17-25

В игра без чек/рейз уравнението за безразличие в точката х1 изглеждаше така:

17-26

Това уравнение задава условие за безразличие на играча Х към бет/фолда и чек/кола на прага х1. Ако той направи залог, тогава няма да позволи на опонента си да заложи на блъф, но ще спечели 1 единица срещу онези ръце, които с неохота ще колват и никога няма да залагат сами. В същото време той ще загуби (Р + 1), ако играчът У реши да направи блъф-рейз.

Забележка: Това е много интересен резултат и подобна замяна наистина има място. Тя е аналогична на това, което можахте да видите в глава 16 – там праговете х1 за игри със и без чек/рейзове (но с ограничение по броя възможни рейзове) също така бяха идентични.

Правим замяна и получаваме:

17-27

В играта без чек/рейзове съотношението (1 – α2)/2 важеше за у2 и х1. Обаче, тук то се прилага към праговете у2 и у1. Както и в случая с игрите от глава 16 (примери 16.3 и 16.4), стигаме до извода, че в игрите с чек/рейз R задава последователността от прагове не за двамата играчи (у2, х3, у4 и т.н.), а само за праговете уn.

Можем да приложим тази логика по цялата верига и да минем към общото уравнение, което описва поведението на прага у1 в разглежданата игра:

17-28

Можете да видите, че то много прилича на уравнението 17.12, но при това включва възможността за чек/рейз.

Останалата част от решението не е сложна – трябва само да запишат и да се решат уравненията за безразличие, а след това с използването на горното уравнение да се намерят стойностите на всичките прагове.

В следващия пример ще разгледаме случая с безкрайните рейзове.

Пример 17.4 – игра [0, 1] #12
  • Играта е на пълна улица
  • Остават само два залога
  • Не може да се прави чек/рейз
  • Играчите могат да правят неограничен брой рейзове и бетове
  • Играчите могат да фолдват

За решаването на тази игра ще ни трябват резултатите от предишните примери. Повечето уравнения тук ще са идентични на вече разгледаните от нас в игра 10 (пример 17.2); нещо повече, единственото уравнение, което няма да можем да използваме, е безразличие в точката у2. В онази игра вторият залог винаги беше последен, при това играчът У трябваше да рейзва с половината от диапазона за кол на играча Х. Обаче в този пример играчът Х може да отговори с ри-рейз и ние трябва да го отчитаме.

Освен това, в параметризацията трябва да отчетем безкраен ред прагове за рейзове и ри-рейзове. За всеки от тези прагове трябва да намерим уравнение за безразличие.

Например, за което и да е n ще получим:

17-29

Това е известното ни отношение на блъфове към стойностни залози, което се определя от коефициента α от съответния порядък.

Решавайки играта 10, получихме ключово уравнение, което описваше прага х1 в игри без чек/рейзове.

17-30

Ще е необходимо малко да коригираме едно уравнение, за да отразим следната разлика между тези две игри:

17-31

Ако искаме да бъдем по-точни, ще се промени само R.

И така, можем да твърдим, че уравнението 17.12 в общия вид все още важи. Всичко, което трябва да направим сега, е да намерим стойността R за новата игра.

Да се върнем към примера 16.4 – там при размер на пота, стремящ се към безкрайност, значенията на α се доближаваха до нула. В онази игра прагът у2 беше равен на ½, също както и х1 (1/2). С други думи, значението на R беше равно на ½. Използвайки този резултат в горната формула (при α и α2 стремящи се към нула), също ще получим х1 = ½.

В игра с един залог R беше равно на нула, тъй като прагът у2 не е съществувал. В този случай х1 е равно на (1 – α)2/(1 + α). Точно такъв отговор получихме за играта 9.

Но да се върнем към сегашния ни пример. За тези, които са успели да разберат всичко от предните примери, няма да е трудно да предположат, че:

17-32

Размерът на n-тата област за блъф трябва да е αn от съответната стойностната област

17-33

Когато правим n-ти рейз за стойност, трябва да колваме ри-рейза (или да правим ри-рейз) с (1 – αn+1) ръце от диапазона за n-ти рейз, тъй като в противен случай опонентът ще може да ни експлоатира с неговите блъф-рейзове.

Безразличието в точката у2 (първия праг, в който разглежданата игра се отличава от игра 6):

17-34

Ако играчът У прави рейз за стойност, когато ръката на неговия опонент се намира в интервала от у2 до х2*, тогава той печели един залог. Обаче, той ще загуби една единица, ако играчът Х има ръка, която е по-добра от у2, и (Р + 3) единици, ако играчът Х ще направи блъф ри-рейз с ръце х3# – х2*.

Решавайки това уравнение, ще получим:

17-35

Заменяме всичките α със съответните им изрази:

17-36

Това уравнение за безразличие ще се повтаря през всеки два залога. С други думи, уравнението 17.14 е частен случай за последователността от прагове хn, yn+1, xn+2 и така нататък.

Можем да се възползваме от разгледания по-рано принцип, че щом единият от играчите направи втория рейз, играта става абсолютно симетрична що се касае до съотношенията между различните прагове (с корекция за нарастващ размер на пота). Естествено, значенията на самите прагове ще се отличават, тъй като всеки път ще използваме множител, идентичен на вече познатия R, обаче с нарастването на пота значението на множителя също ще се променя. Поради това ще го наричаме Rp. Тогава ще получим:

17-37

И така нататък…

Да направим съответните замени в уравнението 17.14:

17-38

Получаваме уравнение, което не зависи от х1:

17-39

Това е рекурсивно уравнение, което описва зависимостта между съседни стойности на Rp. За да намерим конкретните стойности на множителя (мултипликатора), можем да използваме следното свойство: при размера на пота, стремящ се към безкрайност, Rp се стреми към R (в този случай ще получим същата игра, която разгледахме в примера 16.4). Следователно, може да изберем произволно голяма стойност на n, да приравним всичко към (√2 – 1) и да намерим нужният ни размер на пота. За щастие, това рекурсивно уравнение се свежда до определени значения достатъчно бързо.

Щом получим стойността Rp, лесно ще можем да определим точното разположение на всеки праг, използвайки уравнението за х1, а след това ще коригираме резултата с помощта на Rp. Както обикновено, областите за блъф ще са съседни на областите за кол, които пък на своя ред са съседни на областите за стойностни рейзове.

Трябва да се запомни:

  • Игрите [0, 1] са подходящи за разглеждане на достатъчно сложни ситуации, включително с чек/рейзове, с безкрайни рейзове и т.н.
  • Независимо от сложността на играта ключовите параметри са стойностни диапазони. На всеки от тях съответства област за блъф-рейз, която може да се определи като се сравни размера на пота със стойностния диапазон.
  • В игрите без чек/рейзове съществува рекурсивна зависимост между последователни прагове на двамата играчи: х1 -> у2 -> х3 и така нататък.
  • В игрите с чек/рейзове подобна рекурсивна зависимост се наблюдава само при прагове на играча У.
  • Ако вашият опонент можеше да заложи, но вместо това предпочете да чекне, тогава вие трябва да залагате за стойност с всички ръце, с които той би заложил сам, както и с половината от неговия диапазон за кол (при условие, че опонентът не може да рейзне – може само да колне или да фолдне).

Advertisements
 
Вашият коментар

Posted by на 02/07/2017 in pankratt, Theory

 

Етикети: ,

Вашият коментар

Попълнете полетата по-долу или кликнете върху икона, за да влезете:

WordPress.com лого

You are commenting using your WordPress.com account. Log Out / Промяна )

Twitter picture

You are commenting using your Twitter account. Log Out / Промяна )

Facebook photo

You are commenting using your Facebook account. Log Out / Промяна )

Google+ photo

You are commenting using your Google+ account. Log Out / Промяна )

Connecting to %s

 
%d bloggers like this: