RSS

Да поговорим за математиката

05 Май
Да поговорим за математиката

The mathematics of Poker by Bill Chen

Тази глава е още „по-безумна“ в частта математика. Явно, авторите изобщо не си дадоха труда да проверят, какво са писали…

Глава 19 – По пътя към покера: Статични игри на няколко улици

В предишните глави разгледахме голямо количество игри на половин улица и на пълна улица. Едно от главните достоинства на тези примери се състои в това, че те са относително прости за решаване, и следователно, могат да ни помогнат да разберем последици от промяна на определени аспекти в играта. Обаче, реалният покер рядко се ограничава с половин или дори една пълна улица. Както ще покажем в тази и в следващите глави, добавянето на допълнителни улици изцяло променя стратегиите на играчите.

Ще започнем с анализа на статични игри. В тях присъстват няколко рунда за залагане, обаче силата на ръцете и на двамата участници остава непроменена. Тези игри ще ни позволят да покажем, как работят блъфовете на няколко улици без излишно да усложняваме разглежданите задачи (например, дроус съществено затрудняват анализа на подобни ситуации). Щом разберем няколко прости примера, ще преминем към решаването на по-сложни и реалистични игри, в които присъстват дроу-ръце.

Най-елементарната статична игра на две улици е игра срещу ясновидец – подходът към нейното решение наподобява подхода към игрите на половин и на пълна улица.

Пример 19.1 – Статична игра с ясновидец на две улици
  • Игра с две пълни улици
  • Силата на ръцете не се променя
  • Размерът на пота е Р единици
  • Размерът на залога е 1 единица
  • Играчът У е ясновидец

Да си припомним, че в игра с ясновидец на една улица играчът Х никога не бетва, защото подобни залози винаги имат отрицателно математическо очакване. Наистина, щом играчът У е ясновидец (и вижда всичките карти), той можеше да експлоатира всеки залог на опонента.

Същото се повтаря и в тази игра. Играчът Х ще е принуден или да чеква и колва, или да чеква и фолдва. Тук това се случва само поради това, че нашата игра е статична, тоест, играчът У знае, каква ръка ще държи в края на раздаването.

Обаче, ако тук присъстваше дроу и играчът У не знаеше, как ще приключи всичко, тогава неговият опонент би получил възможността да залага за стойност.

В игра с ясновидец на една улица изчислихме, че играчът У трябва да залага с всичките нътс и да блъфира с α от неговите слаби ръце. На своя ред, играчът Х трябваше да фолдва α ръце, способни да бият блъф, и да колва с останалите. В игра с две улици се появява още един рунд за залагане. Следователно, и двамата играчи получават допълнителни стратегически възможности. Така, играчът У сега може:

  • Да чекне и на двете улици (стратегия ϒ0)
  • Да чекне на първата улица и да заложи на втората (стратегия ϒ1)
  • Да заложи на първата улица, но да чекне на втората (равносилно на стратегия ϒ1)
  • Да заложи и на двете улици (стратегия ϒ2)

Очевидно е, че играчът У ще предпочете да залага и на двете улици с нътс, тъй като по този начин той може да максимизира своето очакване. Диапазонът за стратегиите ϒ0 и ϒ1 ще включва основно блъфове и някаква част от ръце, които би трябвало да се играе по стратегия ϒ2. Също така, за него е за предпочитане вторият вариант ϒ1, с който той първо ще заложи, а после ще чекне. Разбираемо е, че неговият чек на първата улица често ще показва на играча Х, че опонентът му не държи нътс.

Играчът Х трябва да направи мъртвите ръце на играча У безразлични към тези три линии. За целта той може да използва следните стратегии:

  • Фолд на първата улица (стратегия Х0)
  • Кол на първата улица, но фолд на втората (стратегия Х1)
  • Кол и на двете улици (стратегия Х2)

Получаваме следната платежна матрица (очакване на играча У):

1

В стратегията ϒ2 диапазона с нътс ще наричаме уv, а диапазона с блъфове – уb. Също така, честотите, с които играчът Х използва стратегиите си, ще означим чрез х0, х1 и х2, съответно, при играча У – у0, у1, у2.

В резултат получаваме следното безразличие между ϒ1 и ϒ0.

0 = Р х0 – х1 – х2

(Погледнете матрицата: х0*0 + х1*0 + х2*0 = +Р*х0 – 1*х1 – 1*х2 -> 0 = Р*х0 – х1 – х2)

Знаем, че х1 + х2 = 1 – х0 (очевидно е, че честотата за използване на всичките стратегии не може да е по-голяма от 100%). Тогава:

0 = Рх0 – (1 – х0); 0 = Рх0 – 1 + х0; 0 = 1 – х0 – Рх0; х0(1 + Р) = 1;

Х0 = 1/(1 + Р) = α

На първата улица играчът Х трябва да използва същата стратегия, както и в игра на половин улица – да фолдва с α ръце и да колва с останалите.

Безразличие между ϒ1 и ϒ2 (блъф):

Р*х0 – х1 – х2 = Р*х0 + (Р + 1)*х1 – 2х2;

Х0 = α

Р*α – х1 – х2 = Р*α + Р*х1 + х1 – 2х2;

– х1 – х1 – Р*х1 = -2х2 + х2;

(Р + 2)х1 = х2;

Х1 + х2 = 1 – х0 = 1 – α; х2 = 1 – х1 – α

(Р + 2)х1 = 1 – х1 – α

Дотук бях съгласна с авторите. Те пропускат следните пресмятания и стигат до друг израз. Тук са моите пресмятания:

(Р + 2)х1 + х1 = 1 – α

Х1(Р + 3) = 1 – α

1/(1 + Р) = α; (1 + Р) = 1/α

1 – α – х1 = (1/α + 1)х1; α – α2 – αх1 = (1 + α)х1; х1 (1 + 2α) = α(1 – α);

Х1 = α(1 – α)/(1 + 2α);

А ето какво получават те:

2

На втората улица играчът Х ще играе по същия начин. След като той фолдне α на брой ръце на първата улица, целият му диапазон ще е (1 – α). Обаче, размерът на пота ще се увеличи с две единици, затова на втората улица то трябва да фолдва с α2 (???) на брой от останалите ръце. В същност, това е много важна идея:

Играчът, който не е ясновидец, може да разглежда всяка улица по отделно, сякаш играта се случва не на няколко, а само на една улица.

А сега да разгледаме стратегиите за играча У. Той трябва да направи опонента си безразличен към избора между три стратегии: х0, х1 и х2. Между Х0 и Х1 имаме следното уравнение за безразличие:

3

Тук се сблъскваме с втория важен извод в тази игра:

Ръце, с които играчът У блъфира на първата улица, а след това ги фолдва на втората, са в съотношение α с ръцете, с които той залага (за стойност или на блъф) на втората улица.

След това, безразличие между Х1 и Х2:

4

По този начин, на втората улица залозите на играча У за стойност и блъф са в стандартно съотношение (тук говорим само за останалите ръце). И отново заменяме коефициента α с α2 заради нарасналия размер на пота (аха, това е бил някакъв коефициент, който не е споменаван досега).

Нека да повторим още веднъж казаното горе, това е важно. На последната улица играчът У ще има диапазони с нътс и блъфове, съставени в съответствие с текущия размер на пота. Обаче, тези диапазони той определя още на първата улица, при това те зависят от честотата на неговия залог в последния рунд за залагане. Това води до ситуация, в която играчът У е принуден да блъфира по-често, отколкото в игра на една улица.

Нека потът е 2 единици на първата улица, при това диапазонът с нътс при играча У е ограничен. Тогава на втората улица в пота ще има 4 единици – тук играчът У трябва да залага с нътс, както и с блъфове (които са 1/5 от нътс). Как може да получи този диапазон? Той трябва да си представи, че целият му диапазон за залог на втората улица са „стойностни ръце“ на първата улица, с които той винаги ще заложи.

Тъй като потът на първата улица е 2 единици, той ще трябва да залага с всичките „стойностни ръце“, както и да блъфира с 1/3 от този диапазон. Както току що определихме, стойностния диапазон на играча У на първата улица ще е равен на 6/5 (всичките нътс плюс 1/5 блъфове), следователно, той трябва да блъфира с 2/5 от истинските нътс, но с останалите да се предава на следващата улица. По този начин, общото количество мъртви ръце, с които играчът У ще залага на първата улица, ще състави 3/5 от неговите нътс.

Забележка: Фактически, авторите казват следното. На втората улица ние трябва да блъфираме достатъчно често. Обаче, трябва да блъфираме и на първата улица. Как да изградим диапазона си така, че на всяка улица да имаме достатъчно количество блъфове, както и необходимото количество нътс? Най-очевидния изход е да смятаме целият ни диапазон за залог на втората улица (и блъфове и нътс) за „стойностни ръце“ от първата улица. Следователно, ако ние винаги залагаме с тях, тогава на втората улица ще имаме именно онзи диапазон, който ни е нужен за оптимална игра. Но не трябва да забравяме и за блъфовете на първата улица. Вече сме определили, че със сигурност ще залагаме със „стойностни ръце“, тъй като този диапазон ни е нужен на втората улица. Остана само да определим, колко често трябва да залагаме с блъфовете на първата. Коефициентът α ще ни подскаже, че трябва да блъфираме с една трета от „стойностните ръце“ (потът все още е 2 единици). Нека “z” е нашият диапазон с истинските нътс (с които залагаме за стойност на втората улица). Тогава диапазонът за блъф на втората улица ще една пета от “z”. Сборът на тези диапазони нарекохме „стойностни ръце“ за първата улица и той е равен на 6/5 от “z”. Сега търсим броят ръце, с които трябва да блъфираме на първата улица. Умножаваме 6/5 по 1/3 и получаваме 2/5z. Това означава, че на първата улица трябва да блъфираме с 2/5 от истинските нътс.

 И така, играчът У ще блъфира с 2/5 от нътс на първата улица и с 1/5 – на втората, обаче последният диапазон вече е включен в „стойностните ръце“ на първата улица. Следователно, като цяло той започва да блъфира по-често!

Можете да си кажете: „Но защо трябва да си усложнявам живота? Нима не мога да залагам на флопа малко по-често, без да обединявам диапазоните?“ Не, не може, тъй като всичките ни блъфове и стойностни залози трябва да са в съотношение α, което е показано в уравненията за безразличие.

След като той заложи с такъв диапазон на първата улица, той трябва да се предаде с 2/3 от мъртвите си ръце на втората (съобразно известното ни уравнение 1 – α). В крайна сметка получаваме диапазон за блъф на втората улица, който е точно 1/5 от нътс. Играчът Х не може да експлоатира тази стратегия по никакъв начин – вече показахме горе, че той е безразличен към всичките си стратегически възможности.

Този резултат може да бъде обобщен за какъвто и да е брой улици и размери на залози.

А сега да си представим следната игра:

  • Играчите слагат анте по 2 единици всеки
  • И двамата играчи получават някакви ръце, при това играчът У знае ръката на опонента си.
  • Раздава се пълният борд, но го вижда само играчът У
  • Диапазонът на играча У се състои на половината от нътс, на половината от блъфове
  • В играта има три рунда за залагане: на флопа залог с 1 единица, на търна и ривъра – по 2
  • На шоудауна печели най-добрата ръка.

В тази игра очакването от залога за играча Х ще е отрицателно на всичките улици. Нещо повече, решението тук по нищо не се отличава от случая с два залога – ние само правим корекции за допълнителна улица и нови правила за бет-сайзинг.

Размерът на пота до ривъра ще е 4 + 2 + 4 = 10 единици, а размерът на залога ще е 2. На ривъра играчът У ще направи бет за стойност с всичките си нътс, които са половината от ръцете му, както и на блъф с 2/12 от този диапазон (или 1/12 от всичките му ръце). По този начин, общият му диапазон на ривъра ще е 7/12.

На търна потът е 6 единици, размерът на залога – 2. Диапазонът със „стойностни ръце“ на играча У ще е 7/12 от всичките възможни ръце, плюс той ще залага на блъф с една четвърт от „стойностните ръце“. С други думи, на търна той трябва да направи бет с 35/48 от началните ръце.

На флопа потът е 4 единици, размерът на залога – 1 единица. И отново играчът У ще има диапазон от „стойностни ръце“ 35/48, плюс една пета от този диапазон са ръцете за блъф. Това означава, че на флопа той ще залага с 42/48 (или 7/8) от началния си диапазон.

Решението на тази игра изглежда така: играчът У залага с 7/8 от ръцете си на флопа, предава се с 1/12 след флопа и с 7/48 след търна (т.е. с частта за блъф). Играчът Х, пък, просто губи с α от неговите ръце на всяка улица. Цената на тази игра може да се определи лесно, ако си представим, че играчът Х се предава още на флопа (тъй като той е безразличен към избора на действие). В единият случай от осем възможни той ще вземе пота, което прави очакването на неговия опонент да е равно на 1.5 единици. Наистина, удивително е, че играчът Х има поне някакъв шанс да си върне поне малка част от парите в толкова „нечестна“ игра.

Както вече казахме, този алгоритъм важи за игри с какъвто и да е размер на залога. В онези от тях, където ясновидецът диктува и бетсайзинга (например, NoLimit Holdem), можем да използваме принципа за максимизиране на очакването, който разгледахме в предните глави.

Пример 19.2 – Статична Но-лимит игра с ясновидец на две улици
  • Две пълни улици
  • Силата на ръцете не се променя
  • Размерът на пота 1 единица
  • Размерът на стака N единици
  • Размерът на залога – произволен
  • Играчът У е ясновидец

Първо ще погледнем играта на двете улици; обаче, самият принцип за решение може да се приложи и към случаи с произволен брой улици.

В предния пример видяхме, че играчът, който не е ясновидец, играе на всяка улица така, сякаш това е една отделна улица, правейки фолд с α от ръцете си и колвайки с останалите. На своя ред, ясновидецът използва коефициента α, за да състави правилни диапазони за няколко улици едновременно.

Тези зависимости се запазват дори когато размерите на залога се задават от играча-ясновидец. За да намерим оптимална стратегия, ще е необходимо само да изразим очакването на играча-ясновидец чрез s1 и s2 (бетсайзинг на първа и втора улица), а след това да намерим максимума на получената фукция. При размера на пота от 1 единица имаме следната матрица на плащания:

5

Ще използваме същия модел за уравнения за безразличие, както и в миналата игра:

x0 – s1x1 – s1x2 = 0

x0 = s1(1 – x0)

x0 = s1/(1 + s1)

И отново, играчът Х е принуден да фолдва α от ръцете си. Тук α = s/(1 + s), тъй като размерите на залога не са зададени предварително.

6

На какво е равно α2 в тази игра?

След първата улица размерът на пота ще е 1 + 2s1. Тогава α2 ще е s2/(1 + 2s1 + s2). Слагайки това в горното уравнение, ще получим:

x2 + x1 = x1/ α2

x1 = α2(x2 + x1)

Вече се сблъсквахме с такъв отговор горе. Играчът Х трябва да разглежда всяка улица по-отделно и да се ръководи само от съответната стойност на α. Така, след втория залог той трябва да фолдне α2 от ръцете си, с които колва първия (х1 + х2).

Безразличието за играча Х почти не се отличава от лимитния случай:

7

Както и по-рано, количеството ръце, с които играчът У блъфира веднъж, е равно на α от общия диапазон за залог на втората улица.

8

Излиза така, че това решение подхожда за всякакви размери на залога (при условие, че диапазоните на участниците не са прекалено силни). За да определим оптималните размери на s1 и s2, трябва да намерим максимума за функцията на очакваната печалба на играча У.

Тук можем да прибегнем към едно интересно опростяване, което ще ни помогне да разберем принципа за избор на оптимален бетсайзинг. Да предположим, че играчът У залага  s1 в пот от 1 единица. Ако опонентът му колне, потът ще се увеличи от 1 единица до (1 + 2 s1). Нека r1 е коефициент, който определя отношението на новия пот към стария в случай на кол на залога s1. Същото се отнася и за  r2 само че за залога s2.

9

Естествено, разглежданото тук r няма нищо общо с коефициента за рейзове от уравнението 14.1.

Както следва от горното определение, за всяка улица е вярно следното:

r = 1 + 2s (ако в началото потът е бил 1 единица)

Да извадим от двете части на уравнението s и ще получим:

r – s = 1 + 2s – s

r – s = 1 + s и още малко „нагласени“ преобразования:

r – s = (2 + 2s)/2; r – s = (1 + (1 + 2s))/2;

r – s = (1 + r)/2

Също така ще бъде вярно и следното:

10

Нека величината Мn изразява размера на диапазона със „стойностни ръце“ независимо от това, дали сме на ривъра (където имаме предвид нътс) или на един от по-ранните рундове за залагане (където имаме предвид комбинация от нътс и блъфове). На която и да е улица количеството ръце, с които ще залагаме (за стойност или на блъф) ще е равно на (Вn):

11

Това е много важно уравнение. Фактически, тук сме намерили множител, който може да се използва на която и да е улица, за да намерим диапазона за блъф.

Така, на втората улица в нашата игра целият диапазон за залог е (нека диапазонът с нътс при играча У е у):

12

Същевременно, диапазонът за залог на първата улица ще изглежда по следния начин:

13

Нека още веднъж да прегледаме нашите пресмятания и да изведем нужния на нас отговор. Определихме rn като отношение на размера на пота след залога и кола на текущата улица към размера на пота преди него.

Съставихме уравнение, което ни позволява да изразим общия диапазон за залог (с блъфове и стойност) на която и да е улица:

14

Тук Мn е количество ръце, с които ще бъде направен залог на следващата улица (ако такива са останали), или количество нътс-ръце (ако сме на последната улица).

Ако играчът У залага s1 и s2 с оптимална честота, тогава на играча Х ще му е безразлично какво да прави на която и да е улица: кол или фолд. Обаче, не бива да разчитаме на това, че играчът Х просто ще фолдне ръцете си и неговият опонент ще вземе пота с блъфове. Обратно, играчът Х ще се старае да играе оптимално, което предполага и колове. Следователно, играчът У ще се опитва да сложи в пота колкото може повече пари с нътс (следователно, и с блъфове). Тогава сборът от s1 и s2 трябва да е равен на стака на играча У, тоест N. Нека играчът Х никога не фолдва ръката си (тъй като той е безразличен към избора на действие, можем да направим подобно предположение). Тъй като s1 + s2 = N независимо от случая, играчът У ще получи най-голямото очакване, ако максимизира своя диапазон за залог.

Общото количество ръце, с които играчът У ще залага:

15

Очевидно е, че е константа, затова трябва да намерим максимума за следния израз:

16

Множителят r1*r2 също е константа (размерът на стака в раздаването, N, естествено е постоянна величина):

17

Следователно, търсим максимума за:

18

Знаем, че r1 и r2 са положителни; следователно, можем просто да минимизираме знаменателя (тогава ще получим максималната стойност на тази дроб):

19

Няма да обръщаме внимание върху константи. Остава да намерим минимума за (r1 + r2), при условие, че r1r2 е постоянна величина. Оказва се, че този израз достига до минимума си само при r1 = r2.

В действителност, този отговор можем да обобщим за произволен брой улици. Използвайки същата логика, можем да определим, че очакването на играча У в игра с три улици ще е:

20

Обаче, ако В1 ≥ 1, тогава играчът У няма да има достатъчно блъфове. В този случай той ще трябва да залага със стойност, с която нараства пота. А играчът Х, на своя ред, ще е принуден да фолдне всичките си ръце.

Отново, ако отхвърлим всичките константи, ще получим израз r1 + r2 + r3, който трябва да минимизираме, при това r1r2r3 ще е постоянна величина. И отново, този сбор ще е минимален при r1 = r2 = r3.

Тази прогресия на залози наричаме геометрически растеж на пота (на всяка улица потът се увеличава с една съща част). Тази идея е много важна за разбирането на бетсайзинга в NoLimit Poker като цяло.

И така, когато имаме работа със статична игра и единият от участниците е ясновидещ, оптималната стратегия предполага еднакъв прираст на пота на всяка улица, при това, в крайна сметка, трябва да сложим целия си стак на масата.

По-надолу ще разгледаме малък пример, в който добре се вижда разликата между току що анализирана стратегия (срещу опонент, който използва оптимална стратегия) и линия, която може да ви подскаже интуиция.

Пример 19.3
  • В началото на раздаването стаковете на играчите Х и У са $185, анте $5.
  • Играчът У получава 1 карта от пълното тесте
  • Три рунда за залагане
  • На шоудауна играчът У печели само с А или К и губи във всички останали случаи

Тази игра е еквивалентна на игра с ясновидец, която обсъждахме по-рано, обаче в този случай имаме работа с 3 рунда за залагане.

Като начало, можем да намерим шоудаун-стойност, тоест очакване на играча У, ако и двамата участници просто стигат до шоудауна без да залагат. Той ще печели в 2/13 от случаите, следователно, неговото очакване, без да отчитаме анте, ще е $1.54, обаче, ако извадим от тук вложените в пота пари, тогава ще получим минус $3.46.

За да направи играта печеливша, играчът У трябва да добави към очакваната от него печалба $3.46, залагайки и на трите улици. Нека да сравним очакването от две различни стратегии за залагане (бетсайзинг):

ϒ1: Играчът У залага точно 1/3 от стака си на всяка улица

ϒ2: Играчът У залага съгласно принципа за геометрично нарастване на пота

Очевидно е, че за ϒ1 всеки залог ще е $60. В стратегията ϒ2 можем да използваме факта, че 10r1r2r3 = 10 r3 = $370. Следователно, r е равен на корен кубичен от 37 или 3,3322. Освен това, на всяка улица pn + 2 sn = r pn.

21

Играчът Х ще играе с оптимална стратегия, колвайки pn/(pn + sn) пъти на всяка улица. Неговата очаквана печалба в този случай ще е:

22

Тук изпаднах в леко недоумение по повод показаните стойности: с процентите всичко е наред – те се получават по следния начин:

                Стратегия 1: 1-та улица – $10/($10 + $60) = 14,29%; 1-та улица – ($10+$60+$60)/($130+$60)=68,42% -> 14,29*68,42 = 9,77%; по съответен начин и на 3-та улица: потът вече е 190+60 = 250; 250/(250 + 60) = 80,6% или 80,6%*9,77% = 7,88%

                Стратегия 2: всичко е по същия начин – 46,2% на всяка улица – те се определят от съотношението за честотата на кола. Обаче, какво означава Общо $90 и 4,06% и как са се получили не става ясно – както и да се опитвах – не се получава.

Но и това не е всичко. По надолу искам да покажа извадката от книгата, която просто ме стъписа. Интересното тук е, че за стратегия 1 всичко е нормално, но вижте какви стойности са сложени в изчисленията за стратегия 2:

23

Даденият израз просто не е равен на $26,41.

Вярното е:

(46,17%)*($11,66) + (21,31%)*(38,86) + (9,84%)*(129,48) = $26,41

Какво ли не опитах, за да получа тези стойности (8,34; 22,26; 59,40) – нищо не се получаваше, докато не реших просто да сметна посочения израз – и отговора не беше такъв! Обаче, откъде се взеха $90 и 4,06% така и не можах да схвана.

Но да продължим…

Знаем, че играчът У получава неутрално очакване от своите блъфове. Обаче, за неговите стойностни залози математическото очакване ще е:

24

Като последния израз не е верен – трябва да е:

< Υ2 > = (46.17%) ($11.66) + (21.31%) ($38.86) + (9.84%) ($129.48) = $26.41

По този начин, играчът У средно печели със 7 долара повече при стратегия за геометрично нарастване на пота. И това е напълно достатъчно, за да печели в тази игра. Тук трябва да отбележим, че максималната шоудаун стойност на играча У не може да превишава шоудаун стойността на играча Х – в този случай последният просто трябва да фолдне ръката си и да даде на опонента си $5 анте.

Да разгледаме графиката на зависимостта на r от размера на стака при два и три рунда за залагане:

25

Fig. 19.1 Геометричен ръст на пота на две и три улици

При r равно на 3, s стига до 1, тоест започваме да залагаме точно с размера на пота. Както можете да забележите, за да бъдат тези бетове оптимални, стаковете трябва да бъдат поне 13 пъти по-големи от пота. В същото време при стакове, които са 3,5 пъти по-големи от пота, достатъчно е да се залага с половин пот, за да сложиш всичките си пари на масата при стратегия за геометричен растеж на пота.

Аукционни игри (игри с безкраен брой улици)

Последните статични игри, които ще разгледаме в тази глава, почти нямат нищо общо с покера; в същност, структурата на решенията им значително се отличава от повечето разгледани досега игри.

Обаче, тези игри спомагат за по-добро разбиране на поне един важен принцип, и освен това имат няколко интересни свойства. Тези игри се случват на безкраен брой улици и се наричат аукционни.

Пример 19.4

Ще започнем от разглеждане на игра с ясновидец при много голям брой улици.

  • М брой пълни улици
  • Силата на ръцете на играчите не се променя с промяната на улица
  • Размерът на пота е 1 единица
  • Залозите са с ограничен размер (стаковете са по S единици)
  • Играчът У е ясновидец

Използвайки принципа за геометричен растеж на пота в ситуация с М улици, ще получим следното:

Крайният размер на пота ще е (след като играчите сложат в пота стаковете си) 1 + 2S

Р = 1 + 2S

Нарастването на пота на всяка улица ще е равен на корен със степен М от Р (това е геометричното нарастване на пота за М брой улици),

26

Размерът на залога s (за текущия размер на пота) на всяка улица ще е равен на:

s = (G – 1)/2

Да предположим, че ние колваме на първата улица, където потът е равен на 1. Играчът У ще залага с оптимален стойностен диапазон уv, но ще блъфира с s/(1 + s) от уv. В крайна сметка той ще залага с диапазон yv (1 + 2s)/(1 + s).

Можем да префразираме това по следния начин. Отношението на количеството ръце, с които той ще заложи на (m + 1)-ва улица към количеството ръце, с които той ще заложи на m-та улица, е равно на:

rb = (1 + 2s)/( 1 + s)

Донякъде, тази величина може да се нарече мултипликатор на блъфове. Представете си, че анализираме игра на две улици със стакове от 1 единица и точно такъв пот. Геометричното нарастване на пота в този случай предполага, че трябва да увеличим пота от 1 до 3 в рамките на две улици. Следователно, r в тази игра е равно на √3, а размерът на залога на всяка улица ще е (√3 – 1)/2 или приблизително 0,366. А сега блъфовете. Нека играчът У в диапазона си има у стойностни залози, тогава на ривъра той ще блъфира с ys/(1 + s) ръце. При това при избрания бетсайзинг, изразът s/(1 + s) приблизително е равен на 0,268. И така, на ривъра играчът У ще залага с 1,268у ръце, а на търна – с (1,268)2у. Слагаме 0,366 вместо s във формулата за rb и получаваме, че  rb = 1,268.

Нека количеството нътс в диапазона на играча У през цялата игра е някакво у. Тогава уm е количеството ръце, с които той залага на улица (m + 1), а уМ е диапазон за стойностен залог, тоест уМ = у. На своя ред, у0 е диапазон за залог на първа улица. Тогава:

27

Обаче, тук можем да сблъскаме с определени трудности.

Да предположим, че у0 > 1. Тогава възниква ситуация, която вече обсъждахме по-рано – на играча У не му достигат блъфовете. В този случай оптималната стратегия за него ще е бет, а играчът Х ще е задължен да фолдва всичките си ръце.

В противен случай играчът Х ще колва 1/(1 + s) пъти. Нека хm е броят ръце, с които той колва на улица (m + 1). Тогава:

28

В който и да е от тези случаи, ако играчът У използва оптимална стратегия, играчът Х ще е безразличен към кола или фолда. Затова цената на разглежданата игра е у0 – у, което е интересна зависимост на очакването от броя на блъфовете в диапазона на играча У.

А сега да погледнем игра от съвсем различен тип.

Пример 19.5 – Аукционна игра
  • Силата на ръцете не се променя с промяната на улиците
  • Залогът е с ограничен размер (стаковете са по S единици)
  • Размерът на пота е 1 единица

Всеки играч прави залог, но не казва за него на опонента, след това и двата залога се отварят едновременно.

Ще означим размерите на залога чрез sx и sy. Очевидно е, че всеки от тях трябва да се намира в интервала [0, S]. И двата залога се добавят в пота.

Ако sx > sy, тогава играчът Х печели. Ако sy > sx, тогава печели играчът У. Ако sx = sy, тогава е шоудаун (обикновено това ще се случва, когато и двата залога са равни на размера на стака).

Тази игра наистина малко прилича на покер. Обаче, хайде да се опитаме да се абстрахираме от този факт. Представете си, че имаме работа с някаква покер игра със статични ръце на М улици според описаните горе правила.

За всяка ръка, която можем да имаме, ще намерим собствена стойност sx, която ще е някаква част от нашия стак S.

На всяка улица ще залагаме еднаква част от останалия ни стак ε = S/M, докато не достигнем до определена прагова стойност sx, над която не сме готови да качваме. След тази точка ние просто ще чекнем и ще се предадем. ε е символ, който беше въведен по-рано и представлява някаква много малка величина. Както ще видим в тази игра, с нарастването на броя на улици ε ще се стреми към 0. Ако нашият опонент направи рейз с какъвто и да е размер, тогава ние ще колнем само тогава, когато той е по-малък от праговата стойност, и на следващата улица ще продължим да залагаме ε, като отчитаме останалия стак и броя останалите рундове за залагане. Ако пък рейзът е над нашия праг, ние ще фолднем.

Забележка: Ние ще залагаме ε на всеки етап от аукциона (тоест ще пресмятаме размера на всеки залог, изхождайки от размера на началния стак) тъй като не искаме да стигнем до нашия праг прекалено бързо, а и не искаме да покажем на опонента си, че се забавяме отколо праговата точка (това би се случило, ако бихме използвали във формулата вместо S нашият праг) – в този случай той може да направи рейз и да вземе пота.

А сега да предположим, че играем срещу идеален опонент. Какво е неговото очакване от експлоатация на нашата стратегия? За да определи нашия праг, той трябва да колва, докато ние не направим чек. Тоест, той не може да ни експлоатира толкова елементарно. В същност, той ще има печалба само тогава, когато нашата стратегия ще ни накара да заложим малко повече от sx. Да предположим, че броят на улиците е 100, а sx = 0,601. За първите 60 улици нашият залог ще е 0,01. На 61-вата улица ние все още не сме достигнали до зададения праг, обаче не можем да започнем да залагаме повече, без да направим нашата стратегия отворена за експлоатация (опонентът веднага ще разбере, че именно това е нашият праг). Затова ние отново залагаме 0,01, довеждайки залога ни до 0,61. Тази стойност е по-голяма с 0,009 от това, което първоначално смятахме да заложим; практически срещу всички ръце, с които опонентът колваше до този момент, ние губим тези допълнителни 0,009.

Хайде да разгледаме, какво очакване има рейз за идеалния опонент.

Нека ние залагаме на някаква определена улица, докарвайки общия размер на залога до х. Тъй като ние току що заложихме, той трябва да знае, че стойността на прага sx трябва да не е по-малка от х – ε. Да предположим, че той рейзва до у единици. Тогава са възможни три сценария:

  • sx < y. В този случай ние фолдваме. Обаче, опонентът би могъл да спечели повече (поне sx – x) ако просто колва нашите залози, докакто не се предадем.
  • sx > y. В този случай ние ще колнем. Обаче, след това размерът на нашия залог за всяка улица ще се намали: вместо (S – x)/Mост ще залагаме по-малко, (S – y)/Mост. Отчитайки, че вече показахме, как опонентът може да спечели от нашата стратегия сума пари до ε, той, очевидно, няма да иска да намалява тази стойност.
  • sx = y. В този случай ние ще колнем, но след това винаги ще чекваме и ще се предаваме. А идеалният опонент няма да спечели нищо.

Излиза, че единственият избор за идеалния опонент е да колва докато ние не чекнем.

Решението на тази игра може да се разгледа от гледната точка на теория на игрите. Нека съществува някаква двойка стратегии (Х, У), при това ние знаем очакването за идеалния опонент срещу Х и срещу У. Обаче, цената на играта ще е между тези две стойности, тъй като оптималната стратегия на играча Х ще има по-малко очакване, отколкото стратегия на идеалния опонент, като същото е вярно и за играча У. По този начин, цената на играта за идеалния опонент в най-добрия случай ще е G – ε (където G е цената на играта при използване на оптимална стратегия).

И тъй като знаем, че, ако броят на улиците в играта, М, се стреми към безкрайност, тогава ε ще се стреми към 0, тъй като М е знаменател в израза ε = S/M. Излиза, че цената на която и да е игра се свежда към цената на аукционна игра със съответни параметри. А играейки аукционна игра при произволен брой улици, максималната ни загуба ще е ε.

Забележка: Горният параграф означава, че, ако броят на улиците в играта става безкраен, тогава позицията вече няма значение, както и експлоатацията.

Пример 19.6

По нататък ще разгледаме една аукционна игра с ясновидец.

  • Играчът У е ясновидец
  • Прилагат се правилата на аукционна игра със стакове S единици и начален пот от 1 единица.

Нека играчът У има у нътс-ръце. Тогава ще разглеждаме само три типа ръце: ръцете на играча Х, които по нищо не се отличават една от друга, нътс-ръцете на играча У и ръцете-въздух на играча У. Напълно е разбираемо, че играчът У винаги ще избира sy = S с нътс, защото той ще иска да сложи в пота колкото може повече пари с много силна ръка. Нека х(s) е частта от ръцете, с която играчът Х ще залага най-малко s, a y(s) е частта от ръцете, с която играчът У ще залага най-малко s.

Стратегията на играча У ще бъде да залага S с ръцете-нътс и да избира sy за блъфовете така, че той постепенно ще се предава с тях, докато не остане с у(S) = y. За да направим играча У безразличен към залога s и (s + Δs) с мъртва ръка, можем да направим следното (Δs или „делта s” обикновенно се използва за означаване на незначително нарастване на величината s):

29

(х, тоест частта от ръцете, с които играчът е готов да вложи в пота някакви пари, ще се намалява с нарастването на s).

Забележка: Авторите използват не дотам разбираеми формули без да дадат някакъв отговор. Напълно е вероятно, че формулите са от примера 19.4

30

Коментар:

Наистина, какъв е начинът от първият израз –Δx = x(s + Δs) – x(s) да се получи

31

Тук няма разумно обяснение. Да не говорим, че във втория израз е сбъркан знака (оградено в червено), който трябва да е минус. Понятието производна, което очевидно се използва тук, е толкова изопачено, че едва ли може да се нарече математика.

Следващите изрази са горе-долу верни:

При Δs -> 0, получаваме:

32

Това прилича на производна, но някак си не съвсем.

Ще интегрираме и двете части:

33

И тук е допусната грешка – би трябвало да е:

34

35

Явно някой просто е преписвал без да провери какво става…

Очевидно е, че х(0) трябва да е равно на 1, тъй като всичките ръце ще заложат поне 0. Следователно, k = 1, и тогава:

36

По същия начин, играчът У трябва да направи опонента си безразличне между s и s + Δs

37

38

Знаем, че y(S) = y0, затова:

39

Това, че горе е написано у0, а след това се използва у, вероятно няма никакво значение – с една грешка повече или по-малко – явно точността не е приоритет на авторите.

От тук ще изразим k:

40

По този начин:

41

Обаче в този случай, отново, у0 (??? Къде е у0???) може да бъде по-голямо от 1. Следователно, решението на играта изглежда така:

42

43

С други думи, всеки от тези изрази означава онзи брой ръце, с които играчите Х или У (сътветно) ще залагат поне s (при стакове S).

Например, ако стаковете са по 10 единици и играчът У има в диапазона си 50% нътс, тогава той ще залага 1 единица като минимум с:

44

Тъй като тази стойност е по-голяма от 1, тогава той трябва да бетва с целия си диапазон. Той ще залага с 5 единици като минимум:

45

Излиза, че играчът У ще залага с всичките си нътс и с още 0,191 от общия брой ръце на блъф.

Също толкова лесно е да се покаже, че при М →∞ току що получихме решение за игра срещу ясновидец на М улици. Специално няма да разглеждаме случаи, когато в диапазона на играча У няма достатъчно блъфове и ще говорим за по-обичайна ситуация, когато и двамата играчи играят със смесени стратегии на първата улица.

За да не се объркваме с променливата s, нека

46

Ако не си спомняте, какво беше това, ето една извадка от по-рано:

47

Този израз дава честота на залога на една улица (пример 19.4).

Можем да използваме следните опростявания:

48

От решението на игра с ясновидец (пример 19.1) ние знаем, че

49

Също така, знаем, че размерът на пота след тази улица ще е:

50

Ще направим замяна и получаваме:

51

Същото важи и за у(s).

Трябва да се запомни

  • Игра срещу ясновидец може да бъде продължена на няколко улици. В този случай ключовият момент от решението ще са „вложени“ един в друг диапазони, при които ясновидецът трябва да блъфира по-често, но след това да се предава с някаква част от блъфовете му на следващите улици.
  • При игра без лимит с ясновидец на няколко улици оптималният бетсайзинг е геометричното нарастване на пота.
  • С увеличане на броя на улици позиционното предимство губи стойност – аукционната игра е изцяло симетрична.
  • Както показва аукционната игра, в игри със статични ръце има смисъл да се правят малки залози на всяка улица. Обаче този принцип може и да не важи при игра с дроу.
  • Играчът, който не е ясновидец, трябва да разглежда играта на няколко улици като последователност от игри на една улица.
  • Броят ръце, с които играчът У блъфира на текущата улица, но след това се предава, се намира в съотношение α с общия му диапазон, с който той ще заложи на втората улица.

Advertisements
 
5 Коментари

Posted by на 05/05/2017 in Theory

 

Етикети: ,

5 responses to “Да поговорим за математиката

  1. Georgi

    09/07/2017 at 1:16

    Ще качиш ли всички глави досега преведени на едни файл?

    Like

     
  2. pankratt

    08/29/2017 at 15:38

    Здравей!
    Възможно е, само че не съм я довършила. Ако искаш написаното досега да е 1 файл, мога да го направя.

    Like

     
    • Georgi

      08/29/2017 at 17:28

      Да, досега написаното на един пдф или уорд, благодаря.
      А да се надяваме скоро цялата на един файл!
      В последно време, като че ли не ти е интересна толкова за превод или нямаш време?

      Like

       
  3. Georgi

    08/29/2017 at 15:00

    Здравей, възможно ли е всички части на Математика на покера да ги сложиш в един пдф файл за сваляне?

    Like

     

Вашият коментар

Попълнете полетата по-долу или кликнете върху икона, за да влезете:

WordPress.com лого

You are commenting using your WordPress.com account. Log Out / Промяна )

Twitter picture

You are commenting using your Twitter account. Log Out / Промяна )

Facebook photo

You are commenting using your Facebook account. Log Out / Промяна )

Google+ photo

You are commenting using your Google+ account. Log Out / Промяна )

Connecting to %s

 
%d bloggers like this: