RSS

Да поговорим за математиката

21 Апр
Да поговорим за математиката

The Mathematics of Poker by Bill Chen

Глава 18 – Цената е от значение – продължение

И така, очакването в областта, където и двамата играчи имат силни ръце, е r/2.

Да поставим тази стойност в изходната матрица:

16

Да пресметнем очакването за цялата игра:

17

Можем да сравним получената стойност с 1/8, което беше цената на първата игра, разгледана в тази глава (два залога, без чек/рейз). Очевидно е, че играчът Х печели от възможността да направи чек/рейз, обаче, влиянието на всеки последващ рейз върху общото очакване от играта ще става все по-малко. Можем да се убедим в това, ако пресметнем прага х3 = r2/(1 + 2r) = 0.09384. За да може играчът Х да направи трети залог (с ръка, която е по-добра от х3), неговия опонент трябва да е с диапазон у2, което ще се случи само в 22% от случаите. Следователно, вероятността за този изход ще е само 2%.

Последната, решена от нас игра без фолдове, разрешаваше на участниците да правят безкраен брой рейзове, като позволяваше на играча Х да използва чек/рейз (пример 16.4). С помощта на разгледания горе метод можем да намерим очакването на играча У.

В играта с два залога и чек/рейз играчът Х беше безразличен към чек/рейза и залога с всички ръце, които са по-силни от у2. Същото е вярно и за случая с безкрайните рейзове. Играчът Х е безразличен към чек/рейз и бет между които и да е два прага на играча У. Тогава стратегията на играча Х значително ще се опрости:

18

... и така нататък.

За областта, където диапазоните и на двамата играчи са по-силни от у1, отново откриваме, че очакването й е r/2. Призоваваме читателите си да се убедят самостоятелно, че това наистина е така.

Получаваме проста матрица на плащания:

19

Изчисляваме очакването от играта:

20

Появата на стратегическа възможност „чек/рейз“ отново незначително подобри очакването на играча Х. За сравнение, възможността да направи залог намали очакването на играча У точно два пъти, от ¼ на 1/8.

По-късно отново ще се върнем към сравняването на очакваните печалби от различните игри. Следващата ни задача ще е да определим цената на играта, когато размерът на пота е ограничен.

Най-простия пример за такъв тип игра беше примерът 11.3 – игра на половин улица с позволени фолдове. Решението на тази игра изглеждаше така:

21

Тук ще използваме Gn като очакване на играча У в различните области на стратегия, започвайки от най-слабата (където n = 0).

Когато ръката на Х е в диапазон [0, y1], най-добрата му стратегия ще е кол – той ще спечели един залог срещу блъфовете на опонента, но срещу стойностни залози няма да получи нищо.

22

Когато ръката на играча Х е в интервал [y1, y0], той става безразличен към кола или фолда с която и да е от тях. Той печели залога срещу блъфове, но губи срещу стойностни залози. Щом това е така, можем да приемем, че той винаги ще фолдва ръката си. Тогава играчът У няма да получи нищо със стойностните си ръце, но печели пота с размер Р в случай на успешен блъф.

23

А ако играчът Х има ръка в интервала от у0 до 1, тогава той винаги ще фолдва, предавайки пота на опонента си. Играчът У, на своя ред, средно ще печели половината от пота с ръце от същия интервал (тъй като ръка, по-слаба от тази на играча У, ще се появява точно в половината от случаите):

24

За да намерим цената на играта, трябва да умножим получените стойности на Gn по дължините на съответните интервали:

25

Можем да опростим получения израз, използвайки известното значение на у1 (от по-горната формула):

G = y1(1 – α)/2

В играта [0, 1] #9 (пример 17.1) разгледахме стратегиите на играчите на пълна улица. И отново, за да намерим цената на играта, можем да използваме същия алгоритъм. В областта [0, y1] се получава така, че чекът и бетът на играча Х имат еднакво очакване спрямо оптималната стратегия на опонента:

26

Решението за играча У изглеждаше по следния начин:

27

Можете да забележите, че играчът У печели един залог с ръцете от интервала [y1, y1*] след чека на играча Х (в сравнение със залог), но губи в интервала [y0, 1]. Можем да докажем, че тези области са идентични по размер по следния начин:

28

По този начин, когато ръцете на играча Х са в диапазона [0, y1], той е безразличен към чека и бета срещу оптимална стратегия на опонента. Това означава, че можем да използваме изводите си от предишния пример. Цената на тази игра ще е идентична на тази за игра #2 (пример 11.3), като единственото отличие тук е в прага у1.

Ще използваме уравнението 18.1:

29

Но сега ще поставим в него друго значение на у1:

30

Играта от примера 17.2 позволяваше рейзът да се прави само от играча У. За да определим нейната цена, можем да използваме следните G от игра с един залог:

31

Колкото до G2, където ръката на играча Х е в диапазона [y1, y2], ние знаем, че ако той ще залага, тогава играчът У ще рейзва достатъчно често, за да го направи безразличен към кола. Стойностните залози на играча У винаги ще са по-силни от ръцете в разглеждания диапазон, така че играчът Х може само да се надява да бие блъф. Можем да сравним очакването на играча Х от чек/кола с очакването от бет/кола за всичките ръце в тази област:

32

И отново, можем да покажем, че играчът Х е безразличен към избора на една от тези линии. Както може би си спомняте, едното от уравненията за безразличие, съставени от нас за тази игра, изглеждаше така:

y1* – y1 = (P + 1) (y2# – y1*) + (1 –y0)

В случай на бет/кол играчът Х печели:

2 (y2# – y1*) + y1* – y1 – 2y2

Използваме посоченото горе значение на у1* – у1 и получаваме:

(P + 3) (y2# – y1*) + 1 – y0 – 2y2 = -y2 + αy1

В случай на чек/кол, играчът Х получава:

-(y2 – 0) + (1 – y0) = -y2 + αy1

Следователно, в интервала [y2, y1] на играча Х ще му е безралично какво да прави: чек/кол, бет/фолд или бет/кол. Малка забележка за тези, които се канят да поработят над решението на по-сложни [0, 1] игри: такова тройно безразличие често пъти намалява броя на уравнения, както и съществено ги опростява.

Най-лесно ще е да се търси очакването на играча У срещу ръцете на играча Х от зададения диапазон, когато последният чеква и колва. В този случай:

G2 = <X в [y2, y1] > = y2 – αy1

С ръце, по-силни от у2 играчът Х трябва да играе бет/кол. Тогава той получава неутрално очакване, ако опонетът му рейзва за стойност, а също така той печели един или два залога, когато играчът У колва или блъф-рейзва.

Следователно, очакването на играча У ще е:

G3 = <X на [0, y2] > = (y1* – y2) – 2(y2# – y1*)

G3 = y2 – y2# – (y2# – y1)

33

Събирайки значенията на G по тегло, ще получим:

34

Решението за [0, 1] игра #11 (пример 17.3 с разрешен чек/рейз, в пота остават два залога) ще съвпадне с решението за игра без фолдове. Можем да докажем, че играчът Х е безразличен към чек/рейза и бет/кола в областта [0, y2], тогава цената на играта от примера 17.3 ще се пресмята по същата формула, както и в игра #10 (но с други стойности за у1 и у2). В резултат ще получим още по-малко очакване за играча У.

Може би тук трябва да спрем, тъй като процесът за определяне на цената на игрите вече би трябвало да е съвсем рутинна работа за вас, а методите, които описахме горе, ще ви помогнат да намерите очакване за всяка друга [0, 1] игра.

На какво са ни научили игрите [0, 1]

А сега да оставим сухите цифри и да осмислим получените резултати. Долната графика отразява някои зависимости между разгледаните горе игри:

35

Вероятно, сте забелязали, че някои от игрите са частен случай от по-сложния си аналог. Така, например, игра 1 не е нищо друго, освен частен случай от игра 2. И наистина, ако в последната ще направим пота безкрайно голям, ще получим условия, стратегия, както и цена (равна на нула), които важат за игра 1. Подобна зависимост се наблюдава между всичките игри без фолдове и съответните им аналози при ограничен размер на пота.

Освен това, можем да получим някои нови игри, просто като добавим стратегическите алтернативи към старите. Например, игра 7 е идентична на игра 5, обаче в нея играчът Х получава възможността да направи чек/рейз. И ако сравним очакванията на играчите във всеки от тези случаи, ние отново ще се убедим в аксиомата, която разгледахме в началото на този раздел от книгата:

Стратегическите алтернативи имат неотрицателна стойност.

Да вземем, например, игрите на половин улица 1 и 2. В последната позволихме на играча Х да фолдне при залог от опонента, като по този начин му дадохме нов стратегически избор. Това веднага се отрази върху цената (тоест върху очакването на играча У) – тя се намали. Същото можехме да наблюдаваме и при следните двойки:

Игра 1 и игра 4, където играчът Х получи възможността да направи залог

Игра 4 и игра 5, където играчът У получи възможността да направи рейз

Игра 5 и игра 6, където играчът Х получи възможността да направи ри-рейз

Игра 5 и игра 7, където играчът Х получи възможността да направи чек/рейз

Във всичките тези случаи, играчът, който е получил новата стратегическа възможност, е увеличавал очакваната си печалба.

Втората интересна зависимост се проявява в коефициента R в [0, 1] игри. В реалния покер стойността му ще се променя поради влиянието на блокъри, игра на няколко улици и т.н. Обаче, идеята за това, че трябва да рейзвате на ривъра с около 41% от диапазона за залог на опонента, ще ви послужи не веднъж.

Да разгледаме следната игра. Нека вашият приятел ви е предложил да играете някаква разновидност на Холдем, където всеки играч получава по две карти, след това се раздават и трите улици и на последната от тях може да се залага. Играчът У може или да заложи, или да стигне до шоудауна, а играчът Х, на своя ред, може да чек/рейзне, при това броят на рейзовете в последния случай не е ограничен. Тогава оптималната стратегия за тази игра ще изглежда приблизително така: единият играч ще залага с R от неговите ръце, опонентът му ще рейзва с R2 ръце, срещу което ще получи ри-рейз с R3 и така нататък. Да предположим, че на масата са J 9♣ 8♠ 3 2♣. Всеки от участниците може да има една от 1081 ръце.

36

37

Обаче, за да намерим наистина оптимална стратегия за тази игра, би трябвало да отчетем всичките блокъри, неравномерно разпределените ръце и т.н. И, разбира се, ние никога няма да се откажем от рейзове с нътс.

От друга страна, намерените от нас приблизителни прагове ни казват следното: първият залог можем да направим с всеки трети чифт и по-добро, вторият – с QJ и по-добро, третият – с най-добри два чифта, четвъртия – с втори нътс, петият – само с нътс.

Можем ли да използваме тези резултати в реалния покер? Не съвсем, тъй като действията на предишните улици и произлизащите от тях диапазони променят разпределението на ръцете на ривъра. Но правилото за 41% (ако вашият опонент не може да фолдне – например, потът вече е прекалено голям) е достатъчно приемлив ориентир. В игрите, където опонентите имат възможността да фолдват картите си, ще се наложи да коригираме тази стойност до 35% или нещо такова (тъй като ще получаваме рейзове от нътс, но фолд – от най-слабите комбинации).

Заслужава си да се отбележи, че този пример не само ни показва как можем да използваме коефициента r на масата за покер, но и докосва, вероятно, най-главният урок от игрите [0, 1]. През цялото време разделяхме диапазоните на участниците в играта на различни зони с чисти стратегии, където в праговите точки наблюдавахме безразличие към избора на конкретно действие.

В нашите пресмятания на цената на играта предполагахме, че стратегията на играча У няма да се променя. При това, както се оказа, в повечето стойностни области играчът Х беше безразличен към избора на линията за игра. С други думи, дори ако играчът У играе с оптимална стратегия, опонентът му може да играе със стратегия, която донякъде се отличава от оптималната (при това без да губи каквото и да е). Ние наричаме такива стратегии гъвкави.

В същото време, ако играчът Х следва оптимална стратегия, тогава играчът У няма право да прави грешки – дори ако той реши да не залага с ръце, които са малко по-добри от у1, той веднага ще загуби в очакването. Такива стратегии ще наричаме строги.

По правило, стратегиите на играча Х в игрите [0, 1] ще са гъвкави, тъй като дори, ако той забрави да заложи с ръце, които са малко по-добри от прага му за залог, играчът У често пъти ще заложи сам (при това с широк диапазон). Очевидно е, че ако играчът У направи същата грешка (т.е. забрави да заложи), никой няма да може да вложи парите в пота вместо него.

Ако сте на мястото на играча, чиято стратегия трябва да бъде строга (което често се случва при всички участващи в раздаването в реалния покер), тогава, за да играете оптимално, ще ви се наложи да подходите много сериозно към избора на диапазони за всяка линия. Например, на ривъра няма да е лошо да се определите с границите на всяка от областите, да помислите за това, какво се каните да правите, ако ви рейзнат, и също така, колко залога искате да направите в пота със силните си ръце.

Освен това, строгите стратегии предполагат, че често пъти ние няма да играем със смесени стратегии с отделни ръце – това ще се случва само на прагове, които разделят областите с чиста стратегия. Обаче, по правило, ще играем близки по сила ръце по подобен начин.

Също така, заслужава си да се отбележи, че в стратегии за игри [0, 1] с ограничен размер на пота, някои прагове съществуват изключително за да балансират диапазона.

Например, на всеки валю-бет трябва да съответства определено количество блъфове, както и ръце, с които ще колваме или фолдваме в отговор на рейз. Тази логика неведнъж ще ви помогне на масата за покер. Започнете от определянето на своя диапазон за стойностни залози. След това си помислете, какъв би трябвало да бъде диапазонът ви за блъф в тази ситуация. Колко често трябва да блъфирате? Доколко е оптимално съотношението на вашите блъфове и стойностни залози? Ами, ако рейзвате, блъфирате ли някога? С какви ръце? Подобна верига от разсъждения ще ви позволи да формирате балансирана стратегия, която трудно може да бъде експлоатирана.

В заключение на тази глава ще разгледаме последната игра [0, 1], която открива интересна особеност на Хай-Лоу-игрите.

Пример 18.1 – игра [0, 1] x [0, 1]

В този вариант на игрите [0, 1] всеки участник получава две случайни числа (абсолютно несвързани помежду си) от равномерно разпределен диапазон от 0 до 1. Първото число означава „Хай“-ръка, второто – „Лоу“. Правилата на тази игра като цяло повтарят същите за обичайните игри [0, 1]: най-силните са ръцете, които са близки до нулата, при това най-добрата „Хай“ ръка печели само половината пот, а най-добрата „Лоу“ ръка – другата половина.

Ще означим ръката на всеки играч като (х, у), където х и у се намират в интервала от 0 до 1.

В тази игра нито един от участниците не може да фолдне своите „карти“, не е позволено да се прави чек/рейз, обаче играчът Х може да заложи, а неговият опонент може да отговори с рейз. И тъй като това е игра без фолдове, размерът на пота няма никакво значение.

Интересното е, че по-голямата част от залозите в тази игра ще са полублъфове – в тази глава все още не сме говорили за тях. Тези залози се правят с надеждата да се спечели половината пот в случай на кол и са много популярни в Хай-Лоу игрите (срещат се и в Холдема, например, бет с висока карта асо на борд с два чифта – тук в случай на кол от друго асо, печелим точно половината от пота).

Един от начините за анализ на такава игра е графично изображение на всичките възможни комбинации от х и у. При това, вместо единичните прагове ще разглеждаме гранични линии, които включват диапазон от ръце за някакво действие. Ще въведем следната параметризация: нека съществуват три криви, х1, у1 и у2 (по аналогия с игра #5 [0, 1]); ще казваме, че ръката се намира „под“ кривата, ако тя е по-близка до (0, 0) и „над“ кривата – ако тя е близка до (1, 1). Кривите се намират в следното съотношение:

38

За всяка от тези криви ще има собствено уравнение за безразличие, обаче получаването им е малко по-сложно. Така, ще започнем с определянето на стратегията на играча Х, след това съобразно нея ще намерим стратегия на играча У и накрая ще се опитаме да докажем (чрез промяна на отделни части от стратегия), че стратегията на играча Х наистина е оптимална.

Да предположим, че кривата х1 се определя от уравнение у = 1 – х. Тук използваме аналогия с игра [0, 1] без фолдове, където прагът х1 беше равен на ½.

Забележка: Линия, зададена от това уравнение, разделя цялата област за определяне на играта (тоест областта от възможните ръце) на две равни части.

А сега да разгледаме границата у2. Играчът У трябва да е безразличен към кола (с ръце над у2) и рейза (под у2). Следващата стъпка е определяне на области, в които единият от играчите има положително очакване. Очевидно е, че в повечето случаи потът ще бъде разделен и очакването на всеки от участниците ще е равно на нула. За всяка точка (х, у) от кривата у2:

Когато ръката на играча Х се намира в областта, зададена от точки {(0, 0), (0, у), (х, 0), (х, у)}, играчът У ще губи един залог, колвайки, но те ще са два, ако направи рейз. Това е единствената област, където играчът Х печели срещу опонента си. На своя ред, играчът У ще печели пота срещу опонента в областта, ограничена от следните точки: {(х, 1 – х), (1 – у, у), (х, у)}.

39

Фиг. 18.7 Графично представяне на стратегиите за играта [0, 1] x [0, 1]

Ще приравним лицата на тези две области и получаваме:

Забележка: Отляво се намира лице на правоъгълник, отдясно – лицето на правоъгълния триъгълник

40

Запознатите с алгебра читатели естествено ще забележат, че получихме формулата за кръг с радиус 1 и център в (1, 1). По този начин, кривата у2 е равна на една четвърт от този кръг.

Да се върнем към у1 и да разгледаме безразличието на играча У към чека и бета. Той ще спечели един залог, ако заложи срещу ръката на играча Х, която се намира в областта, ограничена от {(1, 1), (1, у), (х, 1), (х, у)} и ще загуби един залог, ако ръката на неговия опонент попада в триъгълника {(х, у), (х, 1- х), (у, 1- у)}.

Отново приравняваме лицата на двете области:

41

Получихме уравнение за кръг с радиус 1 и център в (0, 0). Графиката на стратегиите и на двамата играчи наподобява топката за ръгби, с център върху линията у = 1 – х.

42

Тъкмо е време да погледнем кривата х1 и да докажем, че тя наистина се определя от уравнението у = 1 – х. По цялата тази линия играчът Х трябва да е безразличен към чек и бет. При това той ще загуби с един залог по-малко, ако чекне (а не бетне), когато опонентът му е с ръка под у2, защото в този случай той няма да получи рейз. От друга страна, ако той не заложи, тогава ще загуби стойност срещу ръце, които са над у1. А за всички останали ръце от областта между у1 и у2, очакваната печалба ще е равна на нула, тъй като потът ще бъде разделен по равно между двамата играчи.

Както вече знаем, размерът на областите за бет и чек за играча Х трябва да е еднакъв, а линията от точка (0, 1) до точка (1, 0) тъкмо разделя областта на играта на две равни части. Следователно, прагът х1 наистина отговаря на уравнението у = 1 – х.

И така, ако имаме работа с Хай-Лоу игра с два залога без фолдове, без блокъри, без чек/рейз, тогава играчът У трябва да залага с π/4 от своите ръце! Условията на тази игра наистина могат да ви сторят леко измислени. От друга страна, те не претендират да са най-точният модел на Хай-Лоу игри. Обаче, полученият модел все пак има практическо приложение – в някои от игрите, например в Хай-Лоу Стъд, ние понякога попадаме в ситуация, когато не можем да фолднем, тъй като на седмата улица има голяма вероятност опонентът да има само една добра ръка (Хай или Лоу). И в този случай ние трябва да залагаме  доста по-често, отколкото някои са свикнали да мислят.

Трябва да се запомни:

  • Сравняването на математическото очакване в различни игри позволява по-добро оценяване на значимостта на различните идеи и линии.
  • Появата на нова стратегическа възможност у единият от играчи увеличава неговото математическо очакване.
  • Когато се опитваме да оценим очакването от играта, често пъти можем да приемем, че стратегията на единият от играчите остава непроменена, а след това да изберем в стратегията на опонента онези линии, които биха опростили нашите пресмятания.
  • Някои стратегии се наричат строги, защото дори незначителни отклонения от оптималните линии се обръщат в съществени загуби в очакваната печалба. Съществуват, така също, и гъвкави стратегии – те могат да се отклоняват от оптималните линии без ущърб за математическото им очакване.

Advertisements
 
Вашият коментар

Posted by на 04/21/2017 in Theory

 

Етикети: , ,

Вашият коментар

Попълнете полетата по-долу или кликнете върху икона, за да влезете:

WordPress.com лого

You are commenting using your WordPress.com account. Log Out / Промяна )

Twitter picture

You are commenting using your Twitter account. Log Out / Промяна )

Facebook photo

You are commenting using your Facebook account. Log Out / Промяна )

Google+ photo

You are commenting using your Google+ account. Log Out / Промяна )

Connecting to %s

 
%d bloggers like this: