RSS

Да поговорим за математиката

05 Авг
Да поговорим за математиката

The Mathematics of Poker
Bill Chen, Jerod Ankenman

Глава 9: Адаптации и баланс – диапазон срещу диапазон

В предните четири глави предложихме прост алгоритъм за разиграване на отделни ръце срещу статични стратегии. Определяхме диапазона, правехме предположения за възможните линии за игра и въз основа на тези данни след това търсихме стратегия с максимално математическо очакване. Такъв подход позволява да получим максимум стойност с конкретна ръка срещу всеки опонент, който играе със статична стратегия, или се отклонява от нея по предсказуем начин.

Ами, ако опонентът е силен играч? Тогава той също ще се опитва да „чете“ нашите ръце и стратегии, за да използва след това срещу нас намерените в тях слаби места. Това означава, че ние трябва да подхождаме към експлоатацията на този играч много внимателно. Ако го правим по съвсем очевиден начин, няма да му е трудно да адаптира стратегията си и да премине съм насрещна експлоатация.

Представете си, че се оказахме в някаква ситуация, където според нашите данни опонентът блъфира с 10% по-рядко, отколкото би трябвало. Можем да експлоатираме тази слабост, фолдвайки ръцете, които могат да бият само блъфовете, тъй като тук ще губим срещу стойностните залози на опонента повече, отколкото ще печелим от блъфовете му.

Обаче, компетентният ни опонент няма да пропусне тази наша адаптация. Използвайки същият алгоритъм, той ще намери току що появила се уязвимост в нашата стратегия – започнахме прекалено често да фолдваме ръцете си. Така че сега той може да започне да блъфира по-често, отколкото преди. Ние, пък, на своя ред, ще му отговорим с повишаването на честотата на кола и т.н. Стратегията за експлоатация във всяка една от тези ситуации предполага достатъчно радикални промени в нашите тенденции – от „никога не колвам“ до „винаги колвам“. Обаче, такава рязка промяна в стратегията ни прави уязвими за насрещната експлоатация от страната на опонента.

Като алтернатива можем да използваме плавното адаптиране на стратегията – така опонентът няма да разбере веднага, какво се случва, но същевременно ние ще загубим някаква част от очакването, което имаме от експлоатация. Или можем да продължим да играем на адаптации и контр-адаптации, опитвайки се да изпреварим опонента. В този случай, ще печели този играч, който успее правилно да предвиди смяната в стратегията на опонента.

Играем срещу силни дроус

Както вероятно помните, в една от предните глави подробно разгледахме играта с конкретна ръка срещу диапазона на опонента. Обаче, собственият ни диапазон често пъти не е по-малко важен. Когато експлоатираме другите играчи, ние използваме информация, която получаваме от действията им. А сега си представете, че играем срещу опонент, който се опитва да ни експлоатира. Излиза, че той също може да използва всякакви подсказки, които получава от нашите линии за игра. Тоест, срещу такъв играч трябва постоянно да се замисляме, как той ще използва получената информация, и по възможност да минимизираме риска за насрещната експлоатация в нашата стратегия.

Нека да разгледаме доста специфичен тип ръце в No Limit Holdem – силните дроус. По правило, такава ръка включва флъш-дроу и няколко допълнителни дроус (овъркарти, гътшоти, отворени стрейт-дроус), което й осигурява от 12 до 15 чисти аута (около 45% очакван дял на флопа) срещу какъвто и да е топ-чифт.

В главата, където анализирахме играта с отворени карти, показахме, че силните дроус трябва да се стремят да стигнат до ол-ин в ранните рундове за залагане, тъй като с излизането на нови карти очакваният им дял значително спада, а готовите ръце получават възможността да установят цената за виждането на ривъра. Обаче, в случай на ол-ин на флопа, тези дроус са получавали възможността да реализират очаквания си дял.

Хайде да въведем няколко прости правила относно размерите на залога. Ние ще се върнем към тази тема по-нататък, затова сега няма да се съсредоточаваме върху теорията. Първо, не бива да правите залози, които са много по-големи от размера на пота. В противен случай опонентът може просто да изчака за силна ръка, фолдвайки всичките си слаби комбинации, при това дори няколко негови колове ще направят овърбета губещ. Със сигурност сте срещали играчи, които залагат за ол-ин с десетки (а понякога и стотици) големи блайндове с AJ в ранните етапи на турнира. Съвсем е очевидно, че правилният отговор в тази ситуация ще е кол с най-силните ръце. Така, че ще смятаме, че залозите ще са с по-малък размер, но ще са с по-широк диапазон от ръце.

Силните дроус, на пръв поглед, съвсем добре подходят към този „по-широк диапазон“, обаче, нещата не са толкова лесни. С една добра ръка, например, с два чифта или сет, бихме направили залог, получили кол от опонента и с радост бихме продължили да залагаме на търна, надявайки се да извлечем още повече стойност. Но, ако държим силно дроу, и на флопа опонентът колва, ние се поставяме в трудна ситуация – именно такава линия е необходима за всяка готова ръка. Затова много често пушът на флопа е най-доброто решение, когато стаковете са къси, а ръката ни е комбо-дроу.

Поставете се на мястото на опонента – обикновено, стратегията му срещу овърбет ще е кол с най-силните ръце. Но, дори ако той колва само със сетове, стрейтове и т.н., дроу все още има като минимум 30% очакван дял и това създава определени проблеми. Например, влизаме ол-ин за $300 в текущ пот от $100; нашият очакван дял срещу диапазона за кол е 33%. Дори ако опонентът ще ни колва с 25% от неговите ръце, пушът пак ще е печеливш. Така, в 75% от случаите ние ще вземем $100 от пота, а в останалите случаи ще губим по-малко от $67. От друга страна, опонентът ни може да започне да колва с обикновени чифтове и тук трябва да се върнем към определението за силни дроус. Например, срещу чифтовете нътс флъш-дроу има много добър очакван дял, тъй като и асото е аут за нас; а стрейт-флъш-дроу понякога изобщо е напред. Колкото по-често опонентът ще колва, толкова по-голямо екуити ще има дроу. Така че ол-ин за нас ще е печеливш, стига опонентът да фолдва някаква част от ръцете си (каква точно част ще зависи от ситуацията).

Излиза, че при съотношението на стака към пота около 3:1, ние трябва да влизаме ол-ин със силните си дроус и да залагаме малко с готовите ръце и слабите полублъфове. Но тази стратегия е доста лесна за експлоатиране – нашият опонент може да започне да колва с всички ръце, които могат да бият дроус, при това знаейки, че когато направим неголям залог, почти никога няма да имаме силно дроу.

Обаче, ако опонентът колва ол-ина с достатъчно слаби ръце, разчитайки на очаквания си дял срещу дроу, ние можем да включим в диапазона си за пуш и силните готови ръце (например, сетове и два чифта). Тогава ще му се наложи да избира. Или той ще колва и ще плаща всичките ни нътс, но и ще взима някаква стойност от силните дроус, или той ще фолдва картите си, губейки при това значителният дял в пота срещу неготови ръце. И макар че нашият опонент може да се опита да се адаптира, на пръв поглед няма очевиден начин за експлоатиране на такава стратегия.

Тук трябва да обърнем внимание върху две теми. Първо, когато разглеждаме ситуации от вида „диапазон срещу диапазон“, особено значение придобива скриването на информация. Когато сме играли ръцете с различна сила по различен начин, бяхме лесни за експлоатация, тъй като опонентът лесно можеше да ни разчете.

Действително силни стратегии предполагат разиграването на много ръце по един и същ начин – така няма да позволим на другите играчи точно да определят нашия диапазон. Така, в примера със силно дроу за опонента ще е сложно да измисли стратегия за експлоатация срещу пуш на флопа с диапазон, който се състои от дроу и силни ръце.

Важността на скриването на информацията може да се обясни и по друг начин. Помислете си, коя ситуацията ще е най-добра за експлоатация на опонента? Когато имаме работа с тесен диапазон и очевидна стратегия. Обаче, срещу опонент, който играе голямо количество ръце по един и същ начин, едва ли скоро ще намерим стратегия за експлоатация – диапазонът му ще бъде много размит и неопределен.

Колкото до втората тема, представете си, че във вашия диапазон има две ръце с равни разпределения, А и В, при това можете да избирате линия за отиграване с всяка от тях (Х или У). Решихме, че заради скриването на информацията искаме да играем с А и В еднакво. За ръката А малко по-добра е стратегия Х, а за ръката В стратегията У е много по-добра от Х. Тогава при други равни условия ние трябва да играем и двете ръце по стратегия У. До същия извод стигнахме и в горния пример, когато се запитахме за линията със силни готови ръце. Съвсем очевидно е, че във вакуум с нътс трябва да правим малки залози. Обаче, пушът с тези ръце на флопа (наред с дроу) е от полза за целия диапазон – в резултат опонентът ще загуби възможността да експлоатира нашата стратегия. Още един пример за тази идея е дилемата с префлоп разиграването на АК и АА. Много често АК ще са фаворит в един префлоп ол-ин (особено в късните етапи на турнира). Обаче, ако нещата стигнат до постфлоп и ние вложим в пота, да речем, 1/3 от стака, ситуацията няма да е от-най-приятните. От друга страна, АА се играят добре във всяка ситуация. Така че, ако искаме да играем АК и АА по един и същ начин, тогава правилното решение преди флопа ще е ол-ин ( и за двете ръце).

Насрещната експлоатацията често подразбира наличие на достоверни факти за стратегията на опонента. Същевременно, непосредствено на масата ние винаги ще имаме само непълна информация. Така че се налага да намерим златната среда между експлоатацията на конкретните слабости на опонента и извличането на максималната стойност от широкия диапазон от възможни стратегии, когато не знаем за недостатъците им или нямаме надеждна информация, за да оправдаем чистата експлоатационна стратегия.

В третата част ще се концентрираме върху анализа на спомагателните игри и търсенето на оптимални стратегии – с тях ще можем да максимизираме очакването си срещу стратегии с максимална експлоатация. Обаче, не е задължително изцяло да решим някаква игра, за да формулираме така наречената балансирана стратегия.

Баланс

Този термин, за разлика от онези, които използваме в книгата, изобщо не е свързан с теорията на игрите. Обаче, за да му дадем определение, трябва да въведем още едно понятие.

Цената на стратегия е очакване за дадена стратегия в случай, когато тя е изправена срещу стратегия за максимална експлоатация. Тогава, стратегията може да се нарече балансирана, ако цената й се доближава до математическото й очакване срещу оптималната стратегия. Фактически, балансът показва доколко разглежданата стратегия се поддава на експлоатация (доколко тя е „експлоатируема“ – няма такъв термин).

Да разгледаме пример. Представете си игра, където на ривъра играчът А има или въздух, или завършено флъш-дроу (при това, дроу е скрито). Играчът В държи два чифта. Играчът А ще залага с всичките си флъшове, както и с блъфовете си. Смятаме, че играчът А ще уцелва флъша си в 20% от случите, размерът на пота е 3 залога.

Да разгледаме няколко възможни стратегии за играча А и да намерим очакването от стратегията за максимална експлоатация (СМЕ) срещу тях за играча В.

Тук СМЕ за играча В предполага фолд с целия диапазон, ако играчът А блъфира по-рядко от 5%. В този случай, неговата екс-шоудаун стойност ще е „3х“, където „х“ е честотата на блъфа:

<В, фолд> = -3х

Ако играчът А блъфира по-често от 5%, тогава играчът В трябва да започне винаги да колва на ривъра:

<В, кол> = х – 0,2

Забележка: Това е първото използване на концепцията за екс-шоудаун стойност в книгата, затова то изисква подробно обяснение, още повече, че условията на задачата са непълни. И така, потът се състои от 3 единици, при това авторите са забравили да посочат размера на залога, който е 1 единица.

Оптималната честота на блъфа за играча А предполага, че неговият опонент ще е безразличен към кол или фолд, тоест математическото очакване от тези действия за него ще е еднакво. Тогава:

<В, фолд> = <В, кол>

0 = 0,2*(-1) + х*4

х = 5%

Тази формула трябва да се чете така: в 20% от случаите ние губим от флъша 1 залог, а в „х“% от случаите ние печелим 3 залога от пота на ривъра + един залог от блъфа.

Колкото до уравнението <В, кол>, то тук е важно да се разбере, че говорим за екс-шоудаун, тоест само за залозите, които ще бъдат направени на ривъра. Така че „х – 0,2“ ще се получи по следния начин:

<В, кол> = 0,2*(-1) + х*1

Тоест, в 20% от случите ние ще загубим един залог, а в „х%“ от случите (когато опонентът блъфира) ще спечелим един залог. Потът тук не се отчита – ние говорим само за залозите (това ще бъде обяснено в следващата глава).

Колкото до уравнението <В, фолд>, то тук трябва да се обърнем към определението за екс-шоудаун стойност в Глава 8. Когато фолдваме ръката в примера със слабо дроу, ние губим дяла си от пота, който е равен на (екуити*размер на пота преди залога). Ако играчът А има флъш, тогава играчът В нищо не „губи“ (неговото екуити срещу флъш е 0%). Ако играчът А държи блъф, тогава, фолдвайки ръката си, играчът В губи целия пот (тъй като неговото екуити срещу блъф е 100%).

Тогава очакването за фолда от гледната точка на екс-шоудаун фактически означава, колко средно играчът В ще „губи“, фолдвайки най-добрата ръка:

<В, фолд> = -100%*3*х

<В, фолд> = – 3х

Math-3.png

Тук, оптимална стратегия за играча А ще бъде блъф с 5% от ръцете си. Обаче, както можете да видите, математическото очакване на неговия опонент не се променя значително около тази точка. При това, за да подобри своята екс-шоудаун стойност при „х“ равно на 4.8% и 5.2%, играчът В трябва всеки път да отгатва стратегията на опонента си, тоест стриктно да следва СМЕ (или винаги да колва, или винаги да фолдва).

В тази игра има само една стратегическа променлива, така че степента на баланса в стратегията е в пряка зависимост от близостта на „х“ до оптималната стойност. Но в реалността в нашия диапазон никога няма да има само два типа ръце, следователно, променливите ще са повече. Например, можем да залагаме с 30% от нашия диапазон за стойност и да го балансираме с 10% блъфове, а оптималната стратегия може да е 50% стойностни залози и 17% блъфове. В този случай, макар че нашата стратегия губи от гледната точка на очакването, тя все едно остава балансирана и почти не може да бъде експлоатирана.

В покера практически е невъзможно да се изведат оптимални стратегии (заради сложността в изчисленията и т.н.). Обаче, ние можем да конструираме балансирани стратегии, които трудно могат да бъдат експлоатирани. Те могат да се прилагат в ситуации, където нямаме достатъчно информация, за да експлоатираме опонента. При това, няма да губим много стойност в сравнение с чистата стратегия за експлоатация. Освен това, балансираната стратегия няма да позволи на опонента да ни експлоатира – най-добрият му отговор в такава ситуация ще е игра със собствена балансирана стратегия. Но, ако се опита да се отклони от нея, тогава често пъти той ще губи някаква част от математическото си очакване.

Трябва да се запомни

  • Стратегиите за максимална експлоатация често подразбират резки промени в действията ни и линиите за игра. Някои играчи задължително ще го забележат и ще се опитат да ги използват срещу нас. Затова, формулирайки стратегията си, ние винаги трябва да мислим за възможната насрещна експлоатация от страната на нашите опоненти.
  • Съществуват така наречените оптимални стратегии. Те невинаги имат най-голямото математическо очакване (тоест не винаги извличат максималната стойност от опонентите), обаче, те не могат да бъдат експлоатирани.
  • Скриването на информацията е важен принцип за построяването на стратегиите, който позволява на опонентите ни да ни експлоатира в най-очевидните ситуации.
  • „Балансът“ описва степента за експлоатируемост на една стратегия. Стратегии, които лесно могат да бъдат експлоатирани, са небалансирани, и обратно, стратегии, които са трудни за експлоатация, са балансирани. При това „балансиран“ не винаги означава „печеливш“.
  • Оптималните стратегии са идеално балансирани.

Advertisements
 
Вашият коментар

Posted by на 08/05/2016 in Theory

 

Етикети: , , ,

Вашият коментар

Попълнете полетата по-долу или кликнете върху икона, за да влезете:

WordPress.com лого

You are commenting using your WordPress.com account. Log Out /  Промяна )

Google+ photo

You are commenting using your Google+ account. Log Out /  Промяна )

Twitter picture

You are commenting using your Twitter account. Log Out /  Промяна )

Facebook photo

You are commenting using your Facebook account. Log Out /  Промяна )

w

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.

 
%d bloggers like this: