RSS

Да поговорим за математиката

07 Май
Да поговорим за математиката

Mathematics of Poker
Bill Chen, Jerrod Ankenman - Част 1, глава 3

Глава 3: Как да използваме информацията: оценка на параметри и теорема на Бейс

В предната глава сме описали някои статистически свойства на разпределения на вероятностите, както и изучихме връзката между извадките и нормалния закон на разпределението. Обаче, ние направихме много важно предположение – предположихме, че знаем всичките основни параметри на генералната съвкупност, от която и да е взета извадката. В реалността това ще се случва доста рядко. Дори за толкова елементарно събитие, като хвърляне на монетата, „реалните“ разпределения ще имат превес в едната посока. А всякакво зарче ще има дребни дефекти, които са предпоставки за по-вероятно падане на някакви определени числа. Но тези фактори, по правило, имат незначително влияние, затова използването на „идеалната“ монета в нашите пресмятания с шансове 50/50 в повечето случаи е съвсем уместно. Аналогично, ще предполагаме, че тестето с карти, което се използва за покера, няма дефекти и е разбъркано по случаен начин и ние никога не знаем, коя карта ще е следващата, докато тя не легне на масата.

При разпределения, които се свеждат до „идеални“ ние лесно можем да заобиколим законите на „реалния“ свят без да имаме сериозни загуби в точността на изчисленията (монета, зар и т.н.). Обаче, при някои разпределения възникват сложности от съвсем друг вид. Когато анализираме резултатите си в покера, както вече казахме по-рано, често ще ни интересува разпределението на печалбите и загубите по всички ръце. При игра в казино, естествено, ще ни е трудно да си отбелязваме резултати от всяка ръка, което, освен това, може и да привлече ненужно внимание към нас. В онлайн играта нещата са по-лесни благодарение на достъпни програми, които следят нашите сесии. Но дори и при наличие на тези данни, ние ще разполагаме с една доста скромна извадка. Когато става дума за ръцете в покера, разпределението на вероятностите в генералната съвкупност практически е невъзможно за оценяване, освен ако не сте щастлив притежател на наистина гигантски обем с данни.

Частично, можем заобиколим този проблем, използвайки методите, за които говорихме в предната глава. Да предположим, че разполагаме с математическото очакване и дисперсията за една извадка с резултати от изиграни ръце. Сега можем да съставим разпределение в извадката и да предскажем крайния резултат на различни дистанции. Обаче, важно е да разбираме, че няма да можем да намерим точното количество пари, което ще спечелим или загубим в бъдещите раздавания –ще можем да намерим само диапазон от очаквани резултати.

Основният проблем, пред който се изправяме сега, е определянето на средната стойност и дисперсията за генералната съвкупност въз основа на средната стойност и дисперсията в отделна извадка. Ще разгледаме два подхода към решаването на тази задача. В първия случай ще се обърнем към класическата статистика, а във втория – към темата на тази глава, теоремата на Бейс. При използването на статистическия метод ще смятаме, че нямаме никаква информация освен извадката, която ни казва за вероятността за някакъв определен уинрейт. Вторият метод подразбира, че съществува някакво разпределение на уинрейтове извън нашата извадка, което може да бъде използвано за оценката на средната стойност или дисперсията на генералната съвкупност.

Оценяваме параметри: класическа статистика

Представете си, че пред нас е човек, който е изиграл 16900 ръце в Limit покер. Ще представим неговият резултат в ВВ за 100 ръце, за да намалим разликата между ръцете, играни на различни лимити. Получаваме уинрейт Формула със стандартно отклонение s = 2.1 ВВ за ръка. Тук, вместо m и s, които означават параметри на генералната съвкупност, ще използваме Формула1 тъй като засега анализираме само извадката. Да предположим, че този играч ще продължи да играе същите игри със същите опоненти. Как можем да определим „истинският“ му уинрейт m? В тази глава ще смятаме, че не разполагаме с никаква допълнителна информация за вероятността на различните уинрейтове. Така че всичките уинрейтове са еднакво възможни.

За начало трябва да отбележим, че работим само с отделна извадка, затова реалната стойност на уинрейта на играча няма да е точна. Обаче, вече знаем, че според Централната Гранична Теорема извадковото разпределение от 16900 ръце в Limit покер ще се доближава до нормалното. Известното ни стандартно отклонение s = 2.1 ВВ на ръка не е лоша оценка на отклонението за генералната съвкупност, защото извадката ни е доста съществена. Можем да използваме тази информация, за да пресметнем най-вероятната стойност на математическото очакване за генералната съвкупност.

Представете си всичките възможни уинрейтове. За всеки от тях ще съществува отделна извадка, нормална крива с очакване m и стандартно отклонение sN. Пикът на всяка от кривите ще е в точката х = m, докато станалите точки ще са по-надолу. А сега за момент си представете, че това m е средната стойност за генералната съвкупност. По най-високата точка от кривата в точката Формула2 можем да определим вероятността резултатът на дистанция, разглеждана в извадката, да е равен точно на нейното очакване. Можем да намерим тази вероятност за всякакви възможни стойности на m. Тъй като всичките, разглеждани от нас нормални криви ще имат еднакво отклонение sN, те ще имат идентична форма, но ще бъдат изместени по оста Х в зависимост средната им стойност.

Фигура 3:1: Криви на нормално разпределение за извадки с различно математическо очакване (всичките маркери са на ниво 1.15)

Забележка: Тук се разглеждат няколко криви при зададено математическо очакване. Стойността 1.15 върху кривите, където пикът не е в точката х = 1.15, се оказва по-надолу – това означава, че тук (на тези криви) тя е по-малко вероятна, което и се вижда от фигурата.

И така, тъй като пикът на кривата се пада на наличната стойност Формула3 е най-вероятната стойност на цялата крива, при m = Х това означава, че Х= 1.15 ВВ/100 е най-вероятната стойност за математическото очакване. Това може да ви се стори очевидно, но когато ще разглеждаме тази задача от позицията на теоремата на Бейс, ще покажем, че най-вероятната стойност невинаги е равна на математическото очакване на извадката, ако включим в пресмятанията ни и допълнителна информация.

Сега вече знаем най-вероятната стойност на уинрейта – въз основа на нашата извадка тя е равна на математическото очакване. И макар че, това е доста полезна информация, ние все още не сме решили проблема с неопределеността на резултата. На нашия играч може да му е провървяло или той може да е претърпял поредица от загуби. Нека да пресметнем стандартното отклонение за цялата извадка, а след това да анализираме получените стойности и да разгледаме вероятните уинрейтове.

Имаме извадка „N“ от 16900 ръце от някоя генерална съвкупност с уинрейт (средна стойност) от 1.15 ВВ/100 и стандартно отклонение от 2.1 ВВ/ръка.

Използвайки формулата 2.4, получаваме:

Формула4

sN/100 = 273/169 ~ 1.61

Полученото отклонение за 100 ръце за такава извадка се оказа по-голямо от самия уинрейт. Представете си, че знаем параметрите на генералната съвкупност и те са точно толкова, колкото сме получили току що за тази извадка. Ако бяхме взели още една извадка от 16900 ръце, тогава в 32% от случаите резултатът на тази дистанция би бил по-малък от -0.46 ВВ/100 или повече от 2.76 ВВ/100.

Забележка: Защо имено 32% от случаите? Тук трябва да си припомним правилото на „сигмите“, за което се говореше в предната глава – около в 68% от случаите стойността на нормално разпределена случайна величина попада в рамките на едно стандартно отклонение спрямо математическото очакване. Границите на получения интервал са точките, където от математическото очакване изваждаме една „сигма“ или прибавяме една „сигма“. Съответно, в 68% от случите нашият уинрейт ще е в този интервал, а в останалите 32% – извън границите му.

Неприятен отговор, нали? Как можем да сме уверени в това, че нашата извадка наистина ни дава добра представа за средната стойност в генералната съвкупност, когато резултатът от още една такава извадка се оказва извън границите на и без това огромен интервал (от -0.46 до 2.76) почти в 32% от случаите? Ами ако реалната стойност на математическото очакване за генералната съвкупност е равна на 0? Тогава уинрейтът от 1.15 ще попадне именно в интервал от една сигма спрямо очакването. Нещо повече, по всяка вероятност, при такава извадка ние наистина не можем да кажем, кой от уинрейтове е най-вероятен – 0 или 1.15 ВВ/100.

За да уравновесим тази неопределеност, ние можем да пресметнем доверителния интервал. За да го направим трябва да определим нивото на значимост. Тъй като имаме работа със статистика, ние не можем просто да кажем, че вероятността на някой определен уинрейт за генералната съвкупност е равна на нула – винаги има възможност за голям късмет или липса на късмет. Но можем да изберем така нареченото ниво на значимост (или степен на надеждност). Фактически, това е вероятностна стойност, която описва допустимата грешка. Изведеният от тук доверителен интервал ще е отговор на наш въпрос: „Какви стойности може да взима математическото очакване в генералната съвкупност при условие, че извадковата стойност на МО ще е в границите на избраното ниво на значимостта?“

Да речем, че за нашия играч сме избрали нивото на значимостта от 95%. Сега можем да построим доверителния интервал. Да означим средната стойност на генералната съвкупност чрез m, тогава математическото очакване на извадката ще попада в интервал от (m – 2s) до (m + 2s) в 95% от случаите. Сега можем да намерим границите на зададения интервал:

Както вече показахме горе, стандартното отклонение за 16900 ръце ще е 1.61 ВВ/100. Да решим двете неравенства, които ще определят границите на доверителния интервал за математическото очакване:

(m – 2s) < 1.15; (m – 2*1.61) < 1.15; m < 4,37;

(m + 2s) > 1.15; (m + 2*1.61)> 1.15; m > – 2,07;

По този начин, 95%-вия доверителен интервал за уинрейта на този играч (въз основа на нашата извадка от 16900 ръце) ще изглежда по следния начин: [-2.07 BB/100; 4.37 BB/100].

Това не означава, че реалния уинрейт с вероятност от 95% ще е във вътрешността на този интервал. В същност, това е едно от най-разпространени заблуждения по отношение на доверителните интервали. В действителност, доверителният интервал просто ни казва, че, ако получените стойности на уинрейта (от -2.07 до 4.37) биха били истински за генералната съвкупност, тогава наблюдаваният от нас уинрейт в отделната ни извадка би се оказал един от 95% от наблюдаваните резултати. Класическата статистика не прави вероятностни оценки на стойностите на параметри – напротив, от класическата гледна точка реалният уинрейт или ще се намира в рамките на пресметнатия интервал, или няма да е там (тъй като той не е резултат от случайно събитие). Никаква извадка не може да ни даде увереност в точната оценка на параметъра. Ние можем само да правим предположения за вероятността (или невероятността) на това, че ние бихме могли да получим стойността на този параметър като в извадката, ако истинската стойност за цялата съвкупност би била равна на някаква точка от доверителния интервал.

Най-вероятната стойност и доверителния интервал са полезни инструменти, които ни помагат да разбираме по-добре, каква информация можем да извлечем от предоставената извадка. В гореописания случай макар че уинрейта от 1.15 ВВ/100 може и да изглежда адекватно, но да смятаме, че той е близък до истинския уинрейт би било повече от грешка. Доверителният интервал може да ни даде представата за широчината на вероятностните стойности на уинрейта за генералната съвкупност. В краен случай, за най-добрата оценка на уинрейта на този играч може да се смята получената от нас най-вероятната стойност, която е равна на математическото очакване на извадката (1.15 ВВ/100).

До този момент предполагахме, че нямаме никакви допълнителни данни за вероятностите на различните уинрейтове – нашата извадка беше единственият източник на информация за предполагаемата стойност на математическото очакване за генералната съвкупност. Но в реалността някои уинрейтове ще се окажат по-вероятни и такова предположение може да се направи дори преди началото на анализа на наличните данни. Представете си, че сте изиграли 5000 ръце в казино и сте спечелили 500 ВВ; вашият уинрейт е 10 ВВ/100 ръце.

Обаче, това не е цялата информация, която имаме. Събрахме достатъчно голям обем данни (от думите на играчите и от базите с данни за изиграните ръце), който казва, че за хората, които са играли на достатъчно дълга дистанция, най-високият уинрейт е около 3-4 ВВ/100. Дори онези изключения, които печелят повече, нямат начин дори да се доближат до 10 ВВ/100. Тъй като получихме тази информация дълго преди началото на анализа, можем да я смятаме за независима от по-нататъшни изчисления.

И наистина, ако вземем някакъв играч от световната общност любители на покера, тогава за неговия уинрейт вече ще съществува някакво разпределение на вероятностите. Разбира се, ние нямаме никаква представа за формата и параметрите на това разпределение, защото просто нямаме данни за всичките играчи. Обаче, ако можем да правим адекватни предположения за генералната съвкупност на уинрейтове, съществуваща априори, ще ни е по-лесно да правим точната оценка на търсените параметри, тъй като ще използваме данните и от двата източника.

Теорема на Бейс

В глава 2 сме формулирали базовото свойство на вероятността (формулата 1.5):

Това уравнение ни позволява да пресметнем вероятността на едновременно настъпване на събития А и В, ако знаем вероятността за събитието А, както и вероятността за събитието В (при условие, че събитието А вече се е случило). Обаче, в покера много по-често ние сме заинтересувани да знаем втората част от тази формула – например, знаем, какви карти са ни раздадени (А), и сега искаме да знаем, как тази информация ще влияе върху възможните ръце на нашия опонент (В).

Тоест, ние трябва да намерим вероятността за събитие В при условие, че събитието А вече се е случило.

Можем да променим формулата 1.5, за да пресметнем търсената вероятност. Това уравнение се нарича Теоремата на Бейс:

В първата глава означихме събитие, обратно на В, като:

Също така, имаме и формулата 1.5:

Тъй като знаем, че сборът на В и В е 1, тогава р(А) може да се изрази като вероятност на А при условие, че събитието В вече се е случило, плюс вероятност на А при условие, че събитието В вече се е случило. Да го запишем в нов вид:

В покера теоремата на Бейс ни позволява да уточним нашата оценка на вероятността за някакво събитие въз основа на получената информация. Силните играчи постоянно използват теоремата на Бейс при научаване на нови факти – прилагането на тази концепция е заложено в основата на четенето на ръце и експлоатацията на опоненти, както това ще бъде показано по-късно.

Класическият пример за теоремата на Бейс може да се вземе от медицината.

Да предположим, че ни е предписано изследване, за да се открие някаква определена болест. Ако сме болни, тогава това заболяване ще бъде открито с вероятност от 80%. Ако сме здрави, то в 10% от случаите според резултатите от изследването грешно ще ни съобщят, че сме болни. Също така, на нас ни е известно, че средно 5% от население страдат от тази болест. Ние сме избрани случайно от целия брой хора и са ни пратили на изследвания. Идва положителният резултат – ние сме болни. Каква е вероятността това да е точно така (без да взимаме под внимание възможността за допълнителни изследвания)?

Ако отговорът ви е „около 80%“, тогава вие, както и много други хора, силно се заблуждавате. В действителност, повечето лекари също не знаят правилният отговор, демонстрирайки плашещо незнание на теоремата на Бейс.

Ние можем да използваме тази теорема, за да решим поставената задача.

Да въведем следните означения:

А = положителен резултат от изследване

В = пациентът наистина е болен

Вече знаем вероятността на (А|B) от условия:

p(A|B) = 0,8     (ако сме болни, тогава вероятността болестта да бъде открита е 80%)

р(A|) = 0,1        (в 10% от случаите резултатът от изследването няма да е верен)

р(В) = 0,05       (5% от всичките хора страдат от тази болест)

р(В) = 0,95           (95% от всичките хора са здрави)

Да се обърнем към уравнението 3.2:

Както се вижда, вероятността пациентът с положителен резултат от изследването да е наистина болен в действителност е много по-малка от 80%. По-просто казано, не можем да се позоваваме само на едно подобно изследване – ще се наложат допълнителни процедури, за да се установи точно, дали болестта я има или не.

Можем да тръгнем и по друг път. Да речем, че има 100 000 пациенти, които са изследвани по същия начин. От 100 000 изследвани наистина са болни 5 000 (5% от хората), 95 000 са здрави (95% от хората).

От 5 000 болни:

4 000 ще имат положителен резултат         (80% от хората със заболяването)

1 000 – ще получат отрицателен резултат     (20% грешни диагнози).

От 95 000 здрави хора:

9 500 ще получат положителен резултат     (10% грешни диагнози)

85 500 ще получат отрицателен резултат     (90% здрави хора).

Въпросът, който поставихме в началото, звучеше така: ако според резултатите от изследването се получи, че сме болни, тогава каква е вероятността наистина да сме болни? От 100 000 пациенти 13 500 са получили положителната диагноза. Но само за 4 000 човека тази диагноза е вярна:

p(B|A) = 4000/13500

p(B|A) = 29,6%

Ако увеличим точността на изследването (чрез намаляване на броя грешни диагнози или увеличаване на честота на правилните диагнози за болните хора), ние можем да повишим условната вероятност на това, че всеки получил положителен резултат човек наистина ще е болен. Забележете, че това по никакъв начин не увеличава количеството болни – такава медицина не ни е нужна! Напротив, усъвършенстваният метод за изследване ще намали броя на хората, които ще получат грешната положителна диагноза. А сега да предположим, че наистина сме подобрили процедурата и сега тя със 100% сигурност открива болните хора, но процентът на грешните диагнози не се е променил:

Ако, пък, оставим нивото за разкриване на болестта да е 80%, но намалим честота на грешните диагнози от 10% на 6%, тогава ще получим:

За прилагането на теоремата на Бейс е необходимо наличие на някаква базова (априорна) вероятност и поява на нова информация. В нашия пример априорната вероятност беше наличието на болестта при 5% от хората. Положителният резултат след изследването беше онази допълнителна информация, която ни позволи да оценим вероятността на търсеното събитие по нов начин. Това се нарича Бейсова логика (вероятност) – значението й за успешния покер играч трудно може да се прецени.

Съществува огромно множество ситуации, в които може да се приложи Бейсовата логика. Много от играчите я използват постоянно, без изобщо да го подозират. Представете си обичаен турнирен епизод – вашата маса се разпада почти веднага след началото на турнира. Преместват ви на нова маса, където играчът вдясно от вас има стак, който е 7 пъти по-голям от първоначалния, докато останалите участници имат едвам по две хиляди чипа. Повечето хора щяха да направят следния извод: играчът с големия стак е или прекалено лууз и агресивен, или му е провървяло много. Най-често ще сме склонни да приемем, че е вярно първото предположение. Но точно това ще е следствие на теоремата на Бейс, при това няма да има значение, дали знаем за нея или не.

В такива случаи можем да използваме теоремата на Бейс за оценка на опоненти и това ще ни позволи да взимаме верни решения дори при отсъствие на точна информация. Да погледнем следния пример. На масата сяда нов играч. През първите няколко минути ние се опитваме да разберем, какъв е той, използвайки всичките достъпни средства: националност, пол, облекло, реч и т.н. Правим извод, че има вероятност 10% той да е маниак, който ще рейзва от кътофа с 80% от ръцете си, а през останалите 90% – той ще е най-обикновен тайт-играч с диапазон за отварящ рейз от 10%. На първата ръка той рейзва от кътофа (позициите тук не са толкова важни). Каква е вероятността той да е маниак?

Можем да използваме теоремата на Бейс, за да отговорим на този въпрос. Но преди да пресметнем тази вероятност, просто си помислете, как бихте отговорили на този въпрос? Според нас, трениране на интуиция е най-добрият начин да се научиш да даваш правилна оценка на събитията и ситуациите.

А = Опонентът рейзва от кътофа при първа ръка

В = Опонентът е маниак

p(A|B) = 0,8        (ако той е маниак, той ще отваря 80% от ръцете)

p(A|) = 0,1        (ако той не е маниак, диапазонът му ще е 10%)

р(В) = 0,1        (10% вероятност той да е маниак)

р(В) = 0,9        (90% вероятност той да не е маниак)

Да приложим отново теоремата на Бейс:

(Тоест, ако той отваря от кътофа, каква е вероятността той да е маниак?)

Просто наблюдавайки действията на опонента в първата ръка, ние можем да коригираме нашата оценка – сега, вероятността този играч да е маниак вече не е 10%, а 47%! Ако той направи рейз в първите си две ръце, тогава шансовете за такъв резултат ще нараснат още повече – до 87%. Разбира се, тези вероятности изцяло зависят от правилността на първоначалното ни съждение, в реалността ние рядко ще се сблъскваме само с два типа играчи, а моментните ни разсъждения явно няма да са толкова точни.

Мнозина се опитват да отложат оценката на опонента си до онзи момент, докато не получат повече информация или не видят няколко шоудауни. Но според нас това е прекалено пасивен подход; максимизирането на математическото очакване предполага използването на цялата информация, която имаме на разположение, и изчакването на подходящата ситуация не е задължително. По този начин те допускат основна грешка – не осъзнават ценността на онези сведения, които вече имат. Обаче, трябва да се отбележи, че някои играчи, дори и не толкова добри, все пак интуитивно го разбират и се нагаждат по съответен начин. Но! Винаги помнете, че всяко нагаждане може да бъде експлоатирано от вашия опонент, например, когато той, тъкмо сядайки на масата, избира за себе си нов стил на игра, за да използва моментните нагаждания на другите опоненти.

Силните играчи постоянно използват Бейсовата логика (осъзнато или не) за преработване на постъпващата информация. Както ще покажем по-късно, този подход е основата за четенето на ръцете и експлоатация на опоненти. Но дори и извън масата можем да намерим приложения за теоремата на Бейс и сега тъкмо е време да се върнем към разговора за уинрейтовете.

Оценяваме параметри: Статистика на Бейс

В първата част на тази глава сме изучавали извадка от 16 900 ръце от Limit Holdem със следните параметри:

Уинрейт (Х) = 1.15 ВВ/100

Стандартно отклонение (s) = 2.1 ВВ на ръка

Както си спомняте, сблъскахме се с определени сложности при определянето на „реалния“ уинрейт по наличната извадка – предположенията ни едва ли бяха точни. С помощта на инструментите от класическата статистика сме определили, че най-вероятната стойност на уинрейта на разглеждания играч ще е 1.15 ВВ/100, а неговият 95% доверителен интервал се оказа [-2.07 ВВ/100, 4.37 ВВ/100]. Тези оценки бяха направени въз основа на предположение, че нямаме никаква допълнителна информация за разпределението на уинрейта на този играч.

А сега да предположим, че имаме някакви догадки за разпределението на уинрейтовете. Следователно, можем да приложим теоремата на Бейс и да получим по-точна оценка на търсения параметър – „реалния“ уинрейт (за генералната съвкупност). Звучи лесно, нали? Обаче, първо, трябва да видим, какви са ни догадките за общото разпределение на уинрейтовете. Нека нашият играч е случайно избран от всичките хора, които редовно играят покер. Тогава пред нас възниква въпрос: „Какъв вид има общото разпределение в този случай (ще го наричаме, също така априорно разпределение)?“

Забележка: Априорно разпределение е разпределение на вероятности, което изразява предположения за неизвестна величина преди да се отчетат експериментални данни. Например, ако „р“ е частта от избиратели, които са готови да гласуват за определен кандидат, тогава априорното разпределение ще е предположение за „р“ преди да се отчетат резултатите от запитвания или избори.

На пръв поглед може да ви се стори, че е невъзможно да си представиш такова разпределение. В края на краищата, нямаме достъп до резултатите на по-голямата част от играчите. Обаче, тук ще ни помогнат опростявания и приближени оценки, към които ще прибягваме, надявайки се, че предполагаемото разпределение ще е достатъчно близко до реалното – тогава ще можем да го използваме при разчетите. Ще приемем, че нашият играч обикновено сяда на маса с не много високи залози, например, от $10-$20 до $30-$60. Рейкът, който се плаща на масата, вероятно е около $3-$4 на ръка, или 0.1 ВВ. Ще разделим тази стойност на общия брой играчи на масата, предполагайки, че всичките плащат приблизително еднакъв рейк – ще получим, че комисионната на залата взима около 0.01 ВВ на ръка от уинрейтовете на всичките играчи, или 1 ВВ/100. Тогава средната стойност на общото разпределение на уинрейтовете ще бъде -1ВВ/100, тъй като рейкът е чистата загуба на парите в играта. Нека това разпределение на уинрейтовете да се подчинява на нормалния закон, а стандартното отклонение е равно на 0.015 ВВ за едно раздаване. Ще получим, че 68% от играчите ще имат уинрейт от -2.5ВВ/100 до +0.5ВВ/100, а 95% от играчите – от -4ВВ/100 до +2 ВВ/100, което е напълно очакван резултат. Ако ви се струва, че сме сгрешили някъде, вие можете самостоятелно да промените тези числа, за да отразяват собствените ви предположения, при това логиката на изчисленията няма да се промени.

Забележка: ако на някой не му е ясно, как се получиха тези числа – 68% предполага интервал х±s (съответно, 95% – х±2*s). „Сигмата“ е стандартното отклонение и е 0,015 на 1 ръка или 1.5 ВВ/100. След простото събиране и изваждане се получават горепосочените стойности.

Нека опростим нашите пресмятания и вместо непрекъснато нормално разпределение да си представим дискретно разпределение, което горе-долу описва съставения от нас модел. Получаваме следната картина за разпределение на уинрейтовете на всичките играчи:

Забележка: Непрекъснато разпределение (нормалното разпределение е от този тип) предполага, че са възможни абсолютно всички стойности на случайната величина. Дискретното разпределение е ограничено от някакво крайно количество стойности. Това е опростено определение, но тук то е напълно подходящо.

Сега имаме априорното разпределение на уинрейтовете на покер-играчите и лесно можем да приложим теоремата на Бейс. За всеки уинрейт ще пресметнем:

А = вероятността за получаване на уинрейт от 1.15 ВВ/100

В = вероятността този уинрейт да е реален

Няма да можем да намерим вероятността за получаване на определен уинрейт направо, обаче можем да заменим с вероятността на това, че наблюдавания уинрейт ще се окаже в интервала от 1.14 до 1.16.

се получава чрез пресмятане на средно-аритметично по тегло от колонката p(A|B) при изключване на текущата стойност на :

Забележка: Как са се получили тези стойности – нямам никаква представа. Намерих поне какво е средно-аритметично по тегло.

Да приложим теоремата на Бейс към всеки ред:

Когато разглеждахме класическият подход, успяхме да изчислим най-вероятната стойност на уинрейта. Тук можем да направим същото, но сега тази стойност при отчитането на всичките ни предположения ще е равна на -1 ВВ/100.

Естествено, тези предположения не ни дават пълна картина, тъй като разпределението на възможните уинрейтове за всички играчи в реалността се приближава до непрекъснато. Но, дори ако щяхме да използваме не дискретен, а непрекъснат модел, и бяхме направили доста сложни пресмятания, все едно щяхме да получим подобно разпределение. Ключовата идея тук се състои в това, че, тъй като плюсовите играчи са прекалено малко на брой, на теория ние можем да имаме работа както с печеливш, така и с губещ регулар (на който просто му е провървяло на дистанция от 16 900 ръце).

Хайде да разгледаме още по-нагледен пример – да вземем игра с доста по-голям уинрейт в наблюдаваната извадка, например, с 5 ВВ/100.

Класическият подход ще ни каже, че най-вероятният му уинрейт ще е 5 ВВ/100, тъй като се предполага, че всичките уинрейтове са равно вероятни (нали помните, че в класическия метод нямаме информация за разпределението на всичките уинрейтове). Да направим аналогичните пресмятания за новия случай:

Сега нашият играч със сигурност има положителен уинрейт, при това доста висок. Обаче, тъй като уинрейтове от 5 ВВ/100 и по-високи не са представени в общото разпределение, теоремата на Бейс преоценява уинрейта от извадката до най-вероятния в тези условия уинрейт на топ 10% играчи.

Увеличаване на количеството данни (за случая с 1.15 ВВ/100) напълно очаквано ще доведе оценката на уинрейта чрез теоремата на Бейс до уинрейт, който се наблюдава в извадката. Ако един играч демонстрира способността да печели на голяма дистанция, тогава фактическият му уинрейт ще се окаже истински с доста по-голяма вероятност. Да предположим, че имаме работа с извадка от 100 000 ръце:

Очевидно е, че с такава извадка ще имаме по-голяма увереност 1.15 ВВ/100 да е истинският ни уинрейт, макар че общото разпределение предполага, че само 10% от всичките играчи имат уинрейт от поне 1 ВВ/100.

Трябва да се отбележи, че между привържениците на класическия подход и на теорията на Бейс има някои разногласия. Предметът на техния спор е това, че теоремата на Бейс предлага параметрите на генералната съвкупност да се разглеждат като случайни величини със своите разпределения. Обаче, опонентите им отричат тази идея и предпочитат да говорят за параметрите на генералната съвкупност като за константи, макар че те не са в състояние да определят стойностите им. Ние, на своя ред, предпочитаме подхода на Бейс заради приложимостта му в покерния анализ.

Методът, който използвахме горе, дори не е пълноценен – ние преднамерено опростихме методиката на анализа на Бейс, за да направим тази теория по-достъпна. За по-подробно обяснение на теоремата на Бейс, както и за същността на разногласията между двата подхода, обърнете се към специализирана литература.

Последното, за което бихме искали да разкажем, е регресия към средната стойност. Тя е следствие на направения тук анализ. Представете си, че оценявате уинрейтовете си в определена извадка с неголям размер.

Ако те (уинрейтове) са значително по-високи от средната стойност според предполагаемата генерална съвкупност, тогава можете да очаквате влошаването на резултатите си в бъдещето. Но, ако сте наблюдавали уинрейтове, които са по-ниски от средното, тогава в бъдещето резултатът ще се подобри. И това не е следствие на някакво суеверие от рода „вариацията връща дълговете“ – всичките събития са независими, така че това по принцип не може да се случи. Но ето какво се случва в действителност: ако вашият резултат е по-добър от средния уинрейт на всичките играчи, тогава има голяма вероятност, че сте имали късмет и вашите печалби сега са по-големи от реалното ви математическо очакване. И обратно – ако вашият уинрейт е по-лош, отколкото средно при всичките играчи, тогава със сигурност не сте достигнали до собствената ви очаквана печалба. В резултат, вашият уинрейт (понякога съвсем незначително) често ще регресира към средната стойност за всичките играчи. Това много добре се вижда в примера с анализа на Бейс на нашия хипотетичен играч – след 16 900 ръце разпределението на неговия уинрейт беше под голямо влияние от разпределенията на печалбите на всичките играчи, което в крайна сметка премести оценката на „истинският“ му уинрейт в посоката към средната стойност за всички останали – към -1 ВВ/100.

Трябва да се запомни

  • За оценката на параметрите от генералната съвкупност въз основа на отделно взета извадка могат да се използват два метода: класически и на Бейс.
  • Класическият подход подразбира, че ние не разполагаме с никаква допълнителна информация – в резултат сме принудени да оценяваме най-вероятната стойност на математическото очакване за генералната съвкупност според математическото очакване на наличната извадка. На своя ред, доверителният интервал може само да посочи възможния диапазон от стойности на търсения параметър, при които наблюдаваният в извадката резултат ще се окаже вероятен.
  • Логиката на Бейс ни дава възможност да отчитаме нова информация въз основа на наличните оценки и вероятности.
  • Използването на априорното разпределение и теоремата на Бейс може да ни даде по-точната представа за параметрите на генералната съвкупност (при условие, че можем да вярваме на нашето априорно разпределение).

Advertisements
 
Вашият коментар

Posted by на 05/07/2016 in Theory

 

Етикети: ,

Вашият коментар

Попълнете полетата по-долу или кликнете върху икона, за да влезете:

WordPress.com лого

You are commenting using your WordPress.com account. Log Out / Промяна )

Twitter picture

You are commenting using your Twitter account. Log Out / Промяна )

Facebook photo

You are commenting using your Facebook account. Log Out / Промяна )

Google+ photo

You are commenting using your Google+ account. Log Out / Промяна )

Connecting to %s

 
%d bloggers like this: