RSS

Да поговорим за математиката

26 Апр
Да поговорим за математиката

Предсказваме бъдещето: дисперсия (вариация) и извадка

Разпределенията на вероятностите с числените им стойности имат два параметъра, които почти изцяло описват поведението на случайната величина. Първият от тях е математическото очакване, което вече сме разгледали. Вторият се нарича дисперсия (вариация) и показва разхвърлянето на случайната величина, тоест възможното й отклонение от математическото очакване. Казано по-просто, математическото очакване ни казва, колко ще спечелим (средно), а дисперсията (вариацията) – колко далеч от очакваното могат да отидат резултатите.

Изчислявайки дисперсията, ние фактически определяме диапазон от възможни резултати след многократното повтаряне на някакво събитие. Оценяването на отклонението от математическото очакване както в положителната, така и в отрицателната посока е важно в различни сфери – например, на много места в производството съществува диапазон на допустими параметри на продукта, отклонението от които (положително или отрицателно) е крайно нежелателно. Обаче, в покера вариацията се възприема крайно едностранчиво – много от играчите рядко мислят, че могат да печелят повече, отколкото предсказва математическото очакване. Нещо повече, думата „вариация“ в повечето случаи се възприема изключително като период с липса на късмет (или просто даунсуинг).

Тази гледна точка има място, особено, ако говорим за професионалните играчи, обаче, същевременно, тя учи да се игнорират резултатите от свръх очакване и, като следствие, развива схващане, че положителните резултати по-добре отразяват разпределението на вероятностите за едно конкретно събитие.

Една от основните задачи на статистиката е намиране на определен изход/резултат при предварително зададени условия (и обратно – определяне на условия при вече известен резултат). В покера тези две задачи не губят значимостта си.

Ще наричаме целия диапазон от елементи (стойности) с предварително зададени свойства генерална съвкупност, а диапазон от разглеждани значения – извадка. Често пъти в покера ние не можем да оценим всичките елементи от генералната съвкупност, затова основният ни обект ще са отделни извадки.

Забележка: В живота ние доста рядко ще се сблъскаме със случаи, в които генералната съвкупност е предварително известна. Например, ако изучаваме жители на един град, тогава на теория можем да имаме изчерпателно описание на всеки елемент от съвкупността (за всеки жител на града). Обаче, най-често генералната съвкупност няма да ни е известна – да речем, ние никога няма да имаме пълна информация за генерална съвкупност от „жителите на Земята“ или „мъже между 18 и 40 години“.

Повечето курсове и учебници по статистика доста добре обясняват основите на вероятностите, както и методите за съставянето на извадките, проверка на хипотези, определяне на корелации и т.н. Тук ние често ще прибягваме към правилата и алгоритмите от теорията на вероятностите и статистиката, затова по-надолу ще видите кратък обзор на някои теми, които са намерили място в покера (особено при анализа на резултати). Специално пропуснахме доста голям обем информация, която няма отношение към тази книга и за по-подробно изучаване на разглежданите въпроси ви препоръчваме да се обърнете към съответните източници.

Един доста разпространен въпрос в покера звучи така: „Колко често ще приключвам сесията си на плюс?“ Можем да перифразираме този въпрос по следния начин: „Каква е вероятността в разглежданата извадка от генералната съвкупност от моите сесии, резултатът да е по-голям от 0?“ Най-простият отговор на този въпрос звучи така: „Направете анализ на разпределението на вашите сесии в дадена игра и съберете вероятностите за всичките случаи, където крайният резултат беше по-голям от нула.“

За съжаление, не е възможно да получим подобно разпределяне на вероятностите – няма значение, колко данни имате, вие винаги ще имате работа само с извадка, но не и генерална съвкупност. Но нека да си представим, че по някакъв начин знаете математическото си очакване във всяка ръка и вариацията в играта, както и колко пъти средно продължава игровата ви сесия. Тогава можем да използваме статистическите методи за оценяването на факта, колко често ще завършвате сесията си на плюс. Вече знаем, какво е математическото очакване (което също така наричат средна стойност на разпределението), остана само…

Дисперсия (вариация)

Втората съставляваща от нашите изчисления е вариация (дисперсия), мярката за отклонение на случайна величина от математическото очакване. Представете си два баса: в единият вие хвърляте „честна“ монета, в другия – зар с изплащане 5 към 1, ако падне шестица. И двете игри имат нулево очакване, обаче втория бас има по-висока вариация – в 1/6 от случаите ще получите $5 (или с 5 единици повече от МО), а през останалите 5/6 ще заплатите $1 (или с една единица по-малко от МО).

За да пресметнем вариацията, трябва намерим квадрата на разликата между математическото очакване и резултата, да го умножим по вероятността на този резултат, а след това да съберем получените стойности.

За разпределение „Р“, където всеки от „n“ резултати има значение „xi“ и вероятност „pi„, вариацията „Vp“ е равна на:

Обърнете внимание, всяко събираемо ще е положително, затова вариацията винаги е положителна. В разглеждания пример, вариацията при хвърлянето на монетата е:

За зара е:

В покера лууз-играта има по-голяма вариация от тайт, защото резултатите й ще имат по-голямо отклонение от средната стойност (вие ще печелите по-големи потове, обаче вероятните ви загуби също ще нараснат). Стилът на играта също има влияние върху вариацията: тънките стойностни залози и рейзове с полублъфове могат да увеличат вашата вариация, математическото очакване или едновременно и двата параметъра. От друга страна, маниакалната игра увеличава вариацията, но при това намалява очакването. А прекалено тайт-игра намалява и очакването, и вариацията. В четвърта глава ще разгледаме теория за управление на банката, рискове при покер играта и ще изучим влиянието на вариацията върху стойността на парите. Обаче, с изключение на тази глава, ние няма да отчитаме вариация при взимането на решения на масата, тъй като вариацията е параметър, който само описва ситуацията, но не и диктува хода на действията (за разлика от математическото очакване).

Вариацията ни казва за очакваното отклонение от средната стойност на разпределението (математическото очакване). Също както и математическото очакване, вариацията е адитивна. Така че, ако хвърлите зарчето два пъти вашата вариация за двете хвърляния няма да е 5, както вече определихме, а ще е 10.

Поради това, че дисперсията се пресмята като квадрат на отклонението на резултата спрямо очакването, ние не можем да сравняваме вариацията и математическото очакване направо. Ако искаме да го направим, тогава трябва да вземем корен квадратен от получената стойност на вариацията – този параметър се нарича стандартно отклонение. За нашия пример със зара стандартното отклонение за едно хвърляне ще е . В повечето случаи за означаване на стандартното отклонение се използва символът „сигма“, а „сигма на квадрат“ (s2) означава дисперсия.

Нормално разпределение

Представете си, че хвърляме монета. Резултатът от хвърлянето на монетата се смята за случайна величина. Нека означим двата възможни изхода на това събитие като 1 (ези) и 0 (тура). По този начин, в резултат от хвърлянето на монетата ние ще получим или 1 (в половината от случаите), или 0 (в другата половина от случаите). Ако съберем заедно резултатите от множеството хвърляния, ще получим сбора от стойностите за случайната величина, който се нарича извадка. Стойността на извадката в нашия случай ще е равна на броя на ези.

А сега си представете, че сме хвърлили монетата 100 пъти. Математическото очакване за броя паднали езита ще е 50, т.е. при всяко хвърляне математическото очакване ще е 0,5.

Да пресметнем дисперсията и стандартното отклонение за едно хвърляне:

От предната глава знаем, че дисперсията е адитивна. Така че дисперсията от 100 хвърляния ще е 25.

Нашата извадка има стандартно отклонение, както и само едното хвърляне. Обаче, за разлика от дисперсия, стандартното отклонение не е адитивно – съществува специално правило за изчисляване на „сигмата“ за една извадка.

За „N“ брой събития дисперсията (а, като следствие, и стандартното отклонение) ще е равна на:

Корен квадратен от броя събития във формулата за стандартното отклонение е много важен, тъй като показва, как се променя отклонението при голям брой събития. Ако хвърлим монетата само веднъж, тогава стандартното отклонение ще е ½. Но след 100 събития то ще бъде само 5 (корен квадратен от 100, умножен по ½).

Разпределението на резултатите от едно случайно събитие в извадката е разпределение на вероятностите, но то също така се нарича извадково разпределение. Централната Гранична Теорема е важна теория от статистиката и според нея с увеличаването на размера на извадката разпределението на стойностите се стреми към специалния вид разпределяне на вероятностите – нормално разпределение.

Графиката за нормалното разпределение има камбановидна форма, където пикът на кривата е средната стойност (математическото очакване), а краищата асимптотично (т.е. те могат да бъдат безкрайно близки до нулата, но никога няма да са равни на нула) се стремят към нулата при стойностите „х“, които отиват в плюс или минус безкрайност. Формата на кривата зависи от стандартното отклонение на генералната съвкупност. Площта под кривата за нормалното разпределение е равна на 1 (както и при всички други разпределения на вероятностите), а областта под кривата в интервал [x1, x2] (на картинката, означена като „А“) е равна на вероятността стойността на резултата от някое събитие да попадне в интервал между х1 и х2.

Фигура 1: Нормално разпределение

Казано по-просто, Централната Гранична Теорема гласи, че ако вземем някаква генерална съвкупност и ще разглеждаме множество големи извадки от нея (размерът тук зависи от типа на данните, които се анализират), тогава резултатите ще се намират в описаната горе камбановидна крива с център върху математическото очакване.

Уравнението за функцията за нормално разпределение със средната стойност m и стандартното отклонение s изглежда така:

Площта между две точки по оста Х под кривата за нормално разпределение е равна на вероятността някаква стойност от нашата извадка със съответното математическо очакване и дисперсия да попада в зададения от тези две точки интервал. Нормалното разпределение е симетрично спрямо средната стойност, така че половината от общата й площ се намира отляво – другата половина – отдясно.

Обикновено, площта на участъците под кривата за разпределение се пресмята чрез използването на така наречената z-оценка, където z = (x – m)/s. Тя показва с колко „сигми“ (стандартни отклонения) някакъв резултат „х“ отстои от средната стойност на разпределението.

z = (x – m)/s    (2.6)

След това можем да намерим интегрална функция на разпределението (също така се нарича интеграл на вероятността или функция на Лаплас) за z-оценката, която фактически представлява площта на областта, разположена вляво от стойността „х“ под кривата на разпределението (при математическото очакване 0 и стандартното отклонение 1). Тази функция се нарича F(х):

Нека „z“ е нормирана z-оценка на величина „х“, тогава интегралната функция на разпределението има вид:

За да намерим площта на сектора между „х1“ и „х2„, трябва да пресметнем z-оценките „z1“ и „z2“ за „х1“ и „х2„, съответно, да намерим функциите на разпределение F(z1) и F(z2) и от първата стойност да извадим втората.

Figure 2: Интегрална функция на разпределение

Полученият резултат фактически означава вероятността дадена случайна величина, разпределена по нормалния закон (със средната стойност m и стандартното отклонение s), да попадне в интервала от „х1“ до „х2„:

Съществуват специални таблици и програми за пресмятането на стойностите на F(х), а някои конкретни стойности на тази функция са добре известни на всички, които поне някога са се сблъсквали със статистиката. Така, площта в рамките на една сигма (плюс/минус) от математическото очакване приблизително е равна на 0,68; в рамките на 2 сигми – 0,955, а площта в рамките на 3 сигми е 0,997.

Това означава, че стойността на нормалното разпределение на случайна величина ще бъде:

Между (ms) и (m + s) в 68% от случаите;

Между (m – 2s) и (m +2s) в 95,5% от случаите;

Между (m – 3s) и (m +3s) в 99,7% от случаите.

А сега е подходящ момент да обясним всичко казано с един прост пример.

Нека да променим малко условията на играта с хвърлянето на зара. Нека ние печелим 6 единици, ако на зара се падне шестица, и ще губим 1 единица, ако падне всяко друго число от 1 до 5. Ще наречем тази игра D2.

Очакването от тази игра ще е:

Ако се падне шестица, ние печелим 6 единици. За да пресметнем дисперсия (вариация), трябва първо да извадим от нашата печалба (един от двата вероятни резултата) стойността на математическото очакване в играта (1/6) и след това да намерим квадрата на тази разлика:

И след това трябва да направим същото и за загубата:

По този начин, вариацията в играта ще е:

Да си представим, че хвърляме зара 200 пъти. Каква е вероятността да сме на плюс на тази дистанция? Каква е вероятността да спечелим 40 единици или повече? 100 единици или повече?

Можем да решим тази задача, използвайки току що полученото.

За начало, трябва да определим стандартното отклонение за извадка от 200 хвърляния:

Сега ще използваме формулата (2.4) и ще определим сигмата за цялата извадка:

За 200 хвърляния нашето математическо очакване (средната стойност на разпределението, m) ще е 33,33 единици (трябва да умножим математическото очакване от едно хвърляне по количеството събития, т.е. по 200). За да нормираме стойността на променливата в точка 0 (тоест да направим z-оценка), ще използваме уравнението 2.6.

Забележка: Това ни е нужно, за да отговорим на първия въпрос – колко често ще сме на плюс след 200 хвърляния. Фактически, авторите на книгата казват: „Нека „х“ е някаква нормално разпределена случайна величина, отразяваща общата ни печалба след 200 хвърляния“. Сега ще направим z-оценка на тази величина в точка 0 – очевидно е, че всичките стойности на случайната величина, които са над нулата, са отговор на нашия въпрос.

zx = (x – m)/s, където х = 0;

z0 = (0 – 33,33)/36,89 = -0,9035

Сега да се обърнем към статистическата таблица със стойностите на функцията на Лаплас – вероятността стойността на случайната величина да е вляво от точката х=0 (т.е. да е по-малка от нула) ще е F(-0,9035) = 0,1831. С други думи, ще сме на минус след 200 хвърляния в 18,31% от случаите. Но през останалото време ще сме на плюс.

А сега да отговорим на втория въпрос – за вероятността да спечелим 40 или повече единици. Отново ще направим z-оценка на случайната величина в зададената точка:

Z40 = (40 – 33,33)/36,89 = 0,1807

F(0,1807) = 0,5717

Но F(0,1807) ни казва само, каква е вероятността стойността „х“ да е вляво от 40 единици, тоест ние сме отговорили на въпрос: „Каква е вероятността да спечелим 40 или по-малко единици“. За да получим отговора на поставения въпрос, трябва да направим следното:

Р = 1 – F(0,1807) = 1 – 0,5717

Р = 0,4283

Следователно, вероятността да спечелим 40 или повече единици след 200 хвърляния е 42,83%.

Да направим същото и за 100 единици:

Z100 = (100 – 33,33)/36,89 = 1,8070

От таблицата намираме, че F(1,8070) = 0,9646. Тогава:

Р = 1 – F(1,8070)

Р = 0,0354

Вероятността да спечелим 100 единици или повече е 3,54%.

Тези отговори, обаче, не са точни, защото една извадка от 200 хвърляния е разпределена по нормален закон само условно. За по-точни изчисления можем да използваме компютъра:

Както виждате, има някакви разлики. Това е така, защото точните пресмятания предполагат само реалните възможни изходи, а приближените пресмятания въз основа на нормалното разпределение допускат всякакви изходи (например, печалба от 40,59 единици).

А сега да се върнем към въпроса, който поставихме в началото на тази глава: „Колко често ще завърша сесията си на плюс?“ За да решим тази задача, трябва да знаем очакването на играча във всяко раздаване, неговата вариация във всяко раздаване и продължителността на неговите сесии. Представете си един играч с уинрейт 0,015 бб/ръка, а стандартното отклонение е 2 бб/ръка. Да предположим, че той играе по 300 ръце на сесия. Колко често този играч ще завършва на плюс (т.е. с резултат, по-голям от 0)?

За начало да пресметнем математическото очакване в една сесия, mN:

mN = N*m

mN = 300*0,015 = 4,5

Сега да определим стандартното отклонение за 300 ръце:


А сега да направим z-оценката на търсената точка:

Zx = (x – mN)/s

Z0 = (0 – 4,5)/34,6 = -0,1299

От таблицата за вероятностите установяваме, че:

F(-0,1299) = 44,83%

Р = 1 – F(-0,1299) = 1 – 0,4483 = 0,55171

Този играч ще завърши сесията си на минус с вероятност 44,83%. Съответно, през останалите 55,17% той ще печели на дистанция от 300 ръце. Но в реалността играчите сменят стила си на игра и продължителността на сесията, така че уинрейта ще е постоянно променяща се величина, която силно зависи от условията на играта, психологичните фактори т.н.

Нека да разгледаме друг пример. Веднъж един мой познат ми разказа, че е наблюдавал и записвал всеки префлоп ол-ин на AQ срещу АК в продължение на няколко месеца. В крайна сметка, той е получил извадка от 2000 сравнения, но и след толкова ръце AQ са печелили приблизително в 50% от случаите.

Каква е вероятността този резултат да е такъв, ако предположим, че картите се раздават честно и нямаме никаква допълнителна информация за мъртвите карти (например, някой би могъл да хвърли Q2 префлоп, по този начин лишавайки AQ с един от аутове)?

Най-напред, нека пресметнем вариацията за едно такова сравнение. АК срещу AQ има около 73,5% очакван дял при префлоп ол-ин (включително и едноцветните комбинации). Да приемем, че победата на АК е 1, а победата на AQ е 0. По този начин, математическото ни очакване е 0,735.

V = 0,735(1 – 0,735)2 + 0,265(1 – 0,735)2

V = 0,1948;

s = 0,4413

За 2000 раздавания очакването ще е:

mN = N*m

mN = 2000*0,735 = 1470

На същата дистанция стандартното отклонение ще е:


Както са ни казали, АК са печелили приблизително в 50% от случаите за 2000 раздавания или 1000 пъти, макар че съгласно математическото очакване, това трябваше да се случи 1470 пъти.

Да направим z-оценката, като използваме уравнението 2.6:

Zx = (x – mN)/s

Z1000 = (1000 – 1470)/19,737 = -23,815

А сега да помислим за получения резултат. Нашата z-оценка казва, че такъв резултат се намира на разстояние над 23 стандартни отклонения от средната стойност. В действителност, вероятността на това събитие е нищожно малка, затова трудно може да се оцени. Нещо повече, моята таблица казва, че F(-23,815) е равна на 0.

Вероятно, тук има място едно от следните обяснения: или този човек явно е преувеличил резултатите, или е лъгал, или просто не е забелязвал как АК печели срещу AQ, тъй като това е достатъчно очакван резултат. Това е психологичен ефект – много често на нас ни е по-лесно да отбележим необичайно явление, нежели очакван и добре известен резултат. Макар че е напълно възможно, генераторът на случайни числа в този сайт да не е чак толкова честен.

Когато разпратихме този въпрос на няколко приятели, получихме много различаващи се отговори; някои посочваха много висока вариация в покера, както и „за 2000 раздавания могат да се случат много неща“. Но това не е съвсем вярно – в рамките на 2000 случайни ръце в покера наистина можеш да спечелиш или да загубиш произволен брой пъти именно заради голяма вариация в отделно взето раздаване със случайни карти. В същото време тук говорим за раздаване на съвсем определени ръце, така че в нашия случай вариацията няма да е толкова голяма.

Като цяло, вариацията в едно раздаване е значително по-висока от вариацията на играча, който току що е спечелил префлоп ол-ина. Така че от този пример си заслужава да извлечем една важна поука – не трябва да се бърка вариацията при разиграване на отделни ръце с вариациите на случайните величини от други категории.

По време на една покер игра може да се случи огромно количество случайни събития. Ние, както и другите играчи на масата, получаваме случайни ръце от диапазон, който включва всякакви възможни комбинации от две карти. След това започва рунд за залагане, след който следва или замяна на карти, или излизане на общите карти (и, като следствие, промяна на силата на нашата ръка). Всяко раздаване има определен резултат – загуба на един-два залога, взимане на голям пот или само на блайндовете. На своя ред, този резултат е следствие на множество други случайни събития, които се случват по време на ръката. Освен това, понякога имаме работа и с неслучайни фактори – например, сме забелязали телз при един от опонентите и сме го използвали, за да спечелим пота без да имаме ръка, или сме спестили залог, когато сме разбрали, че сме много назад. Обаче, както ни казва Централната гранична теорема, резултатът от едно отделно раздаване има разпределение, което се доближава до нормалното (тъй като върху него влияят множество несвързани помежду си случайни величини).

Заслужава си да се каже, че квадратният корен, който присъства във формулата за стандартното отклонение, също е с нас – с увеличаването на дистанцията, вероятността за голямо отклонение от очаквания резултат се намалява.

Представете си, че имаме работа с играч, при който разпределението на резултатите от изиграни ръце има средна стойност $75 за 100 ръце, а дисперсията е $6400 във всяко раздаване. Ако разгледаме различни извадки, взети от това разпределение, ще видим как размерът на извадката влияе върху крайната дисперсия (вариация). Вече знаем, че резултатът на този играч в дадена извадка ще се окаже в рамките на две стандартни отклонения от математическото очакване с вероятност 95,5%. Да въведем следните параметри за всяка извадка:

  • Математическо очакване, mN
  • Стандартно отклонение, s
  • Две крайни точки на интервала с вероятност 95,5%


Както се вижда, при малки извадки диапазонът за възможни резултати е много широк. Обаче, с увеличаването на размера на извадката, резултатите се приближават към математическото очакване, макар че като абсолютна стойност те стават съществено по-големи. Сравнете величината на стандартното отклонение за извадка от 1М ръце със същата стойност за 100 ръце – числово те се отличават 100 пъти, но в първия случай стойността на отклонението е незначителна спрямо математическото очакване, което не може да се каже за втората извадка.

Причината за това явление е законът за големите числа – колкото по-голяма е извадката, толкова по-малко тя се влияе от случайните отклонения.

Забележка: Законът за големите числа фактически гласи следното. Отделният резултат от случайно събитие се влияе от множество фактори, които го правят неопределен. Обаче, колкото повече наблюдения се извършват, толкова по-малко случайности остават – средният резултат от голяма извадка става закономерен. С други думи, съвместното действие на голям брой случайни фактори довежда до резултат, който почти не зависи от случая.

Трябва да се запомни

  • Вариация (дисперсия) определя степента на разхвърляне на случайна величина (спрямо математическото й очакване). Тя е равна на сбора на квадратите на отклонения на елементите от разпределение спрямо математическото очакване
  • За да сравним вариацията и математическото очакване, ние трябва да вземем корен квадратен от дисперсия – полученият параметър е стандартно отклонение.
  • Вариацията (дисперсия) е адитивна. Квадратният корен, който присъства във формулата за изчисляване на стандартното отклонение на една извадка, е следствие от това свойство.

Централната Гранична Теорема ни казва, че сборът на голямо количество независими случайни величини има разпределение, близко до нормалното. Това ни позволява да направим оценка на сложни събития чрез използване на нормалният закон за разпределение и да разбираме по-добре поведението на случайни величини на дълги дистанции.

Advertisements
 
2 Коментари

Posted by на 04/26/2016 in Theory

 

Етикети: , ,

2 responses to “Да поговорим за математиката

  1. Анонимен

    08/13/2017 at 15:08

    „макар,че е напълно възможно генераторът на случайни числа в този сайт да не е напълно честен“,,, май открих топлата вода

    Like

     
  2. Анонимен

    08/13/2017 at 12:55

    Вариация….дисперсия ,изтънченни понятия за измама в онлайн покера

    Like

     

Вашият коментар

Попълнете полетата по-долу или кликнете върху икона, за да влезете:

WordPress.com лого

You are commenting using your WordPress.com account. Log Out / Промяна )

Twitter picture

You are commenting using your Twitter account. Log Out / Промяна )

Facebook photo

You are commenting using your Facebook account. Log Out / Промяна )

Google+ photo

You are commenting using your Google+ account. Log Out / Промяна )

Connecting to %s

 
%d bloggers like this: