avva: (Default)
[personal profile] avva
Продолжая предыдущую запись.

Третий вопрос. 3. Кто в среднем наберет больше очков? То есть, в среднем за все 100 бросков Алиса наберет X очков, Боб наберет Y очков. Какие отношения между X и Y? Бонус-вопрос: можете ли вы найти точные значения X и Y?

Правильный ответ - в среднем каждый наберет одинаковое число очков, а именно 24.75 (99/4). Для хорошо знающих теорию вероятностей это очень простой вопрос, показывающий силу очень важного принципа - аддитивности математического ожидания даже зависимых друг от друга событий. Говоря простыми словами, спросим себя, сколько в среднем очков получит Алиса *на втором броске*? Ответ 1/4, потому что из 4 возможных равновероятных исходов первых двух бросков только один дает ей 1 очко. Сколько очков в среднем получит Алиса на третьем, четвертом итд. броске? Ответ всегда 1/4 по той же причине. Несмотря на то, что события "получила очко на 2-м броске" и "получила очко на третьем броске" очень сильно зависят друг от друга, ВСЕ РАВНО (и это крайне контринтуитивно поначалу, но очень важно понимать и уметь пользоваться) число очков в среднем по всем броскам - это простая сумма этих 1/4 за каждый возможный бросок, на котором можно получить очко. То есть, 1/4 умножить на 99 таких бросков. Для Боба ситуация абсолютно такая же и ответ такой же. Вот и все.

Для тех, кого не убеждает использование этого принципа, могу предложить аргумент с подсчетом. Ведь среднее число очков за игру - это просто-напросто общее число очков во всех возможных играх, поделенное на количество возможных игр. Это и значит "среднее". Сколько всего возможных игр? Число последовательностей из О и Р длиной 100, т.е. 2^100. Сколько в них всего очков Боба, например? Посчитаем отдельно по позициям: есть 2^98 игр, в которых Боб получает очко на второй позиции (после второго броска), потому что нам необходимо зафиксировать ОР в позициях 1,2, а остальные 98 могут быть любыми. Значит, 2^98 очков Боба, полученных на втором броске; столько же на третьем, четвертом итд., всего 99*2^98 очков Боба, и поделив на 2^100 игр, получаем те же 99/4 очков в среднем. То же самое у Алисы.

(Подумать как следует над решением с подсчетом может помочь поверить в принцип аддитивности матожидания)

И наконец, самый сложный вопрос.

Четвертый вопрос. Что более вероятно: что Алиса победит Боба, или что Боб победит Алису?

Правильный ответ: несмотря на равенство среднего числа очков в третьем вопросе, более вероятна победа Боба, с вероятностью примерно 51%.

Это легко проверить опытным путем, если запустить симуляцию достаточно большого числа игр. Но как это объяснить?

Почти все, кто написал правильный ответ, дали следующее логичное объяснение (и я тоже его для себя придумал). Хотя общее число очков у Алисы и Боба по всем играм одинаковое, очки Алисы более "скученные". Например, Алиса может в одной игре получить даже 99 очков, если все О, а Боб максимум 50. Значит, во многих играх Алиса как бы "зря расходует" свои очки на создание большего перевеса, чем нужен для победы, и поэтому выигрывает в меньшем количестве игр, чем Боб, и в целом шанс победить у нее немного меньше.

Это очень логичное объяснение. Но оно совершенно неверно. У Алисы немного меньше шанс победить, но не поэтому. Почему я в этом уверен, будет понятно из правильного объяснения, к которому я в итоге пришел (ну не только я, конечно, в твиттере это многие обсуждали). Вот оно.

Будем вести счет игре, давая +1 за каждое очко Алисы и -1 за каждое очко Боба. Если в конце счет положительный/отрицательный, то победила Алиса/победил Боб. Мы начинаем со счета 0. Представим себе вначале, что мы играем игру неопределенно долго, тогда счет будет блуждать случайным образом, начиная с 0, потом переходя, например, в положительный район, покружив там, через 0 в отрицательный, и так далее. Чтобы быть точнее, поделим всю запись игры на "экскурсии" в + или -, каждая из которых начинается после броска О с нулевым счетом. Если после такого О идет О, мы идем в +1, и блуждаем там какое-то время, пока опять не окажемся в О со счетом 0. Если Р, то -1 и опять блуждаем до следующего О при нулевом счете.

Если именно так определить "экскурсии", то оказывается, что средняя длина положительных и отрицательных экскурсий одинакова. Это можно доказать, выписав вероятности переходов и увидев симметрию, но есть более остроумный способ: если прочитать экскурсию от конца к началу, то положительная превращается в отрицательную и наоборот. Например: ОООРООРОРРРРО это положительная экскурсия, в течение которой счет был: 1, 2, 1, 2, 1, 0. А теперь перевернем ее, прочитаем от конца к началу: ΟРРРРОРООРООО, здесь счет идет: -1, -2, -1, -2, 1, 0.

Таким образом, число положительных экскурсий любой данной длины строго равно числу отрицательных такой же длины. А это значит, что всю игру можно представить как череду экскурсий, каждая из которых случайным образом положительная или отрицательная, и вот после 100-го броска внезапно игру обрывают, и внутри какой экскурсии мы остановились, тот игрок и победил. Поскольку длина экскурсии не зависит от знака, очевидно, что шанс оказаться внутри положительной экскурсии после 100-го броска равен шансу оказаться внутри отрицательной. Но почему же тогда шансы Алисы и Боба победить не равны 50% у каждого?

Потому что есть крохотная асимметрия в подсчете очков. Посмотрите на пример двух экскурсий выше. В отрицательной экскурсии ОРРРРОРООРООО мы все время, кроме начального и последнего О, имеем отрицательный счет, и если игра оборвется в середине этой экскурсии, победит Боб. А в ее положительном двойнике ОООРООРОРРРРО счет положительный до последнего блока РРРРО, в течение которого он уже 0, но мы еще не дошли до О с этим нулевым счетом. Если игра оборвется на этом блоке, будет ничья. Оказывается, эта крохотная разница и есть причина победы Боба. Последовательности из одних Р при нулевом счете должны "по-честному" (кроме самой первой в начале игры) считаться за Алису, потому что они стоят в конце положительных экскурсий, но по правилам игры они не засчитываются ни за кого. И те случаи, когда 100-й бросок оказывается внутри таких последовательностей, и дают перевес Бобу. Если изменить правила так, что "если конец игры падает на Р при нулевом счете, но при этом не все вообще броски Р, то победа засчитывается Алисе", то оказывается, что вероятность победы ровно 50% у каждого. Причем *ровно* 50% - если посчитать число выигрышных игр у Алисы и Боба, они совпадают один к одному (я посчитал для 25 бросков, не для 100).

Обратите внимание, что при таком изменении правил игры, когда мы "ничейные" (нулевой счет) блоки Р записываем в пользу Алисе, все равно остается верным, что у Алисы больше скученность очков, что у нее есть игры с числом очков больше 50, а у Боба таких не бывает - все аргументы того объяснения, что я дал первым, остаются верными, но шансы победить тем не менее равны. Вот почему я написал выше, что уверен, что то объяснение неверно.

Вроде все.
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

February 2026

S M T W T F S
1 2 3 4 5 67
891011121314
15161718192021
22232425262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 7th, 2026 08:02 pm
Powered by Dreamwidth Studios