Thread Rating:
  • 0 Vote(s) - 0 Average
  • 1
  • 2
  • 3
  • 4
  • 5
Эксперимент - расчет сложности раскладов
#1
Некогда в ветке https://forum.stockholdergame.com/thread-338.html Автор попробовал проанализировать сложность раскладов в турнире. К сожалению, картинки темы утрачены, но идея анализировать сложность раскладов и влияние их на результат стоит того, чтобы проделать соответствующую работу.

Конечно, вычислить некую "объективную" сложность всего расклада на руке довольно сложно, да и ведь еще важно что у соперника на руках для полной картины. Но можно упростить задачу: анализировать только расклады больших карт. Мы и так знаем, что есть очень сложные расклады для розыгрыша, такие как две пары сотен или три сотни одного цвета на руке, непросто разыгрывать также расклады из 4х сотен, а расклады с 3мя двушками часто приводят или к мощным победам, или к полному фиаско, без какой-то середины. Но интересно увидеть, как выглядят в статистике и сбалансированные расклады с 1 или 2 двушками, и какую они дают статистику в противоборстве друг с другом.

В базе есть уже огромное количество партий, но вытащить их не так просто в связи с тем, что хранятся они в машинном виде и требуют отдельной работы по дешифровке. Я имею доступ только к своим партиям, но эта выборка не будет репрезентативной: во-первых, у меня почти 69% побед, а у большинства соперников сильно ниже, и это значит, что нужно учитывать эти коэффициенты побед в расчетах, иначе будет влиять на результат анализа персональная результативность игроков. Во-вторых может быть ситуация, что одни расклады персонально для меня легче, чем для других игроков, а другие - наоборот. 

Несмотря на вроде бы множество вариантов, есть всего 11 комбинаций больших карт:

   

S - сотня, 2S/3S - две или три сотни одного цвета соответственно, D - двушка. Двушки нет большого смысла выделять умножалки и делилки на данном этапе, несмотря на то, что ценность делилки, на мой взгляд, несколько выше. В реальной партии в итоге все решает применение. Возможно, в будущем можно будет отдельно проанализировать, как работают двушки в разных комбинациях (очевидно пара х2с и :2c на руке гораздо сложнее в розыгрыше, чем, например, х2с и :2к), но это уже будет отдельное исследование.

В связи с этим объявляю набор добровольцев, кто может мне помочь со своей статистикой.

Что нужно:

Пройтись по архиву и собрать табличку по своим партиям в таком виде:

   

Поля 1,3,5 относятся к первому игроку в партии, 2,4,6 - ко второму

Партии со мной лучше игнорировать (чтобы меньше чистить дубликаты потом), removed users - актуальны (это партии с Бобом в том числе), кроме тех, которые были учебными для новых игроков, если вдруг помните что это именно такие партии.

Если собрать вот прямо все-все сложно - можно сколько получится, главное чтобы партии были подряд (для чистоты выборки), и в этом случае лучше идти от текущих партий к старым.

Идеи, предложения - принимаются. К обсуждению готов.
Reply
#2
(05-17-2021, 09:22 PM)AlexB Wrote: Некогда в ветке https://forum.stockholdergame.com/thread-338.html Автор попробовал проанализировать сложность раскладов в турнире. К сожалению, картинки темы утрачены, но идея анализировать сложность раскладов и влияние их на результат стоит того, чтобы проделать соответствующую работу.

Конечно, вычислить некую "объективную" сложность всего расклада на руке довольно сложно, да и ведь еще важно что у соперника на руках для полной картины. Но можно упростить задачу: анализировать только расклады больших карт. Мы и так знаем, что есть очень сложные расклады для розыгрыша, такие как две пары сотен или три сотни одного цвета на руке, непросто разыгрывать также расклады из 4х сотен, а расклады с 3мя двушками часто приводят или к мощным победам, или к полному фиаско, без какой-то середины. Но интересно увидеть, как выглядят в статистике и сбалансированные расклады с 1 или 2 двушками, и какую они дают статистику в противоборстве друг с другом.

В базе есть уже огромное количество партий, но вытащить их не так просто в связи с тем, что хранятся они в машинном виде и требуют отдельной работы по дешифровке. Я имею доступ только к своим партиям, но эта выборка не будет репрезентативной: во-первых, у меня почти 69% побед, а у большинства соперников сильно ниже, и это значит, что нужно учитывать эти коэффициенты побед в расчетах, иначе будет влиять на результат анализа персональная результативность игроков. Во-вторых может быть ситуация, что одни расклады персонально для меня легче, чем для других игроков, а другие - наоборот. 

Несмотря на вроде бы множество вариантов, есть всего 11 комбинаций больших карт:



S - сотня, 2S/3S - две или три сотни одного цвета соответственно, D - двушка. Двушки нет большого смысла выделять умножалки и делилки на данном этапе, несмотря на то, что ценность делилки, на мой взгляд, несколько выше. В реальной партии в итоге все решает применение. Возможно, в будущем можно будет отдельно проанализировать, как работают двушки в разных комбинациях (очевидно пара х2с и :2c на руке гораздо сложнее в розыгрыше, чем, например, х2с и :2к), но это уже будет отдельное исследование.

В связи с этим объявляю набор добровольцев, кто может мне помочь со своей статистикой.

Что нужно:

Пройтись по архиву и собрать табличку по своим партиям в таком виде:



Поля 1,3,5 относятся к первому игроку в партии, 2,4,6 - ко второму

Партии со мной лучше игнорировать (чтобы меньше чистить дубликаты потом), removed users - актуальны (это партии с Бобом в том числе), кроме тех, которые были учебными для новых игроков, если вдруг помните что это именно такие партии.

Если собрать вот прямо все-все сложно - можно сколько получится, главное чтобы партии были подряд (для чистоты выборки), и в этом случае лучше идти от текущих партий к старым.

Идеи, предложения - принимаются. К обсуждению готов.

Очень интересная идея. Постараюсь выкроить время и сделать такую выборку (очевидно, опять за счет сна  Smile ). Тем более, что у меня пока партий сыграно меньше, чем у большинства игроков...
Reply
#3
Не проще админу выдернуть из базы ?
Reply
#4
Я спрашивал, технически это возможно, но требует написания специального парсера. Партии хранятся в бинарном виде, их нужно расшифровывать и складывать в сsv формате, чтобы из них можно было достать нужную инфу. И далее нужно из них доставать кусочки нужной информации и переводить в формат, который уже можно анализировать, что тоже простыми инструментами типа Excel сделать может не получиться.
Пока Админ занимается более насущными задачами для сайта было бы неправильно его грузить второстепенной задачей.
Reply
#5
Информацию о своих партиях я наконец занес в табличку и могу поделиться первыми результатами.

1. Какие расклады выпадают чаще всего? Конечно, можно просто было воспользоваться формулами из комбинаторики, результат должен был быть практически таким же Smile Но все-таки:

На первом месте с большим отрывом SS2D (две разные сотни и две двушки) - почти 31%. Я понимал, что этот расклад самый популярный, но полагал, что его частота 20-25%
А второе и третье места делят с очень близким результатом 18% SSSD и 2SSD - расклады из 3 сотен (кроме трех одинаковых сотен) и одной двушки.

Самыми редкими оказались 2S2S (две пары сотен) и 3SD (три одинаковые сотни и двушка) - по 0.6% всего (а тут я думал, что это несколько более частые расклады) Третий по редкости - 3SS (четыре сотни, из них 3 одинаковые)

Вероятность получить такие расклады как SSSS (четыре разные сотни - светофор) и 4D (четыре двушки) всего 2%.

Итого вероятность расклада без двушки - 11%, c одной двушкой - 36%, c двумя двушками - 39%, c тремя - 12%, и полностью расклад из двушек - 2%

2. Попытка учесть уровень игроков для расчета на больших числах дала результат, близкий к среднему - математическое ожидание результата игры колебалось между 0.47 и 0.53, не считая совсем редкие расклады. В итоге могу объявить предварительные результаты по моим партиям: обращаю внимание, что при увеличении базы данных и использовании данных разных игроков эти результаты могут измениться.

Играя первым ходом лучшие результаты у показали расклады 4D (60%) и 2S2S (две пары сотен) (50%). Неожиданно? Возможно, проблема в маленькой базе: 4D первым ходом было сыграно 10 партий, а 2S2S всего две (и одна была недавно на Разборках ).

Из раскладов, которыми было сыграно более 50 партий, на первом месте 2S2D (две одинаковые сотни и две двушки) - 46%, на втором - самый популярный расклад SS2D (две разные сотни и две двушки) - 44%, на третьем с большим отрывом 2SSD (три сотни двух цветов и двушка) - 38%.

Самым худшим раскладом первым ходом стал 3SS (четыре сотни, из них три одинаковые) - ни одной победы из 6 партий. Из раскладов, которыми было сыграно более 50 партий наихудшим был не очень частый 2SSS (четыре сотни трех цветов) - всего 23% побед.

Вторым ходом чемпионом стал S3D (три двушки) - 76.5%! Борис, ты был прав! Это при том, что первым ходом этот расклад играет намного скромнее (35%). Далее расположились редкие расклады: неожиданно 3SD (три одинаковые сотни и двушка) - было выиграно 3 из 4 партий таким раскладом, и SSSS (четыре разные сотни - светофор) - 73% в 15 партиях. Из раскладов, отыгранных более 50 раз, на втором месте самый популярный расклад SS2D (две разные сотни и две двушки) - 67%, а на третьем - 2S2D (две одинаковые сотни и две двушки) - 58%.

Наихудшим раскладом второго хода стал 2S2S (две пары сотен) - всего выиграна 1 партия из 6 (17%), и это был единственный расклад, который выигрывал менее половины партий. 2SSS (четыре сотни трех цветов) дает 51% побед вторым ходом, а SSSD и 2SSD - расклады из 3 сотен (кроме трех одинаковых сотен) и одной двушки позволили выиграть по 55% партий.

Вскрытие показало, что расклады SSSS, 3SD, S3D значительно лучше играют вторым ходом, чем первым, а 2S2D и 4D первым ходом показывают относительно лучшие результаты, чем вторым.


Тем не менее, моя база слишком мала для более интересных исследований (например, как выглядят расклады в противостоянии друг с другом), и она не лишена субъективности - это все-таки все мои партии, и мой персональный стиль однозначно отразился на результатах. Потому для продолжения исследований я попрошу скинуться на донат в виде данных своих партий, это очень поможет увидеть объективную картину.
Reply
#6
(05-24-2021, 06:42 PM)AlexB Wrote: Тем не менее, моя база слишком мала для более интересных исследований (например, как выглядят расклады в противостоянии друг с другом), и она не лишена субъективности - это все-таки все мои партии, и мой персональный стиль однозначно отразился на результатах. Потому для продолжения исследований я попрошу скинуться на донат в виде данных своих партий, это очень поможет увидеть объективную картину.

Я сделаю, сделаю... Чу-чуть разгребусь - и будет донат Smile
Reply
#7
(05-18-2021, 10:41 AM)AlexB Wrote: Я спрашивал, технически это возможно, но требует написания специального парсера. Партии хранятся в бинарном виде, их нужно расшифровывать и складывать в сsv формате, чтобы из них можно было достать нужную инфу. И далее нужно из них доставать кусочки нужной информации и переводить в формат, который уже можно анализировать, что тоже простыми инструментами типа Excel сделать может не получиться.
Пока Админ занимается более насущными задачами для сайта было бы неправильно его грузить второстепенной задачей.

А если архив игр сделать публичным ?
Reply
#8
(05-25-2021, 07:34 AM)Alkonaft Wrote: А если архив игр сделать публичным ?

А вот это может быть вполне реализуемой идеей. Я только предложил бы одну оговорку, по крайней мере на какое-то время: делать публичными партии старше 1 года.

Думаю понятно, почему.
Reply


Forum Jump:


Users browsing this thread: 7 Guest(s)