Главная › Форумы › Шашечные программы › Шашечные программы › Рейтинги шашечных программ
- В этой теме 71 ответ, 9 участников, последнее обновление 17 лет, 4 месяца назад сделано Kallisto.
-
АвторСообщения
-
07.05.2007 в 20:39 #370658KallistoУчастник
Если будут считаться рейтинги по результатам таких матчей — народ будет бояться играть.
Народ и так боится играть.
Не хотите ли заодно ввести отдельные рейтинги на «5 секунд на ход», «10 секунд на ход» 😆 Результаты могут быть о-о-о-чень разные.
Нет, результаты будут похожими. Но чем больше времени, тем меньше будет разница между слабыми и сильными.
А до контроля «время на ход» мы не опустимся08.05.2007 в 08:48 #370659AlkandУчастникНо тут дело в том, что в турнирах выступали разные версии программ. Так что мы по-любому хорошего рейтинга не получим.
Зато это будет реальный турнирный рейтинг программ.
А то ведь как можно сделать. Сыграла программа плохо, заявляешь, что выступала тестовая версия. Сыграла удачно — значит самая последняя08.05.2007 в 09:13 #370660NSУчастникВарианта два (ЭлоСтат мне тоже не нравится)
1. Посчитать рейтинги Сонаса — тут результат расчета моей программой совпадает с результатом расчета программы Игоря.
2. Посчитать рейтинги Эло, у меня напиана программа, считает вместе с доверительными интервалами. Сейчас попробую её найти и посчитать…
Если кому интересно могу расписать математику расчета рейтингов Эло методом наибольшего правдоподобия. Максимизруемая функция очень простая. (это функция дает вероятность того что при данных рейтингах случится получившийся результат всех микроматчей)
Доверительные интервалы зависят от вероятности ничьи.08.05.2007 в 09:43 #370661KallistoУчастникА то ведь как можно сделать. Сыграла программа плохо, заявляешь, что выступала тестовая версия. Сыграла удачно — значит самая последняя
Обычно так и делают
Вот почему мне интересны только рейтинги программ с отрытым протоколом. Можно провести сколько будет угодно партий и для всех версий этой программы. И тогда объективная сила сила игры будет очевидна.NS wrote:Доверительные интервалы зависят от вероятности ничьи.Фиксированной вероятности ничьей нет. Она зависит, от силы соперников, или даже от их стиля.
08.05.2007 в 09:49 #370662NSУчастникФиксированной вероятности ничьей нет. Она зависит, от силы соперников, или даже от их стиля.
то что я выкладывал счтает доверительные интервалы для худшего случая… прстейший способ — задается вероятность ничьи для равных соперников, при разнице в силе вероятность ничьи высчитывается. Примерно как в BayesElo, только у них кривая формула.
Вобще формула логарифма вероятности результата матча —
(КоличествоПобед*ln(ВероятностьПобеды)+КоличествоПоражений*ln(1-ВероятностьПобеды))*СГде С — константа для данной игры, и зависит от вероятности ничьи…
сами рейтинги от константы C не зависят, от неё зависят только доверительные интервалы.КоличествоПобед=Выиграли+Ничьих/2
КоличествоПоражений=Проиграли+Ничьих/2Худший случай доверительных интервалов, для случая когда ничья невозможна C=1
08.05.2007 в 11:21 #370663alemoУчастникМне тут так и не ответили на вопрос — зачем нужны эти рейтинги ? Похоже никто над этим особо не задумывался. Для дела они могут нанести огромный вред. И если раньше «тренировочные» 😆 матчи игрались, то теперь врядли будут. Какая от этого польза ?
АЛЕМО
08.05.2007 в 11:31 #370664NSУчастникРанжирование движков никакого вреда нанести не могут.
Во первых это интересное занятие для многих людей (проводить турниры между движками)
Во вторых многим интересно — какова всё-таки разница в силе между движками, и какова их иерархия.08.05.2007 в 11:33 #370665KallistoУчастникМне тут так и не ответили на вопрос — зачем нужны эти рейтинги ?
Ответ кажется очевиден. Чтобы знать в какую силу играет та или иная программа. Сейчас об этом судить просто невозможно.
08.05.2007 в 12:56 #370666plus600Участник…Во вторых многим интересно — какова всё-таки разница в силе между движками, и какова их иерархия.
Простите, а сколько у нас есть ДВИЖКОВ? И сколько из них сильных настолько, чтобы они были интересны не только создателям?
08.05.2007 в 13:03 #370667NSУчастникПростите, а сколько у нас есть ДВИЖКОВ? И сколько из них сильных настолько, чтобы они были интересны не только создателям?
Пользователям интересны не только сильные движки.
А движков — только под интерфейс Каллисто уже написаны движки четыремя авторами, а если добавить движок Александра Быкова — то получается уже пять авторов. Это русские шашки.
Я выложу еще версии в пул и бразильские, сейчас начал настраивать ОФ в чеккерс. Движков не так уж и мало, даже под этот протокол. Причем каждый движок имеет несколько версий.08.05.2007 в 13:11 #370668plus600УчастникТо есть, ответ на мой второй вопрос — один.
08.05.2007 в 13:12 #370669NSУчастникНет, ответ другой — пользователям интересны не только сильные движки.
08.05.2007 в 13:13 #370670alemoУчастниксейчас начал настраивать ОФ в чеккерс.
Otlichno !
Ne koristi radi … Pomosh trebuyetsya ? Mogu i poigrat s dvizhkom, kogda budet gotov. Koroche — budu rad pomoch chem mogu … esli nado 😆
Chem bolshe dvizhkov v checkers — tem luchshe ! Mozhet bit dazhe imeet smisl dobavit ego k CheckerBoard 💡 kogda vse budet gotovo.
Aleksandr
08.05.2007 в 13:17 #370671NSУчастникOtlichno !
Ne koristi radi … Pomosh trebuyetsya ? Mogu i poigrat s dvizhkom, kogda budet gotov. Koroche — budu rad pomoch chem mogu … esli nado
Chem bolshe dvizhkov v checkers — tem luchshe ! Mozhet bit dazhe imeet smisl dobavit ego k CheckerBoard kogda vse budet gotovo.
Aleksandr
Пока я посчитаю оценку через баланс шашек. Выложить смогу только в конце июня. А потом уже, после первой версии начну думать о поиске позиционных признаков.
08.05.2007 в 13:42 #370672KallistoУчастникИ сколько из них сильных настолько, чтобы они были интересны не только создателям?
Какое это имеет значение? Неужели ответ на этот вопрос что-то меняет?
Ну допустим четверым это интересно. Или предположим четырем сотням. Что от этого изменится?
-
АвторСообщения
- Для ответа в этой теме необходимо авторизоваться.