Рейтинги шашечных программ

Главная Форумы Шашечные программы Шашечные программы Рейтинги шашечных программ

Просмотр 15 сообщений - с 16 по 30 (из 72 всего)
  • Автор
    Сообщения
  • #370658
    Kallisto
    Участник

    Если будут считаться рейтинги по результатам таких матчей — народ будет бояться играть.

    Народ и так боится играть.

    Не хотите ли заодно ввести отдельные рейтинги на «5 секунд на ход», «10 секунд на ход» 😆 Результаты могут быть о-о-о-чень разные.

    Нет, результаты будут похожими. Но чем больше времени, тем меньше будет разница между слабыми и сильными.
    А до контроля «время на ход» мы не опустимся :)

    #370659
    Alkand
    Участник

    Но тут дело в том, что в турнирах выступали разные версии программ. Так что мы по-любому хорошего рейтинга не получим.

    Зато это будет реальный турнирный рейтинг программ.
    А то ведь как можно сделать. Сыграла программа плохо, заявляешь, что выступала тестовая версия. Сыграла удачно — значит самая последняя :D

    #370660
    NS
    Участник

    Варианта два (ЭлоСтат мне тоже не нравится)
    1. Посчитать рейтинги Сонаса — тут результат расчета моей программой совпадает с результатом расчета программы Игоря.
    2. Посчитать рейтинги Эло, у меня напиана программа, считает вместе с доверительными интервалами. Сейчас попробую её найти и посчитать…
    Если кому интересно могу расписать математику расчета рейтингов Эло методом наибольшего правдоподобия. Максимизруемая функция очень простая. (это функция дает вероятность того что при данных рейтингах случится получившийся результат всех микроматчей)
    Доверительные интервалы зависят от вероятности ничьи.

    #370661
    Kallisto
    Участник

    А то ведь как можно сделать. Сыграла программа плохо, заявляешь, что выступала тестовая версия. Сыграла удачно — значит самая последняя :D

    Обычно так и делают :)
    Вот почему мне интересны только рейтинги программ с отрытым протоколом. Можно провести сколько будет угодно партий и для всех версий этой программы. И тогда объективная сила сила игры будет очевидна.

    NS wrote:
    Доверительные интервалы зависят от вероятности ничьи.

    Фиксированной вероятности ничьей нет. Она зависит, от силы соперников, или даже от их стиля.

    #370662
    NS
    Участник

    Фиксированной вероятности ничьей нет. Она зависит, от силы соперников, или даже от их стиля.

    то что я выкладывал счтает доверительные интервалы для худшего случая… прстейший способ — задается вероятность ничьи для равных соперников, при разнице в силе вероятность ничьи высчитывается. Примерно как в BayesElo, только у них кривая формула.

    Вобще формула логарифма вероятности результата матча —
    (КоличествоПобед*ln(ВероятностьПобеды)+КоличествоПоражений*ln(1-ВероятностьПобеды))*С

    Где С — константа для данной игры, и зависит от вероятности ничьи…
    сами рейтинги от константы C не зависят, от неё зависят только доверительные интервалы.

    КоличествоПобед=Выиграли+Ничьих/2
    КоличествоПоражений=Проиграли+Ничьих/2

    Худший случай доверительных интервалов, для случая когда ничья невозможна C=1

    #370663
    alemo
    Участник

    Мне тут так и не ответили на вопрос — зачем нужны эти рейтинги ? Похоже никто над этим особо не задумывался. Для дела они могут нанести огромный вред. И если раньше «тренировочные» 😆 матчи игрались, то теперь врядли будут. Какая от этого польза ?

    АЛЕМО

    #370664
    NS
    Участник

    Ранжирование движков никакого вреда нанести не могут.
    Во первых это интересное занятие для многих людей (проводить турниры между движками)
    Во вторых многим интересно — какова всё-таки разница в силе между движками, и какова их иерархия.

    #370665
    Kallisto
    Участник

    Мне тут так и не ответили на вопрос — зачем нужны эти рейтинги ?

    Ответ кажется очевиден. Чтобы знать в какую силу играет та или иная программа. Сейчас об этом судить просто невозможно.

    #370666
    plus600
    Участник

    …Во вторых многим интересно — какова всё-таки разница в силе между движками, и какова их иерархия.

    Простите, а сколько у нас есть ДВИЖКОВ? И сколько из них сильных настолько, чтобы они были интересны не только создателям?

    #370667
    NS
    Участник

    Простите, а сколько у нас есть ДВИЖКОВ? И сколько из них сильных настолько, чтобы они были интересны не только создателям?

    Пользователям интересны не только сильные движки.
    А движков — только под интерфейс Каллисто уже написаны движки четыремя авторами, а если добавить движок Александра Быкова — то получается уже пять авторов. Это русские шашки.
    Я выложу еще версии в пул и бразильские, сейчас начал настраивать ОФ в чеккерс. Движков не так уж и мало, даже под этот протокол. Причем каждый движок имеет несколько версий.

    #370668
    plus600
    Участник

    То есть, ответ на мой второй вопрос — один.

    #370669
    NS
    Участник

    Нет, ответ другой — пользователям интересны не только сильные движки.

    #370670
    alemo
    Участник

    сейчас начал настраивать ОФ в чеккерс.

    Otlichno !

    Ne koristi radi … Pomosh trebuyetsya ? Mogu i poigrat s dvizhkom, kogda budet gotov. Koroche — budu rad pomoch chem mogu … esli nado 😆

    Chem bolshe dvizhkov v checkers — tem luchshe ! Mozhet bit dazhe imeet smisl dobavit ego k CheckerBoard 💡 kogda vse budet gotovo.

    Aleksandr

    #370671
    NS
    Участник

    Otlichno !

    Ne koristi radi … Pomosh trebuyetsya ? Mogu i poigrat s dvizhkom, kogda budet gotov. Koroche — budu rad pomoch chem mogu … esli nado

    Chem bolshe dvizhkov v checkers — tem luchshe ! Mozhet bit dazhe imeet smisl dobavit ego k CheckerBoard kogda vse budet gotovo.

    Aleksandr

    Пока я посчитаю оценку через баланс шашек. Выложить смогу только в конце июня. А потом уже, после первой версии начну думать о поиске позиционных признаков.

    #370672
    Kallisto
    Участник

    И сколько из них сильных настолько, чтобы они были интересны не только создателям?

    Какое это имеет значение? Неужели ответ на этот вопрос что-то меняет?

    Ну допустим четверым это интересно. Или предположим четырем сотням. Что от этого изменится?

Просмотр 15 сообщений - с 16 по 30 (из 72 всего)
  • Для ответа в этой теме необходимо авторизоваться.