Что я хочу от базы данных по русским шашкам.

Главная Форумы Шашечные программы Базы шашечных партий Что я хочу от базы данных по русским шашкам.

Просмотр 15 сообщений - с 91 по 105 (из 117 всего)
  • Автор
    Сообщения
  • #345390
    plus600
    Участник

    Разборку такого формата в русские добавил, программу выложил. Получается вот так:
    [Date «2005.10.31»]
    [White «Oziel Carvalho»]
    [Black «Cauzari Freire»]
    [Result «1-0»]
    [Gametype «25»]
    1.ed4 ba5 2.dc5 d:b4 3.a:c5 fe5 4.gf4 e:g3 5.h:f4 gf6 6.de3 fg5 7.ba3 gh4
    8.cd2 hg7 9.cb4 a:c3 10.d:b4 gf6 11.ab2 fg5 12.ed2 ef6 13.dc3 de7 14.cd4 ed6
    15.c:e7 f:d8 16.ba5 fe7 17.ab4 ed6 18.bc5 d:b4 19.a:c3 ab6 20.ba3 ba5 21.dc5 ba7
    22.cd4 cb6 23.gh2 de7 24.fe5 ef6 25.e:g7 h:f8 26.hg3 fg7 27.gf4 gh6 28.fe5 ab4
    29.cd6 bc5 30.d:b6 a:e7 31.a:c5 ef6 32.e:g7 h:f8 33.cd6
    1-0

    по-прежнему удобнее работать через буфер обмена. Если так устроит, то завтра могу обновить версию бразильских.

    #345391
    Alkand
    Участник

    Я не знаю, что такое буффер обмена 😯 Я предпочитаю работать с программами, в которых их поведение прогнозируется. Например, я открываю файл с партиями турнира числом 77, и я хочу увидеть список этих 77 партий.
    В данном случае я открыл Плюсом файл в текстовом формате с партиями в русские шашки. По-моему, в таком виде готовят партии для брошюр Ростовиков и Виноградов

    165. В.Ефименко — Т.Турчин
    1.ab4 ba5 ba3 ab6 ed4 fe5 df6 eg5 de3 gh4 ed4 hg5 de5 df4 ge5 gf6 9.eg7 hf6 cb2 cd6 ed2 fe5 bc5 bd4 fg3 hf2 ge7 fd6 de3 ef4 ab4 fd2 17.ce1 ac3 bd4 gf4 ab2 dc5 db6 ba7 bc7 db6 bc3 bc5 1/2:1/2

    166. Г.Рященко — Т.Турчин
    17.ce1 ac3 bd4 gf4 ab2 dc5 db6 ba7 bc7 db6 ef2 bc5 ba3 cd4 fg3 fe3 25.gh4 ef2 26.hg5 1/2:1/2

    167. Т.Турчин — Н.Комаренко
    1.ab4 ba5 ba3 cb6 ab2 bc5 ed4 ce3 fd4 dc5 db6 ac7 cd4 fe5 df6 ge5 9.bc3 hg7 de3 ed6 gf2 gf6 cd2 ab6 gh4 bc5 fg3 cb6 ba5 ba7 ac7 db6 17.cd4 ec3 db4 ba5 ef4 ac3 fg5 hf4 gc7 ab6 ca5 fg7 hg3 fe5 gf4 eg3 5.hf2 1/2:1/2

    Плюс саму партию распознал, но ввел заголовков, да и занес в базу ТОЛЬКО ПЕРВУЮ партию. А хотелось бы сразу весь турнир 🙄

    #345392
    plus600
    Участник

    Буфер обмена (clipboard) это штатное широко используемое на практике средство Windows (то что позовляет вырезать, копировать, вставлять и передавать куски текста, изображений и т.п. между приложениями). Я думаю Вы очень часто пользуетесь этими возможностями, например в Worde (есть даже термин, сделать документ методом Cut-And-Paste). Это позволяет избежать записи в промежуточные файлы и сильно упрощает работу.
    Тоже самое реализовано и в Plus, достаточно выделить текст партии в Worde, взять этот кусок в буфер обмена (обычно это клавиши Ctrlp-C — Сut), потом перейти в Plus и вставить эту партию, пункт меню Загрузить из буфера обмена (или стандартное сочетание клавиш Ctrl-V — Paste) и партия загрузится на экран, после чего ее можно загрузить ее в базу партий. Откуда их уже резонно большим куском выгрузить в PDN файл.
    Разумеется, тоже самое должно быть реализовано и при загрузке в текстовом файле. Однако, я никогда не утверждал, что реализована множественная загрузка из текстового файла. Поверьте, задача разборки неформализованных заголовков партий задача весьма нетривиальна — не зря придумывали формат PDN. Согласитесь, что формат заголовков двух Ваших примеров ничего общего не имеет.
    Если Вы хотите «открыть файл с партиями турнира числом 77, и увидеть список этих 77 партий», то для свободного формата заголовков партий сделать это просто не реалистично. Без ручной работы здесь не обойтись, соответственно исходя из этих соображений у меня пока нет поддержки загрузки множественного числа партий из формата TXT (для PDN это есть, работет и пишет сразу в базу).
    Для отдельного формата заголовков я такую работу готов проделать, но в общем виде не готов. Возможно, в результате этой конкретной работы будет реализовано более-менее общее решение, но уж точно неполное, то есть всегда останутся заголовки, которые не будут полностью распозноваться.
    Делать?

    #345393
    Alkand
    Участник

    Сергей,
    спасибо за подробное объяснение. Благодаря ему я только теперь смог оценить какую огромную и полезную работу проделал А.Свирин, сделав такую утилиту для «формата переписочников».
    Давайте сейчас попробуем это сделать для бразильских. Я давал ссылку на 12 сборников бразильских партий. Мне кажется, они все ведены в одном формате, и мы можем получить пару тысяч партий в формате ПДН. Это неплохо для старта работы над бразильской базой.
    Александр.

    #345394
    Kavr
    Участник

    Привет, Сергей!

    Виталий, привет!

    Конечно в этой теме (осообенно в моем общении с Антоном) много эмоций, да и маркетинга хватает. Не хочу вдавать в тяжелые споры у кого дл…, черт, у кого «давнее». Но три позиции прокоментирую.
    1. Я совершенно не согласен с «равенством» по п.5 — все таки позиций в той версии 8-ми фигурной базы окончаний у Plus было гораздо больше, так что ставим знак «>». Если я не прав — напиши, у меня только оценки вашей частичной базы.

    Ну очень сложно судить о скорости наполнения базы, важен результат. Пример абстрактный:
    1.Если человек быстренько за месяц написал алгоритм, который наполнян базу 11 месяцев
    2.Человек 11 месяцев писал отточенный алгоритм, который наполнял базу 1 месяц.
    Результат по времени один и тот же.
    Можно ли назвать первого человека лидером в их соревновании, хотя на 7 месяце у него было больше позиций в базе?

    Больше года назад у нас было сгенерено больше половины позиций, полной восьмифигурной базы, но затем мы отказались от использования этого алгоритма (который догенерил 8вку у поддавков) в пользу переделки под более быстрый и оптимальный, который сможет затем сгенерить и девятку и десятку когда-нибудь. Сравнивать сколько позиций было в неполной базе сложно и не нужно на мой взгляд.

    2. Я говорил о бесплатной доступности базы подчеркиваю именно доступность. И именно это позволяет мне говорить о том, что сейчас равенства тоже нет. Не по количеству позиций, а именно с точки зрения обычного пользователя.
    3. Я не оспариваю того факта, что долгое время проект Тундра по базам окончаний лидировал. Но, после генерации 150 миллиардной базы окончаний два года назад, Plus это дидерство перехватил и удерживает до сих пор. Видимо, ждать равенства осталось недолго, но посмотрим на дальнейшее развитие.

    Не могу с этим согласиться. Тундра приступила к генерации 9ти фигурной базы.

    На данный момент у Тундры есть 8ми фигурная ранговая база по русским шашкам + 100 миллиардов позиций 9ти шашечной базы.
    У Плюс600 есть 8ми фигурная безранговая, но доступная база по русским шашкам.
    Ты считаешь, можно количественно сравнивать ранговость, доступность и миллиарды позиций? Я так не считал и не претендовал на лидрество, поэтому и писал равенство, но если так, то можешь ли ты оценить, что:

    ранги+100млрд позиций 9ти шашечной базы < доступность? Я не согласен. Слишком безкомпромиссно ты споришь. Еще по поводу доступности хочу отметить робот на сайте Тундры. База (7ми шашечная) доступна для пользования даже без скачивания и установки программы. Была разработка впервые вывевшая базы данных по русским шашкам в wap. Это все тоже не считается? С уважением, Виталий.

    #345395
    plus600
    Участник

    Привет, Виталий!

    Я писал о сравнении доступных баз данных. У кого, когда, сколько было сгенерено абсолютно не имеет смысла сравнивать. Повторюсь еще раз, в доступных (тогда) частичных 8-ми фигурных базх у Plus было гораздо больше позицией. Только это и имел ввиду.
    И «ранги+100млрд позиций 9-ти шашечной базы < доступность?" - конечно меньше! Но только с позиции конечного пользователя. С точки зрения спортивного достижения, конечно больше. И я тут не спорю, это моя позиция - что на первом месте интересы пользователя. У кого то может быть по-другому, и я эту позицию не оспариваю, она тоже резонна, вопрос только в том какие цели ставить. Реально они у нас различаются, но ничего страшного в этом не вижу. Мы же не стометровку бежим :wink:
    Давай этот спор прикроем? Все окружающие уже наши позиции поняли, и смысла дальше это обсуждать я не вижу.

    Кстати, про форум (если не надоел, но это тоже к теме о доступности) «103 Произошла Ошибка!: Невозможно открыть 1025991760.data» — такое получаешь когда на Тундровском форуме пытаешься открыть тему. И длится это больше года.

    #345396
    plus600
    Участник

    Сергей,
    спасибо за подробное объяснение. Благодаря ему я только теперь смог оценить какую …

    Александр, а что такое «буфер обмена» теперь стало ясно? 😉 Ведь мне тоже «хочется работать с пользователями, поведение которых прогнозируется» 🙄

    #345397
    Kavr
    Участник

    Конечно закончим, Сергей! Я ведь и спорил, то потому, что ты формулировал в общем плане: «Бесспорное лидрество» и т.п. Да безусловно для конечного пользователя доступность базы важный элемент, хотя и в этом сравнении не стоит забывать о возможностях пользоваться базой Тундры через web и wap. По поводу форума не совсем понял, сейчас напишу email, спасибо!

    Виталий.

    #345398
    Alkand
    Участник

    Из Ворда не нужно. А вот из такого формата —
    MARIO JOSE SANTOS 1 — CARLOS CAVALCANTE 1
    1. a3-b4 b6-c5 2. b2-a3 f6-g5 3. c3-d4 g7-f6 4. d4xb6 c7xc3
    5. d2xb4 h8-g7 6. g3-f4 d8-c7 7. b4-c5 d6xb4 8. a3xc5 g5-h4
    9. a1-b2 f6-g5 10. b2-c3 g7-f6 11. c1-b2 c7-d6 12. c3-d4 d6xb4
    13. d4-e5 f6xd4 14. e3xa3 g5xe3 15. f2xd4 h6-g5 16. a3-b4 b8-c7
    17. b4-c5 g5-f4 18. e1-f2 c7-b6 19. f2-e3 f4xd2 20. h2-g3 h4xf2
    21. g1xc1 e7-d6 22. c5xe7 f8xd6 23. c1-d2 b6-a5 24. d2-e3 d6-c5
    25. d4xb6 a7xc5
    хорошо бы.

    Спасибо Антону Шевченко, приславшему программу-конвертор из данного формата в формат PDN. Качайте ее из архива файлов. Конвертит весь файл полностью.
    Остается только поправить заголовки партий по игрокам, турниру и году. Мне это удобнее делать в Авроре.:roll:

    #345399
    plus600
    Участник

    Александр,

    может я чего то не понимаю, но этот конвертор делает только часть (и самую простую) работы. А как же с контролем ходов? С именем черного игрока?
    Вот пример конвертации из текста с невозможным ходом:


    исходный


    MARIO JOSE SANTOS 2 — CARLOS CAVALCANTE 0
    1. a3-b9 b6-c5


    результат


    [White «MARIO JOSE SANTOS»]
    [Black «»]
    [Result «2-0»]
    1. a3-b9 b6-c5



    И Вас это целиком устраивает?

    #345400
    sancoder
    Участник

    Сергей, это третья версия, которая читает последний файл. Тот пример, который привел Alkand, читался первой версией. Там еще в исходнике остался некомпилируемый код (после return в функции).

    #345401
    sancoder
    Участник

    Главное не то, что программа делает, а результат. К сожалению, многие программисты об этом забывают.

    #345402
    plus600
    Участник

    Главное не то, что программа делает, а результат. К сожалению, многие программисты об этом забывают.

    И я именно об этом, результат то неполный (см.постановку задачи).

    #345403
    sancoder
    Участник

    Опять 25. Результат заключается в том, что не надо 77 раз копировать части файла в буфер обмена. А можно один раз прогнать весь файл, а потом какой-то другой программой (Бор?) проверить на ошибки. Необязательно же следовать принципу «пользуюсь только программами серии …» :D

    #345404
    plus600
    Участник

    Вот именно, опять двадцать пять. Я пишу, что результат не соответствует требуемому, а ты пишешь, что задачу можно решить по другому. Можно, я и не спорю (можно даже ручками теги вставить и переименовать файл — особых проблем нет). Только задача ставилась по другому и результат заказывался другой.
    Кстати, не нужно 77 раз в буфер обмена копировать, вполне достаточно одного раза.

Просмотр 15 сообщений - с 91 по 105 (из 117 всего)
  • Для ответа в этой теме необходимо авторизоваться.