Давно интересовало: как Вы выбираете гонки для загрузки? Пока заметил такую закономерность: почти все марафоны попадают и почти все гонки в Битце (но, например, вечерняя гонка в Битце этого года не попала). А вот гонки в Волкуше или в Ромашково там не представлены совсем. Спринтов нет. Гонок в М. области нет почти. Есть ли у Вас какая-то система в принципах отбора?
не хватает времени, а вот гонки Памяти друзей и Подольских курсантов там есть Спишись с ним может есть возможность и тебе самому добавлять протоколы. Или ввести лыжероллерный раздел? Там тебе есть на что полюбоваться
Критерий отбора очень простой: 1) доступность протокола в электронном виде (doc, xls, html), но не pdf (его приходится распознавать и появляется много ошибок) 2) достаточная "представительность" гонок -- чтобы было хотя бы 20 человек в группе 3) спринты не поддерживаются, поскольку там нужна несколько другая модель данных, нежели в дистанционных гонках
Абсолютно любой пользователь может самостоятельно зарегистрировать соревнование, приложить Положение или Протокол.
К сожалению, в этом году сразу несколько крупных марафонов стали фофрмлять свои протоколы в pdf, из-за этого пострадала полнота.
В принципе мне сейчас удалось PDF перегнать в текст, годный для последующего парсинга, единственно русские буквы покорежились, сейчас воюю с этим... Если что-то получится - дам знать.
На самом деле все банально просто. Я сначала хотел написать программу, которая бы преобразовывала PDF обратно в XML. Преобразование XML в PDF я делал миллион раз с использованием XSLT, Apache FOP или iText. Оказалось однако, что обратная задача не так проста, как кажется. iText позволяет вытащить текст обратно из XML-документа, с его помощью мне удалось получить текстовый файл. Но файл этот имел не совсем регулярную структуру, алгоритм парсинга которой был бы сложен. Поэтому я попытался разобраться в структуре PDF файла (стандарт ISO 30002), чтобы понять, как осуществляется разметка таблиц. Но документ, описывающий этот стандарт стоит 250 швейцарских франков, бесплатного мне найти не удалось. В итоге меня посетила очередная гениальная идея, подсказанная ленью - я пошел в отдел документации и попросил клерков подсказать, как можно конвертнуть PDF в Word (потому, что конвертнуть в HTML из Word - пара пустяков). Они мне подсказали программу PDF Solid Converter, которая, как оказалось, позволяет осуществлять прямую конвертацию из PDF в HTML. Я ее скачал, установил и получил результат, который отправил вам. Есть трайл на 15 дней без ограничения функциональности, сама программа стоит $80, но в сети можно найти и ломаные со снятым трайлом. Хотя мне хочется все-же написать такую программку самому, буду пробовать разбираться потихоньку. Скорее всего, надо просто найти правильную библиотеку.
Во, нашел! Оказвается компания Solid Documents, которая разработала программу PDF Solid Converter, предоставляет свою библиотеку классов Solid Framework (в версии Professional edition SDK) по Development License бесплатно: Вот текст программы конвертации: Только вот я в .NET не шарю...
: 3) спринты не поддерживаются, поскольку там нужна несколько другая модель данных, нежели в дистанционных гонках
По идее, надо убрать и результаты Супер-сотен, ибо там по положению засчитывались все результаты больше 50 км, а в протоколлере всем, кто преодолел меньша 100 км записано DNF.
кстати, всем рекомендую протоколлер можно быстро найти результат гонки, результатЫ конкретного человека за многие годы
и особенно рулит функция сравнения добавляешь к сравнению 2х (и более) человек и система выдает тебе все гонки, где эти люди пересекались
так же рекламодателям, да и просто меценатам, стоит обратить внимание. Как-то поддержать отличный проект, живущий на голом энтузиазме ...кстати, посещаемость высокая
Что значит "все заявленные соревнования"? Если речь идет о календаре соревнований, то он есть, но сейчас пуст, поскольку показывает только соревнования в будущем.
Новогодняя гонка в Битце. Там правда ошибки в протоколе есть, И Имя повторено два раза, один с результатом, второй н\а. И всех кто не стартовал прописали как dnf. Так что вроде все ок. ну а вопрос по почте который - принципиальный, приписали час ))
я так понял, что есть соревнования, у которых можно только скачать отдельно протокол, но их не будет в списке по спортсмену. То есть дистанции синенькими не отмечаются и на них нельзя щелкнуть: например, последний Праздник Севера.
у кого нибудь был опыт исправлять протоколы на этом сайте ?
Кто знает модераторов или их контакты?
спасибо