CasinoParser

Тимченко17 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
04.03.2008

Нужна программа, которая будет забирать страничики с сайта и преобразововать HTML в txt.

Например, есть относительный путь к страницам

/games/handhistory/?gameCode=P4&handNumber=127833676, на определенном хосте,

программа должна выкачивать страницы по этому пути меняя параметр handNumber

в диапазоне который задается в настройках программы.

Другие требования к программе:

1) Прога должна преобразовывать в txt только страницы которые содержат

определенные слова, которые задаются в настройках.

2) После скачивания страницы должны сохранятся в каталоге программы в разных папках

в зависимости от содержимого.

3) Cайт защищен от автоматических скачиваний,

он не отдает страницы с хэндами если идут запросы слишком часто. Здесь нужно перезапрашивать

страницу до тех пор пока сервер не отдаст её. То есть если в тексте страницы текст «Hand not found.»

или страница с ошибкой 404,

то ее нужно перезапросить. Я буду соксифицировать прогу и она будет ходить через

соксы из списка, каждый раз они меняются, здесь основная задача сделать таймаут,

если нет ответа от сайта в течениий 5 секунд, то послать этот запрос повторно

( в этот момент прога соксификатор подставит новый рабочий сокс) и так далее пока

страница с данными не скачаеться.

4) Возможность запуска программы из командной строки с двумя параметрами - верхним и нижним

пределом номеров страниц.

5) Интерфейс программы не должен зависать, во время закачки.

Некоторые уточнения по тз будут даны после выбора исполнителя.

Заявки фрилансеров