CasinoParser
Нужна программа, которая будет забирать страничики с сайта и преобразововать HTML в txt.
Например, есть относительный путь к страницам
/games/handhistory/?gameCode=P4&handNumber=127833676, на определенном хосте,
программа должна выкачивать страницы по этому пути меняя параметр handNumber
в диапазоне который задается в настройках программы.
Другие требования к программе:
1) Прога должна преобразовывать в txt только страницы которые содержат
определенные слова, которые задаются в настройках.
2) После скачивания страницы должны сохранятся в каталоге программы в разных папках
в зависимости от содержимого.
3) Cайт защищен от автоматических скачиваний,
он не отдает страницы с хэндами если идут запросы слишком часто. Здесь нужно перезапрашивать
страницу до тех пор пока сервер не отдаст её. То есть если в тексте страницы текст «Hand not found.»
или страница с ошибкой 404,
то ее нужно перезапросить. Я буду соксифицировать прогу и она будет ходить через
соксы из списка, каждый раз они меняются, здесь основная задача сделать таймаут,
если нет ответа от сайта в течениий 5 секунд, то послать этот запрос повторно
( в этот момент прога соксификатор подставит новый рабочий сокс) и так далее пока
страница с данными не скачаеться.
4) Возможность запуска программы из командной строки с двумя параметрами - верхним и нижним
пределом номеров страниц.
5) Интерфейс программы не должен зависать, во время закачки.
Некоторые уточнения по тз будут даны после выбора исполнителя.