Парсер заказов и обработчик данных
Нужно сделать под Windows программу которая будет парсить из интернета (по списку ссылок) хтмлки - заказы. Из них брать данные (имя, фамилия, телефон и т.д)
Программа будет состоять из двух программ. Клиентская и сам парсер.
Парсер должен иметь возможность работать мультипоточно.
Через клиентскую программу можно будет просматривать напарсенные заказы, фильтровать их. Поиск по конкретной колонке: например показать все заказы в которых есть конкретный номер телефона. Поиск по заказам.
Парсер будет запускаться (скорее всего) ежедневно т.к. будут появляться новые заказы, которые нужно будет добавить в базу.
Сама база должна быть НЕ в виде текста, а какой нибудь бинарник, для того, что бы просматривать базу можно было бы ТОЛЬКО через клиентскую программу.
Есть несколько сайтов (до 20ти штук) на одном движке, но хтмл код может чуть-чуть отличаться (цвет фона другой, присутствует или отсутствует доп. поле...). Все ссылки на заказы выглядят по типу: http://вебсайт/md5/номер_заказа/index.html
где md5 это контрольная сумма номера_заказа
То есть по сути в программу будет вбиваться от 1000 до 2000 и программа пробежится по всем номерав в этом промежутке.
В каждом заказе есть ссылки на прикрепленные файлы. В клиентской версии при просмотре заказа должна быть опция скачать прикрепленные файлы с конкретного заказа.
Опция экспорта в эксель по заданному фильтру
Тест на ботов: напишите в заявке на каком языке программирования собираетесь реализовать проект.