Парсер заказов и обработчик данных

Артём19 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
25.11.2012

Нужно сделать под Windows программу которая будет парсить из интернета (по списку ссылок) хтмлки - заказы. Из них брать данные (имя, фамилия, телефон и т.д)

Программа будет состоять из двух программ. Клиентская и сам парсер.

Парсер должен иметь возможность работать мультипоточно.

Через клиентскую программу можно будет просматривать напарсенные заказы, фильтровать их. Поиск по конкретной колонке: например показать все заказы в которых есть конкретный номер телефона. Поиск по заказам.

Парсер будет запускаться (скорее всего) ежедневно т.к. будут появляться новые заказы, которые нужно будет добавить в базу.

Сама база должна быть НЕ в виде текста, а какой нибудь бинарник, для того, что бы просматривать базу можно было бы ТОЛЬКО через клиентскую программу.

Есть несколько сайтов (до 20ти штук) на одном движке, но хтмл код может чуть-чуть отличаться (цвет фона другой, присутствует или отсутствует доп. поле...). Все ссылки на заказы выглядят по типу: http://вебсайт/md5/номер_заказа/index.html

где md5 это контрольная сумма номера_заказа

То есть по сути в программу будет вбиваться от 1000 до 2000 и программа пробежится по всем номерав в этом промежутке.

В каждом заказе есть ссылки на прикрепленные файлы. В клиентской версии при просмотре заказа должна быть опция скачать прикрепленные файлы с конкретного заказа.

Опция экспорта в эксель по заданному фильтру

Тест на ботов: напишите в заявке на каком языке программирования собираетесь реализовать проект.