Написать парсер контактного e-mail с сайтов
Нужен бот, который ходит по главной странице сайта и линкам, находящимся на ней. По всем этим линкам (с главной страницы) ищет наличие мейлов, мейлы со стоп-листа игнорирует. Эти сайты (домены) находятся в виде исходного списка. Формируется список типа domen.ru; [email protected]; [email protected], каждый домен с новой строки.
По количеству ссылок на морде ставится ограничение, например, не более 50 ссылок. Если превышено количество ссылок на сайте и мейл не найден, то тогда строка вида domen.ru: превышено количество ссылок. Если пройдены все линки и мыло не найдено, то тогда строка вида domen.ru: мыло не найдено. Бот работает, пока не пройдет весь список доменов.
Многопоточность приветствуется.
Если Вы готовы решить эту задачу, в заявке укажите ОБЯЗАТЕЛЬНО срок и стоимость исполнения, иначе заявку не рассматриваю.
Жду Вашу заявку.