Разработка простого скрипта парсинга на РНР
Необходимо разработать на РНР (без БД) скрипт, который по крону (предполагается раз в сутки) парсит исходный английский сайт, обновляя контент на рабочем.
Разделы для парсинга исходного представлены постоянными ссылками на каждый раздел, размещенными построчно в отдельном файле, который по циклу обрабатывается скриптом.
При парсинге загружаются на отдельный сервер (и отдельный домен) картинки, которые были обновлены, и удаляются старые (признак обновления - имя файла). На страницы рабочего картинки подгружаются с другого сервера. Картинки 2-х жестко заданных размеров.
Все ссылки со страницы на третьи сайты обрезаются спереди по вхождению определенной комбинации символов и выводятся на рабочем (кроме рекламных, которые имеет постоянное место на странице).
Количество страниц, которые парсятся в глубину от исходной ссылки (начала раздела) - 8.
Текстовая часть (заголовки и т.п.) переводятся с помощью предварительно созданного файла-словаря, причем, если сначала используется перевод по фразам, а затем - по словам. Если фраза не обнаружена, просматриваются слова, а если и здесь не найдено, то выводится оригинал без перевода, а слово (фраза) записывается (дописывается) в отдельный файл.
Для оформления используются 3 HTML-шаблона (главная - статична, 1-я внутренняя, 2-я и последующая внутренние) с РНР-вставками.
Тестовые домены и хостинг с FTP предоставляется.
Предоплата возможна исполнителям с опытом и положительными отзывами.
Связь через почту, через неё же дам адрес исходного.
Срок не критичен, в пределах 2-3 недель.
Жду предложений по цене.