Парсинг encar.com
Нурсултан, ассалам алейкум!
Ищу исполнителя на похожую работу, которую вы явно делали уже не 1 раз))
Интересует парсер 2 сайтов:
1) encar.com
ТЗ:
1) Парсинг необходимо делать в БД MySQL, откуда я уже сам буду выводить информацию на необходимые ресурсы (telegram, www и т.д.). Все изображения будет необходимо складывать в папку, название которой будет являться идентификатором машины. Структуру таблиц БД я предоставлю.
2) Язык программирования парсера PHP. В качестве параметров запуска парсера необходимо использовать: марка, модель, поколение, тип двигателя, Год выпуска от, Месяц выпуска от.
Если язык Python дает какие-то преимущества именно в данной задаче и более предпочтителен по вашему мнению, просьба указать что это за преимущества.
3) Парсить нужно все полезные данные: марка, модель, поколение, коробка, тип двигателя, объем двигателя, привод, пробег, vin, год производства, месяц производства, цена авто, список опций, фотографии, страна продажи авто, город продажи авто. Просьба сообщить какие еще данные можно стянуть? Например, кол-во предыдущих владельцев, кол-во л.с. у двигателя, текущее состояние машины, страховая история, повреждения у машины и т.д.
4) Необходимо удалять из БД снятые с продажи машины. По данному вопросу жду от вас предложений как это лучше делать.
Вопросы:
1) Хотел уточнить как часто на вашей практике эти сайты меняют внутреннюю структуру, которая бы вела к нарушению парсинга?
План действий:
Просьба написать примерный диапазон цены на работу по сайту 1 и 2. Если цена устроит, более точно опишем список работы, уточним цену более точно и приступаем к работе.