Парсинг Авито
Нужен парсинг Авито
Алгоритм такой:
1. Есть несколько категорий, например, "Недвижимость", регион Новосибирск, в виде url-ссылок на них (либо как вы это делаете)
2. Переходим по ссылке категории, получаем список URL-ов объявлений с этой страницы.
3. Переходим по каждой ссылке объявления.
4. Сохраняем данные: скриншот страницы в png/jpg (например, через сервис s-shot.ru), обязательно вместе с номером телефона, плюс отдельно в csv или любой другой файл сохраняем данные: дата и время объявления, url объявления, заголовок объявления, номер телефона в объявлении, текст объявления. Всё.
5. Запускаем этот скрипт раз в N часов, проверяя, какие новые объявления появились, если появились - добавляем в список объявлений (csv из предыдущего пункта) и высылаем на e-mail (например, в виде таблицы, почта на яндексе через smtp).
Алгоритм примерно такой. То есть смысл - нужно постоянно получать новые объявления и номера телефонов из них на электронную почту.
Прошу оценить стоимость php-скрипта/парсера, какие потребуются постоянные вложения (прокси?), если есть корректировки по алгоритму к современным реалиям авито - предлагайте.