Программа или PHP скрипт парсинга Яндекс Новостей

Юрий10 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
22.09.2017

Алгоритм работы программы:

1 - В поиск Яндекс Новостей вбиваем рандомный запрос, например, 2 разных запроса: "третьяковская галерея" и "третьяковка". Выбираем нужный период, например: 1-3 сентября.

Получаем что-то вроде этого http://screenup.ru/59c2fb898afbfe4e07ad4fa9 и http://screenup.ru/59c2fb248afbfe4e07ad4fa8

2 - Теперь нужно "сграбить" получившиеся результаты из поисковика (все страницы) и преобразовать их в табличный вид такого типа (пример: https://yadi.sk/i/6DqgWk0j3N6RMX)

3 – Затем новости нужно отсортировать по дате нарастающим итогом, также преобразовать слова "сегодня" и "вчера" в соответствующие даты.

4 – Далее нужно проверить и зачистить их от дубликатов. Дублирующие строки объединяются через точку с запятой в ячейках "Текст под заголовком упоминания" и "Поисковый запрос".

5 - После всех преобразований получившуюся таблицу нужно выгрузить в .xls файл, либо отобразить в виде пригодном для корректного копирования данных в Excel.

Заявки фрилансеров