Парсер и анализатор текста поисковых систем
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Парсер и анализатор текста поисковых систем google.com, yandex.ru, mail.ru.
ТЗ:
На входе фраза или список фраз, например, «пластивковые окна”. Ход последующих действий:
- Программа вбивает данную фразу (или все фразы последовательно) в Яндексе, в Google, в Mail (по выбору).
- В случае выскакивания капчи, выводить сообщение для ввода цифр с картинки и продолжения работы;
- Берет указанное количество первых сайтов;
- На выбранных сайтах находит и копирует предложения с вхождением текущей фразы (поиск не только точного вхождения, но и словоформы, т.е. в другом падеже или числе и т.д.);
- Формирует xls (csv), где с каждой новой строки размещает все найденные предложения в виде:
Современное производство позволяет изготавливать #a#пластиковые окна#/a# из экологически чистого материала, обеспечивая большую долговечность конструкции.
т.е. указанную фразу выделяет тегами #a# и #/a#.
Visual Studio 2008, MFC, boost, STL, C/C++ с