Парсер текстов ПС: google, yandex, yahoo
Необходимо написать функцию-парсер для получения текстов с сайтов выдачи 3-х поисковых систем: google, yahoo, yandex.
Необходимо так-же написать метод определения основного контента на странице, чтобы не брать навигацию и прочее, т.е. только основной контент, если основной контент меньше N-го количества слов - анализировать другой сайт где кол-во слов будет соответствовать норме.
Функция берет в качестве аргумента ключевое слово, название поисковой системы и минимальное количество слов(если на странице был найден контент меньше этого значения, то перейти к другому сайту); и возвращать функция должна сам текст.
*** Пример функции ***
function p_text('apple company', 'google', 300)
{
//...
return $text;
}
Язык реализации: PHP (совсместимый с 5-й версией)