Написать функцию получения массивов анкоров и пассажей из HTML на PHP
Нужны 2 функции на PHP, которые будут парсить HTML конкретного сайта
на выходе массив.
Функция парсинга анкорных текстов
анкоры: анкор
функция парсинга пассажей
пассажи: последовательность слов от одного знака препинания до другого. пример (consectetur adipiscing elit) - это один из 3х пассажей текста "Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod..."
...примерно так ...
$url = "https://....";
$file = mb_convert_encoding(file_get_contents($url), "UTF-8"); //загружаем страничку по указанному в параметрах URL
var_dump (filterAnkors($file));
var_dump (filterPassages($file));
...
function filterPassages($text)
... return $out;
function filterAnkors($text) {
// $text - html страницы сайта
...
foreach(... )
{
$ar [] = array(
"item" =>
"tag" =>
);
}
return $out;
}