Доработать функцию парсинга всех внутренних ссылок
Написал функцию для получения всех внутренних ссылок со страницы, заданных абсолютным путем:
$vnut=array();
$parsedUrl=parse_url($url);
$host=$parsedUrl['host'];
preg_match_all('/
foreach ($matches[2] as $val) {
$vnut[]=$val;
}
$vnut=array_unique ($vnut);
В принципе, догадываюсь как сделать регулярное выражение и для получения ссылок с относительным путем, но уж больно не хочется где-нибудь чего-нибудь не учесть.
Таким образом, ваша задача: добавить парсинг по еще одному регулярному выражению, которое получало бы все внутренние ссылки, заданные относительным путем, потом вы должны, в зависимости от формы ссылки (то ли она начинается с href="/products...", то ли с href="products...", то ли с href="./products..." (или какая другая форма), - превратить ее в абсолютную и добавить в массив $vnut.
Если задача не совсем ясна уточню общее предназначение функции - она используется в парсере, который должен проходить по всему сайту в независимости от того как в коде страниц заданы внутренние ссылки.
p.s. еще желательно проверить код моего рег выражения, приведенного выше. Там, по-моему не учитывается вариант, когда после href= нет кавычки.
Цена вопроса 7 $.