Доработать функцию парсинга всех внутренних ссылок

Александр16 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
22.02.2010

Написал функцию для получения всех внутренних ссылок со страницы, заданных абсолютным путем:

$vnut=array();

$parsedUrl=parse_url($url);

$host=$parsedUrl['host'];

preg_match_all('/

foreach ($matches[2] as $val) {

$vnut[]=$val;

}

$vnut=array_unique ($vnut);

В принципе, догадываюсь как сделать регулярное выражение и для получения ссылок с относительным путем, но уж больно не хочется где-нибудь чего-нибудь не учесть.

Таким образом, ваша задача: добавить парсинг по еще одному регулярному выражению, которое получало бы все внутренние ссылки, заданные относительным путем, потом вы должны, в зависимости от формы ссылки (то ли она начинается с href="/products...", то ли с href="products...", то ли с href="./products..." (или какая другая форма), - превратить ее в абсолютную и добавить в массив $vnut.

Если задача не совсем ясна уточню общее предназначение функции - она используется в парсере, который должен проходить по всему сайту в независимости от того как в коде страниц заданы внутренние ссылки.

p.s. еще желательно проверить код моего рег выражения, приведенного выше. Там, по-моему не учитывается вариант, когда после href= нет кавычки.

Цена вопроса 7 $.