Парсер html на php
необходим парсер html
1. выдергивает метатег "robots" и возращает в перменные $page_index=1 если индексация разрешена $page_follow=1 если преход разрешен или 0 если не так, вне зависимости от наличия тега.
2. выдергивает все ссылки (вывести на экран построчно например для теста)
2.1. текст ссылки
2.2. href
2.3. rel
2.4. наличие ссылки в блоке (0 или 1 соответственно)
2.5. ссылка в теле соответственно 1 или 0
3. Исключения
3.1. не учитывается то, что в комметариях
3.2. нормально парсит "кривой" html, невалидный
4. требования: php
ЗЫ0: ссылка, где эта задача почти решена: http://xpoint.ru/forums/thread/37444.xhtml#340427
ЗЫ: сам бы написал, малех не успеваю.
ЗЫ2: в дальнейшем потребуется(возможно) доработка скрипта, и время от времени "подкидываение" новых задач.
предпочтение фрилансерам, с перспективой выполнения некоторых задач на постоянной основе.
цены и сроки.
просьба в приват не писать. проект и так "закрытый" все прочитаю ;)