Парсинг ссылок html, чистка битых
Андрей16 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
01.12.2016
Задача следующая:
есть сайт на php+mysql. В базе есть текстовое поле, в котором хранится html код. В html среди прочего прописаны ссылки вида Часть из которых некорректно оформлены, часть не возвращает 200 (404, не отвечает, нет домена и т.д.).
Выгрузку (примерно 41 000 строк) предоставляю. Задача обработать файл, исправив некорректные и затем удалив не открывающиеся.