Парсинг ссылок html, чистка битых

Андрей16 років у сервісі
Дані замовника будуть вам доступні після подання заявки
01.12.2016

Задача следующая:

есть сайт на php+mysql. В базе есть текстовое поле, в котором хранится html код. В html среди прочего прописаны ссылки вида Часть из которых некорректно оформлены, часть не возвращает 200 (404, не отвечает, нет домена и т.д.).

Выгрузку (примерно 41 000 строк) предоставляю. Задача обработать файл, исправив некорректные и затем удалив не открывающиеся.

Заявки фрілансерів