Парсинг ссылок html, чистка битых

Андрей16 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
01.12.2016

Задача следующая:

есть сайт на php+mysql. В базе есть текстовое поле, в котором хранится html код. В html среди прочего прописаны ссылки вида Часть из которых некорректно оформлены, часть не возвращает 200 (404, не отвечает, нет домена и т.д.).

Выгрузку (примерно 41 000 строк) предоставляю. Задача обработать файл, исправив некорректные и затем удалив не открывающиеся.

Заявки фрилансеров