Консольный php скрипт, регэкспы
Важно! Бюджет окончательный, не нужно подавать заявку с бОльшим бюджетом
Функционал примитивный, нужно проходиться по всем файлам в фолдерах и сабфолдерах и выполнять поиск/замену:
(?is)]*>(.*?)
меняем на $1
Ну или любую другую вашу команду, я просто привел пример. Главное, чтобы детектились ссылки, проставленные невалидно, на нескольких строках и т.д
Ну т.е. по факту удаляем активную ссылку, оставляя только анкор.
Нужен файл конфига, в котором:
1. указываются расширения файлов, в которых идет поиск (htm, html, php, css, txt). Если расширения нет - значит не трогаем этот файл.
2. указана ссылка на файл txt, в котором указываются домены-исключения:
и т.д., по 1 домену на строчку
Если находим ссылку с этим доменом, но не трогаем ее.
Т.е. работа выглядит так. Я запускаю в консоли скрипт командой наподобие такой:
php script.php /home/sites/myfolder
1. Скрипт создает копию указанной папки /home/sites/myfolder-processed (копируется, разумеется, вся папка целиком, со всеми файлами, не только с теми, в которых будем работать)
2. Отрабатывает в этой папке.
3. После окончания работы в папке запуска создается лог удаленных ссылок, файл должен называться по темплейту myfolder-date-log.txt