Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Нужно написать скрипт, который удалит рекурсивно в html файлах внешние ссылки и 404 ссылки.

Есть папки с html и htm файлами, в них нужно:

1.  Удалить все внешние ссылки, кроме ссылок с доменов которые перечислены в файле whitedomains.txt. 

2. Удаление 404 ссылок, указанных в файле 404.txt

После прохода должна генериться папка OUT с обработанными файлами, которая дублирует структуру исходной корневой папки.

Интерфейса не нужно.

Для тестов я пришлю все файлы с заполненными примерами. 

4 года назад
faulton
Антон 
45 летЛитва
11 лет в сервисе
Был
2 месяца назад