Создать архив файлов с сайта
Есть старый сайт, написанный в начале нулевых, на нем лежат документы, в разных разделах, в разном виде, в формате doc, xls, pdf и др., и куча статей просто в html. Есть статьи содержащие один или несколько вложенных документов.
Задача создать локальный архив всех этих документов, причем, их нужно скачать, положить в подходящую папку, назвать подходящим именем и заполнить в xml-файлике описание для этого документа.
И потом все это упаковать в zip и отправить мне :)
В идеале - нужен парсер, так как документов на самом деле немало, но, с учетом что нет строгой и четкой структуры хранения документов, нет четких правил где что и как называется и то что операцию нужно проделать разово, наверно нет смысла писать парсер и проще сделать это вручную.
Подробное ТЗ - по требованию