Разработка скрипта для "очистки" HTML из Word
Павел19 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
01.12.2008
Требуется разработать скрипт для «чистки» и преобразования сохраненного в Word 2000-2003 в виде HTML документа. Выходом скрипта также будет преобразованный HTML-документ. Ниже будет определен порядок и правила преобразования:
1. Из документа, поданного на вход скрипта, удаляются все теги meta со специфичной для Word информацией. Например,
2. Из документа удаляются все теги