Сграбить архив сайта
Артур18 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
20.07.2009
Нужно сграбить архив публикаций с сайта за 2003-2006 года.
http://gazeta.etatar.ru/news/archive/X/month/YYYYMMDD
где:
- X номер категории
- YYYY год
- MM месяц
- DD день
Результат для каждой категории собирается в отдельный файл Word, который содержит все сообщения за весь период.
Т.е. получится 9 файлов.
Чтобы не оперировать громоздкими большими файлами для удобной и быстрой работы их можно разделить на несколько файлов, например по месяцам.
Оформление файла, образец прилагается:
- Название выделено стилями (Заголовок 1),
- Текст оформлен как простой текст (обычный)
- Источник указан курсивом, без активной ссылки, в конце новости.