Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

При написании данного софта нужно учесть следующие моменты:

1. web.archive.org висит или почти висит 60% и более времени в сутки! Соответственно прога должна уметь ждать и сама не зависать в момент ожидания! При активации задания раз в час оповещать оператора о состоянии работы!

2. web.archive.org в одно и тоже время может висеть у одного пользователя, а у другого работать вполне нормально (говорят)! Надо продумать, как работать через прокси, если это необходимо! Должна быть реализована многопоточность!

3. web.archive.org может выдавать на запрос какой то конкретной странице сайта, что той нет в архиве, но уже через минут 10-15 мин. при повторном запросе выдавать сохраненную копию. Соответственно прога должна уметь или ждать в случаях когда возможна такая ситуация, либо скачивать аналогичную страницу из более раннего архива данного сайта!

4. Часто рекурсивное скачивание агентом останавливалось после выкачки одной страницы. Т.е., к примеру, при закачке http://web.archive.org/web/20080112014047sh_/www.anglija.ru/ получаем только эту страницу и стили. На web.archive.org стоит защита от рекурсивного скачивания. Они портят все ссылки на странице, добавляя в head:

..

...

wget считает, что все ссылки смотрят за пределы данного сайта и не трогает их. А если закачивать страницу через обычный браузер, то после загрузки отрабатывает javascript и восстанавливает все ссылки:

...

var sWayBackCGI = "http://web.archive.org/web/20080112014047/";

...

url = url.replace('.way_back_stub','');

aCollection[sProp] = sWayBackCGI + url;

...

Т.е. для рекурсивной загрузки сайта из web.archive.org нужно либо специализированное решение, либо загрузчик, который отрабатывает javascript на странице. Сам не пробовал, но умные люди посоветовали Offline Explorer (под Windows) для загрузки, он умеет интерпретировать javascript на странице. А также посоветовали модуль под perl WWW::WebArchive

НЕ ЗНАЮ КАК НА САМОМ ДЕЛЕ! ПРОСТО НАШЕЛ В ИНТЕРНЕТЕ!

Принципы работы:

1. Должна быть реализована возможность добавлять пачки сайтов (до 100 и более)! Пример: http://wpdot.com/wg789/ - не работает почти правда!

2. Возможность выбора приоритетного архива. В случае если архив оператором не задан, то закачивается по умолчанию последний архив!

3. На выходе должна формироваться готовая для закачки на сервер папка. Желательно формирование дополнительной паки для локального просмотра на компьютере! В каждой папке должен находится файл, например 777999info.txt в котором указывается количество скаченных страниц!

4. Максимально возможная скорость скачки

14 лет назад
780058
44 годаРоссия
14 лет в сервисе
Был
2 года назад
Выбранный исполнитель
Tkachenko
35 летУкраина
18 лет в сервисе
Был
8 лет назад
14 лет назад
$500
14 дней
Рекомендую! Такого профессионализма еще не встречал! Разработал не просто сервис по ТЗ.. учел все моменты и в конечном счете сделал гораздо большее и лучшее! Очень довольны работой! Качественно, вдумчиво и в срок!
Работа прошла на высшем уровне. Хочу отметить четкую постановку задачи, вежливость, тактичность и понимание тех процесса. Благодарен за прекрасное взаимодействие.
  • Похожие заказы
  • Задача скрипта: Уметь открывать бинарные файлы и вносить в определенную часть их тела номер в порядке чередования. Скрипт должен быть оснащен личным кабинетом, с возможностью аунтификации и регистрации с защитой капчей. Все БД должны работать с MySQL. Полное и ...

    Закрыт
    14 лет назад
  • Срочно нужен граббер для CMS CS-cart для переноса сонтента с сайта www.magicgold.ru. От меня детали задания и оплата по завершении проекта - от вас цены и сроки. Проект срочный.

    Закрыт
    14 лет назад
  • Требуется создать приложение вконтакте на заказ!Приложение легкое!icq - 555857616 !Большая просьба: кидалы не стучать[даже не надейтесь,деньги вперед не дам]!!!Зарание большое спасибо всем откликнувшимся!Подробное Тз в icq!

    Закрыт
    14 лет назад
  • $500

    Необходимо доделать сайт. Написано CMS есть дизайн. Нужны 2 скрипта для работы с числами взаимодействующими с базами данных. Знание php/mysql. Подробности в личку.

    Закрыт
    14 лет назад
  • Здравствуйте. Необходимо сделать предельно простой WordPress шаблон по предоставленному макету, желательно валидный на сколько это возможно. - Выпадающее меню - На главной фото 500х350, меняющееся рэндомом или по порядку, не имеет особого значения как. - Из статей делаем новости, ...

    Закрыт
    14 лет назад
  • $10

    Нужно написать скрипт который будет "плавающим" баннером на сайте, т.е. он должен выглядеть как pop-up баннер у множества партнерских программ. Баннер должен иметь кнопку "закрыть", после нажатия на эту кнопку баннер должен блокироваться для данного ...

    Закрыт
    14 лет назад
  • Общая идея заключается в том, что на стороне флеша мы должны сделать подобие зеркала, которое можно перемещать по загруженному изображению. Данное мини приложение должно уметь: - принимать рисунок который находится на сервере по URL (url передавать ...

    Закрыт
    14 лет назад
  • Необходимо сделать небольшую доработку и несколько исправлений в php движке сайта. В дальнейшем иногда по необходимости делать функциональные дополнения (желательно оперативно) Требуется опыт работа с php и mysql, ответственность за результат

    Завершен
    14 лет назад