Профили из амазон
На амазоне есть странички профилей продавцов. Задача бегать по сайту и собрать в базу только те профили, в которых указан вебсайт. Вот пример профиля:
http://www.amazon.com/gp/help/seller/home.html?ie=UTF8&seller=A33GTFSVPPIZTW
Если встречается Website или в поле About Seller есть урл (некоторые селлеры указывают сайт в описании а не в отдельном поле) то инфу нужно дергать в базу. Например
http://www.amazon.com/gp/help/seller/home.html?seller=A1E2EH8WYIMV01
На выходе в базе должно быть - урл профиля, информация About Seller и вебсайт.
Результатом работы должна быть база продавцов амазона и скрипт, которым база собрана.
Собрать нужно максимально много, собранная база будет оплачиватся дополнительно.
Скрипт должен выполнять задачу в пассивном режиме (т.е открыл браузер, запустил и закрыл) а также показывать статистику, что он работает и сколько чего собирает.
Также нужно учесть возможность не попадат на один и тот же профиль 2 и более раза.