Парсинг результатов Овертюры
Есть сайт http://inventory.overture.com/d/searchinventory/suggestion/ выдающий статистику запросов данного ключевого слова в Yahoo за месяц в различных вариациях, т.е. например задав слово "dictionary", результат выдачи будет следующий:
Count Search Term
1495647 dictionary
267431 websters dictionary
143923 online dictionary
142156 english dictionary
114882 spanish dictionary
84102 spanish english dictionary
68525 medical dictionary
65528 english spanish dictionary
50373 dream dictionary
46921 urban dictionary
по каждому из предложенных вариантов можно щелкнуть, в результате чего откроется новое окно с вариантами словосочетаний уже зависящих от данного словосочетания. Суть задачи: написать скрипт на вход которого подается начальное слово (в данном случае это "dictionary"), скрипт отправляет его скрипту на указанный выше сайт, полученные результаты вида "ключевое слово"="кол-во запросов" сохраняет в текстовый файл, далее скрипт "щелкает" по всем полученным словам и заносит в тот же файл новые результаты, и так в цикле, пока не перестанут выдаваться новые словосочетания. В результате должен получиться файл с не повторяющимися словосочетаниями и кол-вом запросов каждого словосочетания.