Спарсить много URL англоязычных живых сайтов о собаках с поисковиков
Мне нужен максимально большой список (5000) сайтов соответствующих следующим критериями:
1. О собаках
2. Сайт на английском языке
3. Сайт живой
4. Возраст сайта (домена) 5+ лет
5. Сайт имеет хотя бы 1000 уников в месяц из Google
6. только в зонах .com, .net, .co.uk
7. Email вебмастера (желательно, не обязательно)
Я бы действовал так:
1. Спарсил бы т.н. Resource pages по футпринтам inurl:resources.html, inurl:links.html + релевантные ключевые слова (dog, dogs, canine, dog food, и 100500 пород собак)
2. Спарсил бы все сайты на таких страницах и прибавил к тем, которые нашел в пункте №1
3. Сделал бы это для Google, Yahoo, Bing
4. Отсеил бы по критериям (можете критерии в excel все внести, чтобы самому отсеить можно было)
Все это можно сделать через Scrapebox.
В заявке сразу указывайте стоимость и сроки, а также дайте понять как-то, что вы ознакомились с заданием, а не просто копипастите шаблонный ответ. Напишите примерный ход действия, что ли