Доработать/переделать скрипт парсера Яндекса.
Здравствуйте, уважаемые исполнители
Заявку подавать, только в том случае если вы обычно не срываете сроки.
Желательно чтобы у вас был опыт написания скриптов по парсингу яндекса.
Если результат сотрудничества будет положительным, то продолжим сотрудничество. будут еще задания по этому скрипту.
В заявке напишите пожалуйста:свой опыт, примерную цену и срок выполнения.
Есть скрипт на php работает на локальном Денвере, парсит сайты из выдачи яндекса на предмет
1) средний объем текста по запросу
2) количество прямых вхождений
3) количество разбавленных вхождений
скрипт берет ключевые фразы из текстового файла и записывает значения в виде
ключевая фраза;количество символов;точных вхождений;разбавленные вхождения;
есть поддержка antigate
используются библиотеки
phpmorphy
Нужно сделать
1) скрипт должен брать ключи из csv файла, в котором есть дополнительные данные
ключевая фраза;значение1;значение2;значение3
и записывать как
ключевая фраза;количество символов;точных вхождений;разбавленные вхождения; болд, болд, болд,;значение2;значение3
2) многопоточность, да php не поддерживает многопоточность, но ее успешно эмулируют, понимаю что будет нагрузка на железо, но мне больше 10 потоков не надо будет.
Многопоточность должна нормально работать через прокси, проксей сейчас хороших не найти, которые есть могут быть частично забанены в яндексе, при доработке следует это учесть.
3) БОЛД также в результат, записывать слова которые в выдаче выделеные жирным . параметры этого пункта обговорим с теми кто подал заявку
4) дополнительно дописать отдельный скрипт для группировки ключевых фраз. параметры этого пункта обговорим с теми кто подал заявку
5) есть проблема с подсчетом количества символов на страницах некоторых сайтов, нужно исправить эту ошибку.