Создание модуля проверки текста на уникальность
Сергей13 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
06.04.2012
Создание модуля проверки текста на уникальность через поисковые системы
Выходный параметры:
текст
Выходные параметры
список url на стр. с похожими текстами и % схожести
Реализация:
python
перед проверкой Текст очищается от предлогов, союзов, знаков препинания, HTML тегов, и прочего не нужного «мусора», который не должен участвовать в сравнении.
используется xml выдача yandex, и html парсинг выдачи google
проверку реализовать через пул. прокси