Создание модуля проверки текста на уникальность

Сергей13 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
06.04.2012

Создание модуля проверки текста на уникальность через поисковые системы

Выходный параметры:

текст

Выходные параметры

список url на стр. с похожими текстами и % схожести

Реализация:

python

перед проверкой Текст очищается от предлогов, союзов, знаков препинания, HTML тегов, и прочего не нужного «мусора», который не должен участвовать в сравнении.

используется xml выдача yandex, и html парсинг выдачи google

проверку реализовать через пул. прокси