Разработка платформы автоматизации и мониторинга удалений
Мы создаём веб‑платформу для управления кейсами и автоматизации процессов удаления контента и деиндексации (copyright/DMCA + NCII).
Платформа должна находить ссылки (поисковики + заданные сайты), собирать и организовывать доказательства, генерировать письма по шаблонам, отправлять заявки (через официальные каналы), вести статусы и регулярно перепроверять появление новых ссылок.
По концепции это похоже на сервисы Bruqi / Rulta (takedown + monitoring).
Основные требования / Функции
1) Поиск и сбор данных
Когда системе передают имя / ник (плюс опциональные алиасы), она должна:
Собирать URL из результатов поиска в:
Google, Yandex, Bing, Brave, Yahoo (веб + изображения)
Для результатов по изображениям сохранять:
URL результата
URL превью/thumbnail (если доступно)
URL страницы-источника и URL исходного изображения (если доступно)
Дедупликация результатов (одинаковые URL или одинаковые изображения между поисковиками)
Сохранение в БД с таймстемпами
2) Поиск по сайтам
Мы предоставим список целевых сайтов (кластер).
Система должна:
Искать заданные термины/имя по этому списку
Сохранять совпадения по каждому сайту (URL + превью/thumbnails и их варианты (у каждого сайта свой вариант) + доказательства)
По возможности определять хостинг/провайдера (домен/IP/ASN/host), если хостинг скрыт за CloudFlare - отправить жалобу через форму CloudFlare abuse - и группировать результаты:
Имя → на каких сайтах встречается
Хостинги/провайдеры → какие сайты/контент у них размещены
3) Сбор доказательств + Аудит‑трейл
Для каждой найденной или отправленной заявки/единицы контента нужны доказательства и трекинг:
Автоматические скриншоты с таймстемпом (например, через headless browser)
Хранение файлов доказательств в организованной структуре (папки по кейсам) + метаданные в БД:
дата/время последнего наблюдения (last observed)
хэш файлов (опционально)
какой шаблон/письмо использовались
когда отправлено, кому отправлено, и текущий статус
Экспортируемые отчёты (CSV/PDF)
4) Автоматизация отправки
Нужен workflow для отправки заявок:
В поисковые системы (copyright/NCII/deindexing)
Владельцам сайтов / хостинг‑провайдерам (через email workflow)
Правило отправки email:
Мы ведём собственную базу контактных email‑адресов. Оператор вручную выбирает, на какой адрес отправлять по конкретному сайту/заявке.
Система должна:
Подготовить письмо по выбранному шаблону
Прикрепить доказательства при необходимости
Отправить через наш настроенный почтовый ящик или сформировать готовый черновик/экспорт для отправки (предложите подход)
Мониторинг ссылок
Периодически перепроверять найденные ссылки
Если для того же имени/алиаса появилась новая ссылка:
Добавлять в очередь “To Review”
Включать в процессы деиндексации/отправки заявок
Для превью/thumbnail с найденных NCII/DMCA‑страниц:
Запускать reverse image search через все упомянутые выше поисковики и дополнительные системы
Добавлять новые совпадения/URL обратно в пайплайн
5) Пользовательский кабинет
Общее число найденных ссылок
Отправлено на удаление (по платформам)
Деиндексировано
Удалено у источника
Сколько писем DMCA/NCII отправлено
Статусы + таймстемпы
Примечания, например “lawsuit involved” (поле заполняется вручную)
Админ‑панель для нашей команды:
Управление кейсами, шаблонами, базой контактов, очередями и логами
Также нужна интеграция расширенного поиска по лицам (face search).

