Парсер социальных сетей (только посты)
Добрый день
Интересует оценка по стоимости и срокам. К ответу прошу приложить ссылку/описание подобных проектов, или просто прокомментировать свой опыт. Просто отклики будут игнорироваться. Спасибо.
ТЕХНИЧЕСКОЕ ЗАДАНИЕ:
Цель парсера – сбор информации об упоминании «ключевых слов» в социальных сетях ФБ, LinkedIn и Вконтакте
Требования к функционалу:
- Авторизация в социальных сетях: заказчик вводит логин/пароль, система запоминает введенную информацию. Есть возможность "выйти" из системы. Заказчик, как администратор системы, может ограничить "внешние" регистрации. Есть система восстановления логина/пароля.
- Выполнение поиска по заданным параметрам: после запуска поиска (старт/стоп/пауза - определяется заказчиком), есть возможность сохранить "шаблон поиска" с названием. Впоследствии, можно выбрать один из шаблонов поиска. Количество вариантов сохраненных шаблонов - 10.
- Формирование итогового отчета.
- Отчет представляется в виде таблицы, содержащей информацию:
- Источник (имя социальной сети)
- Дата публикации, в которой используются ключевые слова
- Текстовое предложение, в котором используются ключевые слова
- Ссылка на страницу
- * отчет формируется по каждой соц сети отдельно
- Ранжирование результатов поиска, осуществляется по следующим параметрам:
Требуется возможность указывать, спец символами (*, #, @..):
- ключевое_слов* (заменяет одну букву: пример ...словА, ...словО)
- ключевое_слов** (заменяет любое количество букв в одном слове: пример ...словАМИ, ...словОМ, словООБРАЗОВАНИЕ)
- поскольку, ключевые слова в тексте не всегда идут подряд и/или с начала предложения, нужен символ, заменяющий "неопределенное" количество слов, знаков препинания между словами. например ключевое_слов*№1@@ключевое_слов*№2@@ключевое_слов*№3 (в результате ищет: ПОСОВЕТУЙТЕ, пожалуйста, мне, ПЕЧЬ для быстрого приготовления вкусной и полезной еды АРИСТОН (где ПОСОВЕТУЙТЕ, ПЕЧЬ и АРИСТОН - ключевые слова)
- Поля для записи регистрационных данных
- Поля для записи ключевых слов
- Поля для установки «связок» между ключевыми словами, используя логические операторы «И», «ИЛИ», или их сочетание, а так же символов, заменяющие неопределенное количество слов, знаков препинания)
- Настройка глубины поиска (здесь на подумать, можно 100 результатов, отфильтрованных по релевантности, по каждой сети)
- Настройка диапазона дат публикации для поиска
- Настройка исключений: где искать: группы, комментарии (учитывать только оригинальные посты)
- Настройка формата отчета (длина текстовой части блока, в котором используются ключевые слова)
- Задание количества результатов по каждой социальной сети
- Ограничения по поиску: одновременно парсер можно запустить только на 1 соц сеть
- География поиска: пользователи, размещенные в РФ
- Диапазон дат: в выбранном диапазоне
- Возраст пользователя, сделавшего публикацию поста: от 28 до 50 лет (если возможно)
- Количество результатов (от наиболее релевантных к менее релевантным): до 100 результатов в одной социальной сети.
- Каждое ключевое слово ограничено 50 символами. При поиске, слово не учитывает регистр, и ищет слово отдельно (не составляющую целого), допускаются дефисы между словами типа «как-то»…, при этом слово считается единым, и в поиске ищется полное соответствие (искать с дефисом, если указан)
Исполнитель согласует наименование и стоимость хостинга для работы парсера, с заказчиком, до начала работ, после завершения работ Заказчик регистрирует аккаунт на хостинге, Исполнитель размещает программу, запускает, отлаживает, и сдает работы окончательно. 100% пост оплата по презентации Исполнителем результатов работ на своем хостинге, до переноса на хостинг Заказчика.