Парсер сообщений из каналов Telegram
Создать скрипт на Python, который ищет сообщения по ключевым словам.
На входе подается:
-список id telegram каналов и чатов
-список ключевых слов, по которым необходимо осуществлять поиск
-промежуток дат, по которым необходимо осуществлять поиск
На выходе:
-Выдается id всех сообщений и записей, где встречались ключевые слова из списка за указанный период.
-Дополнительно если поиск происходит по чату: Выдается id всех реплаев к сообщению, где встречались ключевые слова за указанный период. (в реплае не обязательно упоминаются ключевые слова)
-Дополнительно если поиск происходит по каналу с открытыми комментариями: Выдается id всех комментариев к записям, в которых было упоминание ключевых слов. (в комментариях не обязательно упоминаются ключевые слова)
-Если на сообщение, запись, реплай или комментарий были реакции, то необходимо выгрузить их список.
-Если открыто кол-во просмотров на сообщении/записи, то выгрузить кол-во просмотров для сообщений/записей, где встречались ключевые слова
-Список ключевых слов, которые встречались в сообщении.
-id Канала/чата в котором было сообщение/запись
Поиск по ключевым словам не должен быть чувствительным к регистру (заглавным или строчным буквам)
Должно быть видно прогресс выполнения парсинга (можно использовать библиотеку tqdm)
Таким образом, на выходе должна получиться таблица со следующими колонками:
1. id сообщения/записи/реплая/комментария
2. id канала, где оставили сообщение/запись/реплай/комментарий
3. Указание типа (сообщение/запись/реплай/комментарий)
4. Если комментарий/реплай - id оригинального сообщения, на которое делали реплай или id записи под которой оставляли комментарий
5. Какие ключевые слова встречались в тексте сообщения (если не встречались, то остается пустым) (тип данных в колонке - список)
6. Кол-во просмотров
7. Список реакций