Парсинг аудиозаписей из VK
Добрый день! Нужно реализовать парсинг аудиозаписей из вк и дополнительных данных.
Что требуется:
Имеется список url на группы определенных исполнителей (он может достигать 1000).
В группах появляются посты с новыми музыкальными релизами, у поста есть уникальный id, превью, дата, аудио.
Нужно чтобы парсер обходил все группы по очереди и парсил информацию новых постов. Которую в дальнейшем выгружал в отдельную папку.
Самое важное чтобы парсер не обходил один пост больше одного раза, и была возможность указать дату при которой парсер перейдет к обходу следующей группы (чтобы парсер не собирал данные со старых постов).
Так же может возникнуть ситуация когда у одного поста больше 1 аудиозаписи, это нужно учитывать и собирать все аудио.
Пример того, что должно получится:
/- общая папка
-/ 20-01-2021
--/ id поста или любое другое название
---/ preview.jpg (формат любой)
---/ data.txt (Тут мы храним данные mp3. Имя исполнителя, название песни.)
---/ audio.mp3
--/ id поста или любое другое название
---/ preview.jpg (формат любой)
---/ data.txt (Тут мы храним данные mp3. Имя исполнителя, название песни.)
---/ audio.mp3
-/ 20-02-2021
--/ id поста или любое другое название
---/ preview.jpg (формат любой)
---/ data.txt (Тут мы храним данные mp3. Имя исполнителя, название песни.)
---/ audio.mp3
........
и т.д
p.s. Все данные кроме mp3 достать очень легко, они в открытом доступе.
После внедрения платной подписки на музыку разрабы стали прятать прямой путь до mp3.
Сейчас этой путь зашифрован, при расшифровке мы получаем путь к файлу формата m3u8. После этого нужно получить полноценный файл формата mp3.
Будет большим плюсов если вы ранее работали с чем-то подобным.
Заявки фрилансеров
