Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Добрый день! Нужно реализовать парсинг аудиозаписей из вк и дополнительных данных.

Что требуется:

Имеется список url на группы определенных исполнителей (он может достигать 1000).

В группах появляются посты с новыми музыкальными релизами, у поста есть уникальный id, превью, дата, аудио.

Нужно чтобы парсер обходил все группы по очереди и парсил информацию новых постов. Которую в дальнейшем выгружал в отдельную папку.

Самое важное чтобы парсер не обходил один пост больше одного раза, и была возможность указать дату при которой парсер перейдет к обходу следующей группы (чтобы парсер не собирал данные со старых постов).

Так же может возникнуть ситуация когда у одного поста больше 1 аудиозаписи, это нужно учитывать и собирать все аудио.

Пример того, что должно получится:

/- общая папка

-/ 20-01-2021

--/ id поста или любое другое название

---/ preview.jpg (формат любой)

---/ data.txt (Тут мы храним данные mp3. Имя исполнителя, название песни.)

---/ audio.mp3

--/ id поста или любое другое название

---/ preview.jpg (формат любой)

---/ data.txt (Тут мы храним данные mp3. Имя исполнителя, название песни.)

---/ audio.mp3

-/ 20-02-2021

--/ id поста или любое другое название

---/ preview.jpg (формат любой)

---/ data.txt (Тут мы храним данные mp3. Имя исполнителя, название песни.)

---/ audio.mp3

........

и т.д

p.s. Все данные кроме mp3 достать очень легко, они в открытом доступе.

После внедрения платной подписки на музыку разрабы стали прятать прямой путь до mp3. 

Сейчас этой путь зашифрован, при расшифровке мы получаем путь к файлу формата m3u8. После этого нужно получить полноценный файл формата mp3.

Будет большим плюсов если вы ранее работали с чем-то подобным.

3 года назад
kost_enikov
26 летРоссия
7 лет в сервисе
Был
год назад