Сбор табулатур с сайта / Создание робота парсера
Источник данных: http://ttabs.com
Тип информации: табулатуры ударных Drums tabs
Типовой адрес страницы со списком табулатур: http://www.ttabs.com/tabs/B/Drums_tabs
Cуществует карта сайта в формате Google Sitemaps: http://www.ttabs.com/sitemap.php?host=searchengine
Полнота соответствия карты сайта информации на сайте неизвестна.
Задача:
Создать парсер на интерпретируемом языке для сбора информации о табулатурах ударных с вебсайта и сохренения ее в базу данных MySQL, с учетом отношений таблиц
Требуемые данные:
Название исполнителя (artists.name)
Название музыкального произведения (songs.name)
Текст табулатуры (song_texts.content)
Дамп структуры бд приложен. В базе данных разрешается создавать в случае необходимости дополнительные таблицы и добавлять поля к существующим таблицам.
Запрещается изменять и удалять существующие поля их размер и тип.
Произвести сбор всех доступных на сайте табулатур ударных в базу данных.
Предоставить:
1. Стабильно работающий парсер
2. Дамп базы собранных с сайта табулатур ударных (Drums tabs)