Парсер кинопоиска
Нужно сделать парсер сайта ки_но_по_ис_к.
1. Парсится новости должны по годам (/level/10/m_act[year]/1928/m_act[all]/ok/page/2/) и каждый год - это отдельная категория. Парсить нужно только страницы вида /level/1/film/251733/
2. Со страницы парсится название фильма (русское и английское), описание, страна, год, слоган, режисер, сценарий, продюсер, оператор, композитор, жанр, бюджет, продолжительность и записывается каждый в отдельное поле базы mysql.
3. Парсятся все постеры для новости и заливаются на сервер.
4. Постеры и инфа добавляются вместе в одну новость (настройки берутся из движка).
сайт на DLE
p.s. Интересует вариант цены с парсером трейлеров с ютуба и без.
p.p.s. Так же есть вопрос уникализации описания. Синонимизация? Парсинг с Википедии? варианты.
Ранее я уже здесь создавал это задание, но был выбран не компетентный лансер. Поэтому поставил на повтор.