Парсер ютюба с импортом в базу
Нужно выгребсти с ютюба все мувики, содержащие интересующие ключевики ТОЛЬКО в:
- Тайтле мувика
- тегах мувика
Если в этих двух элементах ключевика нет, но он есть в дескрипшене, к примеру или еще где то, такие мувики не гребсти.
Кроме того должен быть стоп лист ключевиков, при наличии которых в тейтле или тегах, такой мувик так же не должен гребстись.
Парсер должен для каждого мувика собирать, сохранять и импортить в базу такую инфу:
- Тайтл - http://gyazo.com/8f3be6418ad8409d626c970d6f8ccdef.png
- Дату аплода мувика на ютюб http://gyazo.com/79c15804f861fc648a97d4548883c81c.png
- дескрипшен мувика (если он больше 250 символов без пробела, сохранять только 250 символов, вернее обрезать после первого слова свыше 250 символов без пробела…)
- категорию мувика
- теги мувика http://gyazo.com/b110d507fdbe2257d17ae8dbff9c5d2c.png , теги, перед импортом в базу, нужно перемешать между собой, что бы получилась другая последовательность
- линк мувика, для вывода его через ютюбовский или сторонний плеер
- колличество просмотров мувика на ютюбе http://gyazo.com/9cb45818e0687cf129700d224da97400.png
- пометку HD, если мувик в высоком разрешении
- тумбу мувика http://gyazo.com/66d0e6da921e7a6f79fc248ff7456d5b.png , при этом ее нужно сохранять на мой хост, при этом переименовуя файл тайтлом мувика, к примеру
/img/alise-joste.jpg
Сперва нужно выгребсти по заданым параметрам все что накоплено на ютюбе за все время и импортнуть в базу, после этого настроить выгребание свежака по крону, раз в час, с последующим добавлением его в базу, так же раз в час.