Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Есть две реализации проекта

  • боевой, в котором реализован весь функционал, но не в самом лучшем виде и не с самым лучшим кодом т.к. создавался долгое время и разными программистами, что создает сложности для его масштабирования и поддержки;
  • купленный готовый софт, созданный не по нашему тз, но код и реализация более красивая.
Хочется взять второй вариант за основу и дополнить его функционалом из нашего боевого варианта, чтобы на выходе получить нормально написанный, полностью соответствующий нашим требованиям софт готовый к масштабированию.

Условно проект состоит из трех частей:

  • импорт из большого количество источников (примерно 50 туб сайтов с видео и картиночном контентом;
  • обработка (ручная и автоматическая) контента - нарезка скриншотов, обрезание копирайтов (нужно делать), создание тумб разного размера, проставление категорий, тагов и пр (нужно рефакторить). Во втором есть только автоматический  режим, в нашем разные варианты ручной обработки;
  • экспорт (на сотни клиентских сайтов) большого объема данных.

1. Многопоточный парсер.

На данный момент реализован из csv файлов, которые предоставляют сайты, нужна будет еще  реализация парсера с фронтэндов сайтов, которые такие дампы не дают и работа с торрентами. В нашем варианте  многопоточность отсутствует, во втором она есть, это еще один из аргументов за реализацию на его базе. В ходе работы  парсер сохраняет всю доступную информацию о видео/картинках.

Одним из важных моментов работы является распределение видео по категориям и тагам (проверка соответствий по базе синонимов).

2. Обработка контента. Для части скриншотов видео необходимо проставить соответствующие ему категории. Есть два режима:

  • автоматический (рандомный) - на часть скриншотов проставляются спаршенные категории;
  • ручной - тоже самое только через юай.
После определения категорий для скриншотов для них нарезаются тумбы разного размера с применением параметров (имеджмеджиком).

3. Экспорт данных.

В этой части ничего менять не нужно, все реализовано на 100% правда в нашем софте с нашей базой, в купленном варианте этого нет, но думаю не должно возникнуть особых проблем перенести этот функционал.

Требования к кандидатам:

  • Продвинутый уровень знания PHP и опыт успешных разработок.
  • Любовь к ООП, разработке через тестирование, хорошему и эффективному коду.
  • Серьезный опыт работы с SQL, умение оптимизировать запросы, анализировать логи (в текущей базе контента примерно 10кк записей)
  • Опыт разработки high-load и big-data проектов;
  • Опыт работы с Imagemagic.
  • Базовые знания HTML, CSS, JavaScript, Ajax, Jquery, Bootstrap, и других библиотек.
  • Навыки работы с XML, Jason.
  • Умение разбираться в чужом коде.
  • Базовые знания администрирования unix-систем.
  • Умение работать с протоколами http, ftp.
  • Опыт работы в команде (мы используем Jira и Git);
  • Доступность в сети и по телефону большую часть дня.
  • Отсутствие больных бабушек, частых переломов конечностей, а также исправная машина, у которой редко что-то ломается!
Приветствуется:
  • Опыт работы по структурированию и визуализации больших объемов данных (таблицы, схемы, графики);
  • Опыт работы с NoSQL БД, в том числе с Memcached, Redis;
  • Умение работать с Sphinx, Elastic;
  • Понятный код с комментариями на английском языке;
  • Умение работать самостоятельно (на всех уровнях от постановки задачи до базового тестирования);
  • Нахождение в СПб предпочтительно, но не обязательно.
Режим работы:

Готовность уделять проекту минимум 5 часв в день, предпочтительно фулл тайм до завершения проекта. График свободный, однако крайне желательно задействовать дневные часы для согласований.

В откликах присылайте

  • краткое резюме;
  • skype / icq / jabber для контакта;
  • ссылки на то что делали;
  • пару слов о себе;
  • любую инфу по к.оторой можно судить о вашем опыте и качестве работы.

Начало работы над проектом.

Предлагаю начать с реализации независимой библиотеки по удалению копирайтов (watermark):

На входе: набор изображений с копирайтами (могут быть в разных углах изображения), нужно определить копирайт, который может быть просто картинкой с текстом так и графический логотип

На выходе: этот же набор изображений с обрезанными копирайтами, само изображение должно остаться с исходными пропорциями.

Для реализации думаю разумно будет воспользоваться openVC

Высокая оплата за качественный труд.

8 лет назад
emagine
Андрей 
43 годаРоссия
11 лет в сервисе
Был
8 лет назад