Рефакторинг существующего проекта (конвертация ppt в xml + парсинг)
Имеется сервер на windows на котором настроены следующие процессы:
1. Парсер документов в формате ppt - парсит с сайта донора + пишет в базу mysql данные (наименование, md5, размер)
2. Конвертер из ppt в html 5 (модифицированный)
3. После конвертации идет проверка по шинглам в базе redis (тут же на сервере)
4. Если шинглы прошли по уникальности - данные вносятся в общий xml файл + папки медиа данных (картинки слайдов).
5. Далее ручками этот xml файл + папки с медиаданными уносятся в s3 Облако.
6. Импорт файла на фронт сайт (уже на другом сервере).
Ищу человека, который сможет разобраться в текущей системе и отладить все таким образом, чтобы парсинг + конвертация происходили ежедневно и выдавался готовый xml файл с 500 элементами на импорт.
Используемое ПО:
1) mysql
2) redis 4
3) самописный парсер на php + других библиотеках.
4) конвертер (https://www.digitalofficepro.com/powerpoint/ppt-to-html5-sdk.html) - модифицированный на c sharp как я понял.
От вас нужна оценка 1-4 пунктов. Помощь в отладке инфраструктуры (могу предоставить xmind карты, примерную картинку уже исполнителю). Отвалился программист, проект нуждается в новых материалах. Работа будет периодически появляться и проект планируется развивать дальше. Основные сложности в отсутствии вменяемой документации, т.к программист не выходит на связь и никогда ее почти не вел, поэтому придется понять чужой код и сделать что-то современное и вменяемое. Спасибо за ваш интерес!
Заявки фрилансеров
