Распознание с JPG и TIFF статей и публикация html
Поиск по заданному алгоритму статей архиве картинок (алгоритм прост и не отнимет много времени), скачивание нужных картинок и распознание с JPG и TIFF только статей/текста (через Fine Reader или Microsoft Office Imaging Document или любую другую) и публикация html через CMS (если в статье есть картинки, которые являются ее неотъемлемой частью, то их тоже надо публиковать). При распознании проверять на ошибки. html-форматирование самое элементарное - красные строки тегой врезки курсивом, заголовки либо
либо , а также и несколько
(для специального оформления - я сообщу алгоритм позже)
Пример исходной картинки http://85.21.132.189:8080/zapad/2010/04/11.jpg - 3 статьи
Объем - примерно 1000 статей. Одна статья может быть от 0,5 до 6 страниц, но в среднем 2-3 стр. В некоторых статьях встречаются таблицы. В среднем у меня на 1 статью уходит примерно от 5 до 15 мин в зависимости от ее размера.
И еще примерно 15 статей в PDF - тоже нужно сделать в рамках этого проекта.
Сроки - примерно 20-30 статей в день или 1 мес. Оплата WebMoney постепенная, по мере выполнения заказа
Заявки без стоимости и сроков НЕ РАССМАТРИВАЮТСЯ!