Парсер для получения данных из таблиц в PDF файлах
Нужно создать парсер, для вытаскивания данных из файлов PDF таких как в приложении.
Парсер должен работать как OLE сервер.
Файлы будут браться с http://www.marinepartsexpress.com/index.html точнее например с http://www.marinepartsexpress.com/vp_sch_fs.html.
С владельцем сайта договоренность существует, предлагал бумажные варианты, но это не интересно.
В предложении указывайте пожалуйста на чем будите писать.
БОЛЕЕ ПОДРОБНО:
Есть сайт, есть база в 1С и есть вот такие файлы как в приложении к заданию.
Нужно. При помощи некоей утилиты (оле аутомашн) нужно вытаскивать 1Ской инфу о деталях из таблиц и другие там данные Типа: CAMSHAFT AND VALVE MECHANISM: A; 2003; Upd: 2009-11-25; 8970; 7726000 - 21 - 11580; 2001, 2001B, 2001AG, 2001BG, 2002, 2002B, 2002D, 2002AG, 2002BG, 2003, 2003B, 2003D, 2003AG,
2003BG, 2003T, 2003TB, 2003-SOLAS, для заполнения каталога в 1Ске.
Все это содержится на второй странице документа. И картинку тоже в виде файлика вытащить в каком-нибудь формате кушающем не много места. А уже 1Ска будет заботится, о доставке этих данных на сайт.
Алгоритм в 1Ске напишу сам.
Нужно, чтоб в 1Ске писалось чё-то типа:
НазваниеДетали=ОЛЕСерверИнструмент.Деталь;
КолСтрокВТаблице=ОЛЕСерверИнструмент.Таблица.КоличествоСтрок();
Для Н=1 По КолСтрокВТаблице Цикл
REF=ОЛЕСерверИнструмент.Таблица.ПолучитьЗначение(Н,1);
или
REF=ОЛЕСерверИнструмент.Таблица.ПолучитьЗначение(Н,"REF")
КонецЦикла;
Методы и свойства конечно же можно и на аглицком.
Парсер возможно будет использоваться в будущем и другой программой.
Бюджет до 400 USD
Способ оплаты обсуждается.