Фрилансеры предложат решение вашей задачи уже через несколько минут!
Публикация заказа не займет много времени.
1 год назад
Алексей Л.
28 лет, Россия
1 год в сервисе
Был онлайн 5 месяцев назад
1 год назад

Здравствуйте.

Нужен программист, который умеет парсить данные и отделять мух от котлет.
Цель - собрать из двух источников общий файл .csv и папку с картинками.

Есть два источника данных:
1) База Excel с товарами: без картинок, есть названия товара, характеристики в одну строчку (ячейку) через разделитель.
2) Сайт с товарами: есть названия товара, картинки и описания.

Что нужно в результате:
1. Каталог с картинками, картинки проименованны специальным образом.
2. Файл csv, заполненный определенным образом.
Состав csv: URL картинки, название товара, характеристики, описания (+ возможны ещё поля).

Подводные камни:
1. Надо будет рассортировать характеристики из экселя по ключевым словам.
Например, ячейку "Диагональ: 24 дюйма; Вес: 1,4 кг...." распарсить на отдельные столбцы.
2. У товаров в экселе и товаров на сайте нет общего ID, их надо будет сопоставлять по артикулу или названию товара, чтобы не было дублей, а информация по каждому товару была наиболее полная.
3. Не все позиции в базе имеют общий формат, нужно предусмотреть обработку тех товаров, где не полные данные (обрабтка исключений).

При отдаче заказа интересует ваш опыт в обработке данных и парсинге.
Цена договорная, ориентир $90.
Срок: с учётом всех обсуждений и т.п. - неделя.

Более подробно расскажу при отдаче заказа.

Выбранный исполнитель

1 год назад
Миша Титков
26 лет, Украина
1 год в сервисе
Был онлайн 5 дней назад

$90

10 дней

ТОП-50 — Прикладное ПО

Заявки фрилансеров

1 год назад
Влад Орлов
Влад Орлов 
40 лет, Россия
1 год в сервисе
Был онлайн 1 год назад
1 год назад
Андрей М.
38 лет, Украина
5 лет в сервисе
Был онлайн 7 часов назад
1 год назад
Миша Титков
26 лет, Украина
1 год в сервисе
Был онлайн 5 дней назад
ТОП-50 — Прикладное ПО
1 год назад
Григорий Б.
22 года, Украина
2 года в сервисе
Был онлайн 1 месяц назад
1 год назад
Денис Г.
Денис Г. 
24 года, Россия
1 год в сервисе
Был онлайн 4 дня назад
1 год назад
Марс Ахметов
32 года, Россия
1 год в сервисе
Был онлайн 2 часа назад
1 год назад
Андрей К.
Андрей К. 
28 лет, Россия
6 лет в сервисе
Был онлайн 7 дней назад

Похожие заказы

Автономный агент для сбора данных c веб сайта

Агент должен работать в автономном (автоматическом) режиме, постоянно проверять вебсайт и заносить все новости в бд. Сценарий прост: заходить на страницу, парсить таблицу, нажимать на ссылки, опять парсить и все аккуратно заносить в бд - веб приложен...

FTP СИСТЕМА

Мне нужна простая ftp система.Там будут два главных компонента, подробно описанные ниже. Работая вместе в пассивном способе передачи FTP сервер соединится с другим FTP сервером под номером "два" и передаст файлы по частям. Прогер должен быт...

Программа-генератор кодов для доступа к списку сайтов

Проект написания программы-генератора кодов для доступа к редактируемому списку сайтов. А также серверной части для организации взаимодействия Windows-приложения с серверной частью. Необходимые знания навскидку: C++, php, mysql. Возможно, потребуется...

Модуль для скриншотинга индекс страниц сайтов

Нужен модуль, который будет вставляться в различные PHP скрипты. По указанию PHP скрипта, модуль скриншотит индекс страницу нужного сайта в JPG соответственно указанным параметрам размера картинки, и потом подставляет этот скриншот куда надо.

Оболочка для сайта

Требуется разработать оболочку для web-сайта на Visual C++ (версия подлежит согласованию). 1. Программа работает с помощью встроенного браузера на базе движков IE и Mozilla на выбор пользователя (т.е. нужно реализовать оба варианта). Данные поступают...

Программа для расскрутки анкет на сайте знакомств.

Нужен аналог уже существующей программы ( www.lovepiar.net/aboutus.php ) Без каких-либо ограничений. Вкратце, это программа позволяет поднимать ТИЦ анкеты в системе MAMBA (туда входят более 2000 сайтов, по заявлению владельцев рессурса, финансовой ко...

Система автоматического сбора информации с сайтов.

Сбор информации, представленной в различных форматах (HTML, XLS, DOC) с ~ 30 сайтов, укладка в БД Oracle. В резльтате должны быть разработаны: 1. ТЗ 2. Исполняемые файлы под линукс. 3. Спроектирована БД. 4. Вэб интерфейсы с различными уровнями доступ

Добавить два модуля к ATutor

Необходимо добавить два модуля к системе дистанционного обучения ATutor(www.atutor.ca). 1. Dropbox (see sample http://academictech.doit.wisc.edu/ORFI/learnuw/grading.htm ) 2. Gradebook (see http://library.blackboard.com/docs/cp/learning_system/relea

Обработка xls-файла, сбор данных с интернет-сайта

Необходимо написать программу. 1. Тип программы - консольное приложение, язык программирования C#, версия .NET - можно 2.0, ОС - WinXP и "выше" 2. Параметры командной строки через пробел (обеспечить проверку валидности): - целое число - дли...

Выгрузка описания товаров из 1с на сайт

нужно выгрузить инфу о товаре ( около 1000 позиций) на сайт ( поля в базе MySQL есть) подробней по почте ***