Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Необходимо разработать универсальный парсер (грабер), либо доработать существующий.

Язык PHP

Простой и понятный интерфейс (чтобы мог работать любой человек)

Парсинг статей и картинок из заданных источников.

Удаление всех ссылок из текста без ущерба для текста (если ссылка имеет анкор, то ссылка исчезает, анкор остается).

Возможность настройки результатов экспорта в БД (настройка под CMS) и в .txt и в .html.

Удаление ненужных выражений еще на стадии парсинга.

Отдельный редактор результатов парсинга (задать чпу страниц, дату публикаций (возможность присваивать дату с заданным

интервалом), поиск и удаление дублей статей, добавления категорий и подкатегорий в которые добавлять статьи, сортировка по

категориям (перенос в другие категории), возможность по заданным тегам найти и сохранить в отдельную базу отобранные статьи,

синонимайзер, возможность перемешивания статей).

Возможность задавать размер картинок, и функция подбора картинок в яндексе или гугле, и добавления к статье в которой нет

картинки.

Настройка уровня парсинга (глубина), задавать кол-во статей которые нужно спарсить.

Возможность добавить источник в конце статьи с которого беруться статьи в виде. (с возможностью добавления noindex и nofolow)

Автор

ссылка (ссылка на сайт, либо на адрес страницы)

Запуск заданий по крону.

Возможность работы с проксями.

14 лет назад
AlexanderT
Александр 
51 годРоссия
14 лет в сервисе
Был
10 лет назад
  • Похожие заказы
  • Требуется качественный парсер маркета яндекса. Многопоточность Работа через прокси Обработка выходных данных Сохранние данных в ексель\csv Импорт полученных данных + написание,по мере надобности, дополнительны модулей Пишите примерную стоимость и сроки выполнения сюда или обращайтесь в ICQ.

    Закрыт
    14 лет назад
  • $10

    День добрый! Есть проблема со скриптом редиректа: скрипт редиректа: http://редирект.ру конечный урл: www.сайт2.ру/раздел/?ID=3644 ссылка для редиректа имеет вид: http://редирект.ру/www.сайт2.ру/раздел/?ID=3644 Есть две следующих проблемы: 1) при редиректе отбрасывается кусок ссылки конечного урла "?ID=3644" 2) в статистике ЛИ.ру конечного сайта (сайт2.ру) высвечивается переход ...

    Закрыт
    14 лет назад
  • Необходимо разработать интернет магазин используя фришную цмс. В приложенном файле лежит описание требуемого продукта. Более точное описание будет выслано выбранному исполнителю. Дизайн сайта будет предоставлен исполнителю, необходимо будет его только сверстать. При осуществлении заявки, пожалуйста указывайте ...

    Закрыт
    14 лет назад
  • Сделана регистрация (нужно доработать), установлен комьюнити билдер, настроены объявления (доска объявлений по категориям), сделан личный кабинет, нужно доработать, и сделать все это на основе дизайн макетов, размещение вакансий, резюме и поиск по ним. ...

    Закрыт
    14 лет назад
  • Требуется разработать личный кабинет пользователя и панель администратора, для сервиса предлагающего услуги по продвижению сайтов BerryBerry.ru. Разделы личного кабинета: Главная страница Мои сайты Заказ услуг Пополнить счет Поступления и платежи ...

    Закрыт
    14 лет назад
  • Файл сформирован, настроен, но не доделан выводит ошибку http://happykid.biz/netcat/modules/netshop/export/yandexml.php Определена кодировка: windows-1251 (строка 0, столбец 0) Дата из файла: 2010-04-01 15:49 (строка 3, столбец 113) Ошибка: Тег "name" не допустим для предложения с типом "vendor.model" (строка 156, столбец 9) Ошибка: ...

    Закрыт
    14 лет назад