Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Were using regular expressions to pull specific information from HTML pages. The information is always the same, the HTML varies.

We are data mining. Example, you will go to PriceGrabber.com and you will use regular expressions to pull specific information. We have over 40 websites that we need to do this for. Each one of these should take you between 1-2 hours to do.

Пример

-----------

We will be taking from the html of pages like this:

http://www99.shopping.com/xFS?KW=sony+vaio

This particular page is handled by 2 regular expressions:

1. /^[\n\W\w]+?(([\n\W\w]+?)\n\n)/ithe replacement is $1. This clips off the beginning of the page and leaves the rest of the page intact, starting with the results.

2. /(([\n\W\w]+?)\n\n)[ \n]+ (?:)[\n\W\w]+$/i

the replacement is $1. This clips off the end of the page after the results and leaves nothing but results to comb through.

3. /[\n\W\w]+?\n *(.+?)\n[\n\W\w]+?[\n ]+(?:)*[\n ]+(.+?)\n[\n\W\w]+?[\n ]+(.+?)\n[\n\W\w]+?[\n ]+/i

this last expression is replaced by $1æ$2æ$3æ$4æ$5ææ where æ represents the end of the item detail and ææ represents the end of the product after all information is gathered.

The information is as follows in the exact order:

1. product url

2. product image url

3. product name

4. description (if any)

5. item price

Assume that each site you get data from uses a different layout for a given keyword search terms. Most websites can be handled with only 1 set of 3 expressions... others require 2 or more sets.

We will need to data mine from over 40 different comparison shopping sites.

18 лет назад
ktt
Украина
18 лет в сервисе
Был
5 лет назад
  • Похожие заказы
  • $500

    Требуются профессиональные веб программисты, обязательное требование наличие своей CMS, высше высокого ответственность, и не очень высокие цены, будут проекты различного рода, от установки жумлы и битрикса, до разработки кода и разборки в чужом коде. Требуется ...

    Закрыт
    17 лет назад
  • $80

    Необходимо сделать 3D flash презентацию торгового автомата Цель ролика - подчеркнуть внешнюю привлекательность автомата и неограниченные возможности изменения внешности.

    Закрыт
    17 лет назад
  • Смотрите приатаченый файл. Пишите реальные сроки и стоимость. Оплата по безопасному проведению сделок на Weblancer.net

    Закрыт
    17 лет назад
  • $250

    необходимо написать widget (дополнительная информация здесь: codex.wordpress.org/Plugins/WordPress_Widgets) для wordpress'a на flash с анимированной погодой в зависимости от location.

    Закрыт
    17 лет назад
  • $700

    Суть вопроса... Существует японский онлайн аукцион auctions.yahoo.co.jp нужен движок, который будет налету преобразовывать данные с аукциона в аналогичный формат (enova.ru, injapan.ru) с переводом на английский... либо на русский предпостительно движок построить на shop-script premium нужен следующий функционал: -личный кабинет клиента -ввод ...

    Закрыт
    18 лет назад
  • $50

    имеется база айпишников городов России. От скрипта требуется что бы происходило перенаправление кликнувшего на один из 4 урлов город А город Б вся остальная Россия не Россия (то чего нет в базе) так же куда нить записывается простая статистика по ...

    Завершен
    18 лет назад
  • $250

    Необходимо разработать прототип поисковой системы документов, которая динамически выдает результаты на основе ввода пользователя (ajax). Спецификация на английском языке будет предоставлена по запросу. Система должна быть развернута на хостинг-сервере по выбору разработчика (оплата хостинга будет ...

    Закрыт
    17 лет назад