Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Требуется скрипт, который будет:

1. проходить по странице типа http://price.ru/firm-offers/6190 (или http://ancient.price.ru/bin/price/prodlist?base=1&fid=6190&where=00) , сохранять в базу данных цену и ссылку на товар компании,

2. из названий товаров выделять первую часть (скрипт поишется в расчете использования с одной конкретной компанией, поэтому алгоритм выделения этой части есть)

3. на price.ru находить эту часть в поиске товаров, из результата извлекать и сохранять в базе данных цену и ссылку на компанию

4. проходить страницам сайта фирмы, которые посвящены представленным на price.ru товарам и еще не сохранены у нас, извлекать оттуда описания и картинки товаров и сохранять их, при этом автоматически создавать миниатюры картинок.

Поскольку объем большой (около 35000 предложений), требуется делать паузы, т.е не забирать эти страницы непрерывным потоком. Т.о., это должен быть представляющийся браузером скрипт, который будет запускаться по cron каждую минуту, делать случайную паузу во времени (иногда даже завершаясь - чтобы сделать паузу в опросе более минуты), вытаскивать из рабочей таблицы случайное число записей об очередных страницах, которые надо обработать, и тащить эти страницы.

Последовательность забора c price.ru:

а) забрать страницу оглавления (вместе с картинками и скриптами)

б) забрать все страницы товаров с этой страницы (вместе с картинками и скриптами)

в) перейти к пункту а) для следующей страницы оглавления.

12 лет назад
visit1
51 годРоссия
15 лет в сервисе
Был
5 месяцев назад
Выбранный исполнитель
alligatorus2
37 летКиргизия
14 лет в сервисе
Был
7 лет назад
12 лет назад
$100
2 дня
  • Похожие заказы
  • $100

    Добрый день всем! есть социальная сеть основанная на PHPFOX 3.Требуеться Изменить структуру скрипта,изменить структуру шаблона,добавить кое что и т.д. (Полное ТЗ в контактах) КОНТАКТЫ : icq 41205555 (желательно прогера кто уже имел опыт с данным скриптом)

    Закрыт
    12 лет назад
  • Доброго времени суток, Есть сайт: www.baikaltrav.ru , там есть шапка=) как это ни странно=) хотелось бы добавить туда флеш анимацию: Орел летает то кругами, то по всей шапке, то присядет посидит на ветке, каждые (например) 3 ...

    Завершен
    12 лет назад
  • Парсер должен делать так: Идем на сайт из статьи вытаскиваем (заголовок и видео) все это вставляем в БД. Но! Во всем этом много нюансов... и еще нужно чтобы весь процесс происходил безпалева по ip и www

    Закрыт
    12 лет назад
  • Имеем текстовый.файл с переносами строк, получаем с него одномерный массив каждый элемент которого строка какого-то текста. Нужна функцию сортировки массива по ключу sort_array_func ( file('текстовый.файл'),filesize('текстовый.файл'),30 ) ; результатом которой, при одном и том же ключе (filesize..) ...

    Завершен
    12 лет назад
  • $100

    Коротко и ясно, нужен парсер стены группы Вконтакте(обязательно должны выводиться опросы, сообщения и фото). Пример на Фейсбуке: http://demo.tutorialzine.com/2011/03/custom-facebook-wall-jquery-graph/ Технология не имеет значения, пишите как Вам удобно.

    Закрыт
    12 лет назад
  • доброго времени! ищем человека, отлично разбирающегося в bitrix, который мог бы помочь в верстке под битрикс и програмированию под него. Или 2 человека: 1. верстальщик под битрикс 2. прогрммист под битрикс обязателен опыт работы с ...

    Закрыт
    12 лет назад
  • Есть шаблонизатор - типа Smarty - XTemplate. Никак не могу заставить его взаимодействовать с JQuery. Пример таков: -- index.xtpl -- {number} -- index.xtpl -- Чисто через PHP отпарсить блок просто: $from = 4; for($i = $from; $i <= 10; $i++) { ...

    Закрыт
    12 лет назад
  • $500

    Есть верстка и подробное ТЗ. Сайт на подобие доски объявлений. Необходимо написать систему управления для данного проекта на php. ТЗ будет выслано выбранному исполнителю. Пишите, кто готов взяться за такой проект.

    Завершен
    12 лет назад