Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Необходима функция, которая парсит сайт и при этом сохраняет в базе данных его категориальную структуру. То есть записи БД будут иметь следующий формат:

ID URL страницы URL родительской страницы

Идентификация структуры может проходить либо по структурам URLов сайта - например:

site.ru/papka

site.ru/papka/doc1

В данном случае site.ru/papka/doc1 является подстраницей site.ru/papka.

Также должна быть возможность вместо использования структуры в качестве базиса идентификации категорий, использовать маркеры для определения родительских страниц (маркер - это кусок кода на странице, который может включать название категории). Например, на блоге на вордпресс с ЧПУ вида blog.ru/postname - это может быть код, в котором заключено название категории.

Также будут приветствоваться и поощряться любые советы в оптимизации алгоритма.

p.s. желательно сотрудничество с человеком, у которого уже есть готовые решения.

p.p.s. базовые функции для получения контента со страницы, а также сбора внутренних ссылок я предоставлю (просто функции уже отлажены, поэтому настаиваю именно на их использовании)

14 лет назад
lofti
37 летУкраина
15 лет в сервисе
Был
7 лет назад
16 отзывов(-1)
  • Похожие заказы
  • Требуется разработать модель и контроллер, без визуальных форм для простого сервиса управления файлами. Среда - Ruby 1.9.1 , Rails 2.3.5 Общие требования к моделям и процессу разработки: http://123.writeboard.com/804de8d7ac7ade4d4 Требования к модели и ее контроллеру, которые нужно реализовать: http://123.writeboard.com/f58702cb059d9831f Пароль на доски ...

    Завершен
    14 лет назад
  • Необходимо создать небольшой сайт стандартной конфигурации без наворотов. На любой цмс Бюджет небольшой Выбирать буду по цене Верстка уже готова

    Завершен
    14 лет назад
  • Здравствуйте! Вообщем есть сайт с категориями и подкатегориями. Нужно сделать так чтобы у меня выводились подкатегории в левой колонки и чтобы они не пропадали, когда я нажму на одну из этих подкатегории. Подробнее: Допустим есть категория Авто, ...

    Закрыт
    14 лет назад
  • $100

    В общем граббер должен выполнять следующее: Возможность граббить с большинства сайтов, построенных на этой CMS. граббер должен отличаться удобным интерфейсом и хорошим качеством граббинга. Также, в отличие от остальных грабберов, он должен использывать объектную модель ...

    Закрыт
    14 лет назад
  • Нужно изменить цвет scrollbar'a так, что бы он менялся во всех браузерах, а не только в IE. Также следует учесть то, что бы вместе с ним работал класс jQuery $j(".class").scrollTop(65000); Ну и корректно работал при добавлении ...

    Завершен
    14 лет назад
  • Сделана регистрация, нужно доработать, и сделать на основе дизайн макетов личный кабинет (там будут регистрационные данные доступные для изменения), размещение вакансий, резюме и поиск по ним, доска объявлений по категориям, размещение объявлений, изменение, удаление, поиск ...

    Закрыт
    14 лет назад
  • Есть страница: http://bestshop.dp.ua/test/index.html В коде организован выбор одного из рисунков в зависимости от разрешения экрана пользователя и плавное появление этого рисунка. На локальном компьютере все работает отлично, но при загрузке с интернета эффект плавного появления совпадает ...

    Завершен
    14 лет назад