Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Парсер урлов страниц

Многопоточность

На входе задаем тхт док с урлами - их может быть дововльно много .. ну до 100к

- нужна возможность задавать макс. размер страницы (в КБ), если больше то игнорируем ее

- возмножность задавать количество потоков

- нужна возможнать задавать таймаут ответа страницы

- нужна возможность игнорирования скриптом 404 итд ошибок

- файл логов где бы было написано куда зашли, и что получили в таком формате:

урл который обрабатываем|размер|ошибка если была |количество найденых урлов удовлетвор. условию|найденая фраза\фразы, если есть|записано или нет в результаты|

- не надо никаких интерфейсов, кроме страницы где бы % выполнения отображался бы просто в пхп файле нужен выбор режима:

а) Режим при котором скрипт собирает все урлы на странице (в том числе и текстовые),

на котором собираються урлы. + опция собирать\не собирать урлы, которые содержат домен на котором они собираются

б) Режим при котором собираются урлы по масках (используя регулярные выражения)

+ опция собирать\не собирать урлы, которые содержат домен на котором они собираются

*add.php?tid=*

*add.php?mode=reply&f=*&t=*

*add.php?mode=reply&t=*

*add.php?mode=reply&t=*

( "*" я обозначил любое содержание, так как в регул. выраж пока не совсем ориентируюсь )

Результаты пишем в result.txt

В обоих режимах еще нужно добавить опцию поиска фраз: если фраза есть в коде страницы то урл пишем в результаты + в логи пишем

что была найдена фраза 1 sport или 2 фразы сразу, если фраз не указано - то ниче не искать

phrase1=sport

phrase2=music

phrase3=car

.

.

14 лет назад
sunford
Андрей 
40 летУкраина
17 лет в сервисе
Был
2 года назад
  • Похожие заказы
  • Доброго времени. Требуется не дорогое создание шаблона ДЛЕ. Создать нужно в чёткости по картинкам что прикрепил. Сразу пишите цену, это важно. исходники есть. Пишите 494430057

    Закрыт
    14 лет назад
  • Задача элементарна и проста. Есть интернет-радиостанция. Нужно сделать простейший плеер (приложение) для сайта Вконтакте. Никакого дизайна не нужно. Я представляю это себе как кнопочку Play и всё..

    Завершен
    14 лет назад
  • Здравствуйте, господа программисты! :) Мне нужно несколько скриптов для движка Datalife engine v.8.3 Требований к интерфейсу нет, делайте, как считаете нужным, мне важен конечный результат. Поехали: 1. Нужно изменение дат для новостей, с возможностью выбора: ...

    Закрыт
    14 лет назад
  • $100

    Необходимо написать ТЗ для сайта, и предложить на каком движке его лучше реализовать. Я Вам дам список сайтов конкурентов и примерное описание того что должно быть на нашем сайте. Приглашаю к работе ТОЛЬКО опытных программистов, в проекте ...

    Закрыт
    14 лет назад
  • Кто может подсказать как убрать данные ошибки? что то связанно с mysql rumillion.net/partner http://floomby.ru/content/gom6qwaWv0/ http://floomby.ru/content/tTwfH9hsdk/

    Закрыт
    14 лет назад
  • По ошибке, сотрудница удалила стандартный компонентJoomla, а именно каталог статей (новости) - com_content Удалила только в админке. Я понимаю что восстановить его просто, но как, понять не могу... Кто может помочь? Сайт на локалхосте, работы на 5 ...

    Завершен
    14 лет назад
  • $50

    Нужен оптимальны скрипт блокирующий посещение ресурса из стран Чёрного списка (с возможностью исключения для определённых IP адресов), дающий "добро" на вход странам Белого списка. П.С. Имеется старый PHP скрипт более-менее выполнявший эту функцию, но по ...

    Завершен
    14 лет назад
  • СТРОГО без предоплаты, много кидалова нынче (( Предлагайте реальные сроки, господа, чтобы потом смогли в них вписаться, иначе будут штрафы по оплате. Сейчас сайт выполнен на HTML+XML. Нужно сохранить полный функционал и дизайн, только перенести ...

    Завершен
    14 лет назад
  • Сайт агентства недвижимости. Что надо: - Внедрить новый дизайн. Макеты есть. - Улучшить / написать новую CMS, современные функции (карта метро и т.п.. Ajax). Подобие ТЗ есть. Оплата поэтапная, но без предоплаты. Предлагайте цены и сроки.

    Закрыт
    14 лет назад