Доработка проги Php парсера.
Сделана программа-парсер на пхп.
программа уже сделана. Её нужно доработать.
---Описание программы:
1.Программа заходит на сайт
На сайте все объявления о работе находятся в таблицах
ПРИМЕР такого сайта 74 точка ру.
То есть в таблице с вакансией есть графы, например, "должность" под ней - графа "зарплата" и т.д.
Программа берет и копирует содержание ячейки "должность" в ЯЧЕЙКУ должность УЖЕ ДРУГОГО САЙТА - нашего. Предварительно фильтруя содержание данной ячейки через синонимайзер.
ТО есть задача скопирвать и автоматически залить на сайт ОПРЕДЕЛЕННЫЙ % вакансий другого сайта. Этот % нужно указывать в начале работы программы. И еще отмечать галочкой разделы для копирования с сайта (например, Тор-менеджмент, ИТ-специалисты – они на том сайте не меняются).
При этом чтобы каждая графа таблицы 1 сайта (не слово "Водитель",а графа ячейки,например, "требуется на работу водитель") проходила синонимизацию.
Синонимайзер можно подключить любой, но с возможностью редактирования словаря.
--Необходимо внести в нее доработки:
1. Там добавить пару строк,чтобы программа снова начала работать. То есть в таблице,куда вставляются вакансии,похоже,появилась новая строка,и парсер ее не видит.Вот ее прописать.
2. Чтобы вакансия, спарсенная первой отображалась также на первой странице. А не так,что вакансия ,скопированная первой оказывается в итоги в глубине сайта.
3.Там в вакансиях,корторые копируются, есть раздел "требования".
Каждый раздел вакансий при парсинге синонимизируется через словарь синонимов.
Раздел требования - через словарь синонимов "требования".
Если слово ,которые в разделе "требования" не встречает синонима в словаре синонимов,то слово добавляется в отдельный файл текстовый.
4. Задержка 15 секунд между копированиями.