Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Задача: парсинг (разбор) HTML кода страниц с результатами поиска билетов (свободных мест) на авиарейсы из всех городов России в заданный город-курорт, и туда и обратно.

Оплата либо через сервис "Сделка без риска", либо после демонстрации работоспособности (на своем или моем хостинге), можно разбить на 2-х этапа (например половина оплаты сразу после получения страницы выдачи по входным параметрам, вторая после получения массива с результатами).

Жду предложения с указанием схемы работы, и по каждому сайту стоимости и крайнего срока.

Список сайтов турагенств:

1) http://online.laginatravel.ru/Extra/AviaQuotesEx.aspx

2) http://online1.sunrise-tour.ru/TVSearch/FlightMonitor.aspx

3) http://online3.anextour.ru/freight_monitor

4) http://pac.ru/component/option,com_airflight/

Входные параметры:

1) Диапазон, в котором скрипт на каждую дату должен парсить рейсы вылета и прилета обратно = 49 дней (или больше, если рейсы на 49-й день недоступны, выбрать ближайший доступный после него), соотв-но в поисковой форме скрипт должен выбрать диапазон от ближайшей даты вылета до даты прилета, в форме будут либо обе эти даты, либо дата вылета и к-во ночей тура, определяющее дату прилета).

2) Направления вылета и прилета: скрипт должен считать все возможные значения списков городов/стран (для вылета только города России), и перебирая все возможные комбинации, подставлять их и парсить выдачу. Если есть еще другие фильтры в поисковой форме - скрипт должен выбрать вариант "все", чтобы ничего не фильтровалось, либо если в списке на выбор нет такого варианта, то нужно подставлять все возможные опции этого списка и парсить выдачу со всеми вариантами.

3) В поисковой выдаче парсить рейсы только из колонки "эконом класс" (если у турагенства несколько экономов с разными версиями, результаты от них нужно объединить).

Выходные данные:

В результате парсинга страницы с найденными рейсами нужно сформировать массив элементов, каждый из которых будет содержать текстовую информацию из поисковой выдачи о всех найденных рейсах, со следующими полями (некоторых данных в выдаче сайта может не быть, тогда их не заполнять):

city_from_name: город вылета (в России)

city_to_name: город прилета (курорта)

is_return_flight: 0 если рейс туда (курорт), 1 - обратно

flight_date: дата перелета (формат ГГГГ-ММ-ДД)

time_start: время вылета (формат ЧЧ.ММ)

time_end: время прилета (формат ЧЧ.ММ)

airport_from: код аэропотра вылета (обычно 3-5 символов, например "HRG", "SVO-F")

airport_to: код аэропотра прилета (обычно 3-5 символов, например "HRG", "SVO-F")

code: номер рейса (например "7K 9815")

airport_from_name: название аэропорта вылета (например "Анталия-1")

airport_to_name: название аэропорта прилета (например "Шереметьево С")

operator_name: название авиакомпании (например "Аэрофлот")

plane: название самолета (например, "B 747")

places: 0, если в выдаче указано, что на рейс нет ни одного свободного места, иначе 1.

Среда любая, желательно Windows+Apache, если язык не PHP, при запуске скрипт должен выводить массив в формате JSON или другом (по согласованию), если вместо скрипта приложение, то сохранять в файл.

12 лет назад
neboley
42 годаРоссия
14 лет в сервисе
Был
9 лет назад