Парсер для вот такой структуры страницы
======================================================
Что надо сделать
======================================================
0. Написать на PHP 5 парсер данной структуры и положить в эти таблицы.
1. Оформить в виде функции: parse_ads($date_fr=NULL, $date_to=NULL). Если параметры не переданы - парсить объявления с последнего интервала до настоящего момента.
2. Спарсить у себя. ПОСМОТРЕТЬ что получилось. Отдать мне дамп.
============================================
Структура HTML
============================================
22.01.2013 11:28
Сверхтонкий теплоизоляционные покрытия Корунд
Компания: KORUND LTD
Город: Волгоград
Телефон/fax: 506230
Интернет:
Корунд - это теплоизоляционные покрытия, используемые для утепления самых любых объектов. С помощью покрытию Корунд возможно производить утепление трубопроводов разнообразного назначения, строительных конструкций (стен, потолков, полов) как снаружи так и внутри, оборудования, нефтяных емкостей , средств водного, авиа, и наземного транспорта и т.Д.
============================================
Засунуть в MySql БД
============================================
/* ==================== Интервалы ==================== */
CREATE TABLE `parser_ads_intervals`(
`id` INT NOT NULL AUTO_INCREMENT,
`date_fr` DATETIME NOT NULL,
`date_to` DATETIME NOT NULL,
PRIMARY KEY (`id`)
);
/* ==================== Справочник «Города» ==================== */
CREATE TABLE `parser_ads_city`(
`id` INT NOT NULL AUTO_INCREMENT,
`name` VARCHAR(255) NOT NULL,
PRIMARY KEY (`id`)
);
/* ==================== Объявления ==================== */
CREATE TABLE `parser_ads`(
`id` INT NOT NULL AUTO_INCREMENT,
`create_date` DATETIME NOT NULL,
`title` VARCHAR(1000) NOT NULL,
`text` TEXT NOT NULL,
`id_city` INT NOT NULL,
`id_interval` INT NOT NULL,
`company_name` VARCHAR(100) NOT NULL,
`fio` VARCHAR(100) NOT NULL,
`post` VARCHAR(100) NOT NULL, /* должность */
`phone` VARCHAR(100) NOT NULL,
`email` VARCHAR(100) NOT NULL,
`website` VARCHAR(255) NULL,
PRIMARY KEY (`id`)
);