Php parser-graber

Римантас13 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
09.09.2012

Nuzen kontent parser+proxy parser na php.

Tech. Zadanije:

1.Avtomatizirovanij parser proxy+ parser kontenta.

Avtomaticheskij poisk proxy, proverka na anonimnost. Jesli ne naideno rabotajushchih proxy dolzen rabotat bez nich.

Dobavlenije proxy v file i udalenije nerabotajushchih.

2.Bozmoznost ispolzovat webcrawler ili web browser dlia parsinga.

3.Nastroika chisla potokov, vremia zaderzki – chtobi ne zabanili :) i vremia kogda nachinat parsing.

4. Dolzen izvlekat kontent, linki, xodit po linkam i znat chto takoe "next page". zapolniat formi.

5. Nastroiki sohraniajusta v projekt fail.

6.Output fail v chistij bez chem. xml fail struktura primerno takaja :

7. Nazvanije xml nod meniajutsa v zavisimosti ot nastroiki parsera, no struktura dolzna bit takoi:

Polnuju strukturu mozno budel poluchit pri sdelke.

------------

-----------

-------

8. Vozmosnost vruchnuju podkorektirovat XPath. Tipa is [0-9]

9.Sohraniat dannije v dva faila: v odin tolko novije, v drugoj vse dannije. Proverka na dublikati.

10. Nikakix ioncube i pochozih enkoderov i dekoderov.Chistij php.

Vrode bi vsio opisal. Podumaite i napishite mne otvet.