Php parser-graber
Nuzen kontent parser+proxy parser na php.
Tech. Zadanije:
1.Avtomatizirovanij parser proxy+ parser kontenta.
Avtomaticheskij poisk proxy, proverka na anonimnost. Jesli ne naideno rabotajushchih proxy dolzen rabotat bez nich.
Dobavlenije proxy v file i udalenije nerabotajushchih.
2.Bozmoznost ispolzovat webcrawler ili web browser dlia parsinga.
3.Nastroika chisla potokov, vremia zaderzki – chtobi ne zabanili :) i vremia kogda nachinat parsing.
4. Dolzen izvlekat kontent, linki, xodit po linkam i znat chto takoe "next page". zapolniat formi.
5. Nastroiki sohraniajusta v projekt fail.
6.Output fail v chistij bez chem. xml fail struktura primerno takaja :
7. Nazvanije xml nod meniajutsa v zavisimosti ot nastroiki parsera, no struktura dolzna bit takoi:
Polnuju strukturu mozno budel poluchit pri sdelke.
------------
-----------
-------
8. Vozmosnost vruchnuju podkorektirovat XPath. Tipa is [0-9]
9.Sohraniat dannije v dva faila: v odin tolko novije, v drugoj vse dannije. Proverka na dublikati.
10. Nikakix ioncube i pochozih enkoderov i dekoderov.Chistij php.
Vrode bi vsio opisal. Podumaite i napishite mne otvet.