Парсер строк дивных

Андрей18 лет в сервисе

Данные заказчика будут вам доступны после подачи заявки

14.11.2008

Дано:

1) Есть список урлов in.txt с разными расширениями (html, php, txt...) список может достигать 10000 строк.

2) Есть файл out.txt в котором находится до 10000 строк (думаю будет меньше).

Сделать:

3) Переходим по каждому урлу по очереди с файла in.txt сохраняем все строки в память, оставляя только строки таких шаблонов

X.X.X.X:Y X.X.X.X,Y X.X.X.X Y где X-числа от 0 до 255, а Y-от 1 до 66000, шаблоны можно добавлять, менять в настройках.

4) В найденых строках и ищим по очереди каждую строку с файла out.txt допустим первом урле будет 6000 строк и совпадать с out.txt будет 30 строк то еще нужно вычислить % по такой формуле: 30/6000х100%=0.5%

5) Выводим на экран таблицу в которой будет:

первый столбец нумерация, 2-сами урлы, 3-количество строк (что соответс. шаблонам), 4-строк в файлесовпавших строк, 4- % вычислен по вышесказаной формуле.

1 http://sgsfdsg.com/ds.html 3889 140 3.5%

2 http://sghdfgdsg.com/ds.html 15000 329 2.19%

3 http://sgddsg.com/ds.html 467 4 0.85%

4 http://sgfddsg.com/ds.html 6000 20 0.33%

-строки должны располагатся в порядке убывания %

-урлы должны легко копироватся

Желательно на пхп

HTML PHP

Парсер строк дивных

Заявки фрилансеров