Парсер строк дивных
Дано:
1) Есть список урлов in.txt с разными расширениями (html, php, txt...) список может достигать 10000 строк.
2) Есть файл out.txt в котором находится до 10000 строк (думаю будет меньше).
Сделать:
3) Переходим по каждому урлу по очереди с файла in.txt сохраняем все строки в память, оставляя только строки таких шаблонов
X.X.X.X:Y X.X.X.X,Y X.X.X.X Y где X-числа от 0 до 255, а Y-от 1 до 66000, шаблоны можно добавлять, менять в настройках.
4) В найденых строках и ищим по очереди каждую строку с файла out.txt допустим первом урле будет 6000 строк и совпадать с out.txt будет 30 строк то еще нужно вычислить % по такой формуле: 30/6000х100%=0.5%
5) Выводим на экран таблицу в которой будет:
первый столбец нумерация, 2-сами урлы, 3-количество строк (что соответс. шаблонам), 4-строк в файлесовпавших строк, 4- % вычислен по вышесказаной формуле.
1 http://sgsfdsg.com/ds.html 3889 140 3.5%
2 http://sghdfgdsg.com/ds.html 15000 329 2.19%
3 http://sgddsg.com/ds.html 467 4 0.85%
4 http://sgfddsg.com/ds.html 6000 20 0.33%
.
.
-строки должны располагатся в порядке убывания %
-урлы должны легко копироватся
Желательно на пхп