Обработка текстовых строк в файлах (Perl / PHP )
Нужен такой небольшой скринт (на Perl или PHP) который на сайте сможет обработать текстовые файлы.
На сервере (линукс) есть каталог в нем около 1000 маленьких .txt файлов
с именами
----------
0222112someword.txt
0223110someword.txt
0223111someword.txt
0223112someword.txt
........
.........
----------
Прикрепил один реальный файл.
В каждом файле по 1-60 строк такого формата
--------------------------
24.02.110|16:29:37|92.82.59.150|http://www.domain11111.net/dir-name/sitesettings.php|[email protected]|2.8|/dir-name/sitesettings.php|www.domain11111.net
24.02.110|16:29:39|92.82.59.150|http://www.domain11111.net/dir-name/sitesettings.php|[email protected]|2.8|/dir-name/sitesettings.php|www.domain11111.net
24.02.110|16:29:48|92.82.59.150|http://www.222222domain.com/dir-name2/sitesettings.php|blablabla|2.8|/dir-name2/sitesettings.php|www.222222domain.com
24.02.110|18:35:15|86.1.96.112|http://domain333333.co.uk/dir-name/home.php|NOTSET|2.8|/dir-name/home.php|domain333333.co.uk
-----------------------
Нужно эти все файлы обработать:
1. Вырезать из строк только все домены с именем каталога
2. Удалить все повторы
3. Добавить к каталогу "dir-name" файл login.php
4. Сохранить список всех этих УРЛов
5. Из полученых УРЛов сделать HTML со ссылками на эти УРЛы
(а как текст ссылки - домен и какое-то слово )
Пример какой результат должен получиться из того примера что я привел:
список УРЛов
------------------------
http://www.domain11111.net/dir-name/login.php
http://www.222222domain.com/dir-name2/login.php
http://domain333333.co.uk/dir-name/login.php
------------------------
HTML:
-------------------------
SOME TEXT www.domain11111.net
SOME TEXT www.222222domain.com
SOME TEXT domain333333.co.uk
------------------------