Нужна программа для создания ссылок из логов
Есть сайт, у него установлена статистика австатс. Ведутся логи.
Файл с логами имеет текстовый вид, но расширения могу быть log и другие.
Я включаю программу, указываю ей на этот файл и запускаю. Программа работает построчно. Строки с заходами поисковых роботов программа игнорируется и идет дальше.
Программа ищет строки, которые указывают что пользователь перешел из поисковой системы (Яндекс, Гугл и прочее).
Как только программа находит такую строку, она вычленяет из нее ключевую фразу и урл страницы, куда по ней был произведен переход. Программа формирует ссылку, в которой анкор - это ключевое слово, а урл - это урл страницы сайта, куда по данному ключевому слову пользователь перешел из поисковой системы. Эту ссылку программа записывает в текстовый файл. Ссылки в этом файл должны располагаться построчно.
Этот текстовый файл и есть то, ради чего мне нужна такая программа. Программа должна показывать % выполнения работы.
После создания этого файла программа должна очистить его от дублей. Дубль - это совпадающие ключевые фразы, причем совпадающие с точностью до буквы, то есть "пластиковые окна в Москве" и "пластик окна в Москве" - это разные ключевые фразы. Там будет большой объем работы, поэтому надо 1) функцию очистки вывести отдельной кнопкой 2) показать % выполнения
Еще - программа должна работать также и с каталогом - то есть я могу указать ей каталог с файлами для создания файлов ссылок, и программа должна сделать их все последовательно. Также программа должна работать и при очистке файлов со ссылками.
Программа должна работать под Винду ХР