Спарсить title на сайте
Нужно спарсить title статей на сайте kakprosto.ru + почистить его от лишнего. Парсим у себя на компе или сервере, а мне отдаете конечный файл с title. Формат файла не важен, либо текстовый файл, либо excel.
Раздел со всеми статьями на этом сайте:
http://www.kakprosto.ru/article/list
URL статей всегда начинается с:
Допустим мы спарили title вот этой страницы:
http://www.kakprosto.ru/kak-16531-kak-probit-cheloveka-po-nomeru-sotovogo-telefona
title у нее такой:
КАК пробить человека по номеру сотового телефона :: Информация по номеру мобильного телефона :: Hi-Tech :: Другое :: KakProsto.ru: как просто сделать всё
На выходе после чистки мы должны получить вот так:
Как пробить человека по номеру сотового телефона
И так для каждой страницы со статьями.