Парсер словарей с сайта http://dic.academic.ru/
Нужен парсер словарей с сайта http://dic.academic.ru/, только внутренних (например http://dic.academic.ru/), словари, ссылки на которые ведут вне этого домена (обычно иностранные языки) парсить не надо
Разметка словарных статей простая, по данному принципу - http://webmaster.yandex.ru/vocabularies/enc-article.xml
За 1 проход может парситься 1 словарь, выдача простая (например csv-файл с разделителем, если хочется - то можно xml)
Замеченные тонкости:
1. На некоторые понятия более 1 словарной статьи на странице
2. Есть статьи с картинками (картинки нужно нумеровать и прикладывать в отдельной папке с номером, соответствующим номеру словарной статьи в выходном файле)
Нужны исходники, чтобы возникающие трудности я уже правил сам, желательно Visual Studio
Сейчас интересует цена-сроки