Парсер росаккредитации
Техническоезадание.
Требуется сохранить базу в формате CSV
Главная страница ресурса: http://fsa.gov.ru
Главная сложность: обход методов защиты от парсинга (Капча + возможно потребуется прокси)
Интересуютбазы:
Сертификаты соответствия
http://fsa.gov.ru/index/staticview/id/294/
{
1. Единый реестр сертификатов соответствия
2. Национальной части единого реестра выданных сертификатов соответствия.
3. Реестр сертификатов соответствия на продукцию, включенную в единый перечень
продукции, подлежащей обязательной сертификации (Постановление Правительства РФ
от 01.12.2009 № 982)
}
Декларации соответствия
http://fsa.gov.ru/index/staticview/id/295/
{
1. Единый реестр деклараций о соответствии
2. Реестр деклараций о соответствии продукции, включенной в единый перечень
продукции, подлежащей декларированию соответствия (Постановление Правительства
РФ от 01.12.2009 № 982)
}
Зайдя в одну из этих баз, выполните пустой поиск.
Далее переходим по каждой ссылки и вытаскиваем все данные имеющееся на странице и создаем для них соответствующие поля.
Следует учесть то что для каждойбазы (Единый реестр сертификатов соответствия, Реестр сертификатов соответствия
на продукцию, Единый реестр деклараций о соответствии, Реестр деклараций о
соответствии продукции) поля могут различаться. По-хорошему для каждой лучше
создать новый csv файл.