Модуль распознавания смешанных кодировок
Кирилл14 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
17.07.2013
Необходимо разработать модуль / предоставить существующий / или же подсказать алгоритм для определения смешанной кодировки.
Смешанная кодировка — это когда в одном документе, веб странице, или текстовом блоке используется сразу несколько кодировок.
Задача модуля: Распарсить страницу, задетектить кодировки, сконвертировать их в win-1251
Файл с кодировками прикреплен к проекту