Модуль распознавания смешанных кодировок
Кирилл14 років у сервісі
Дані замовника будуть вам доступні після подання заявки
17.07.2013
Необходимо разработать модуль / предоставить существующий / или же подсказать алгоритм для определения смешанной кодировки.
Смешанная кодировка — это когда в одном документе, веб странице, или текстовом блоке используется сразу несколько кодировок.
Задача модуля: Распарсить страницу, задетектить кодировки, сконвертировать их в win-1251
Файл с кодировками прикреплен к проекту