Прога по очистке CSV от послед-ей символов.
Состоит из двух частей:
proga.exe - прога и config.inf - конфигурационный файл.
В config.inf будем прописывать:
1. какой столбец обрабатывать: все столбцы, несколько конкретных, один конкретный.
2. Что мы чистим.
Вводим в прогу следующие операторы:
2.1 любой символ.
2.2 любая последовательность символов.
2.3 любая цифра.
2.4 любая последовательность цифр.
Можно использовать что-то типа вордовских спецсимволов для автозамен:
^p абзац
^v разрыв строки
^$ любой спецсимвол
Итоги работы и цели написания проги.
Есть файл csv, в столбцах которого содержатся подлежащие удалению блоки символов.
Конкретно это номера телефонов, адреса электронных почт, сайтов, названия компаний, имена и фамилии, различные частные слова.
Всё это имеется в разных форматах: номер может быть 777-77-77, а может быть и +7(495)777.77.77 (и ещё более 10 форматов написания-ибо люди по-разному пишут номера).
То же касается адресов почт; адресов сайтов, в т.ч линков на конкретные страницы; имён и фамилий.
Вот итоги работы проги и состоят в удалении-замене на пробел заданных форматов последовательностей символов.
Что нужно получить как результат работы:
1. Прогу с интерфейсом выбора исходного csv и задания итогового.
2. окном редактирования последовательностей к автозамене (или то же в конфиг файле).
3. готовым словарём замен различных форматов телефонов, почт, адресов сайтов, славянских имён и фамилий. остальное добавлю сам.
Файл со столбцами к зачистке во вложении, для того чтобы можно было и проверить и посмотреть что чистить прийдётся и от чего.
Все их надо зачистить от персонифицирующей инфы: телефонов, почт, адресов сайтов, славянских имён и фамилий, названий компаний.
Файл с примером мусора (не всё тут) во вложении.
Ответы жду в тендере.
Прошу не писать в личку, аську и скайп, не звонить.
Я сам свяжусь.
Не информативные предложения не рассматриваю.