Приложение по удалению дублей в базе данных
Необходимо сделать приложение, которое будет сверять номера телефонов на дубли.
Исходная база всегда будет одного и того же формата, номера телефонов будут в первом столбце.
Итоговая база делится на три файла: файл с российскими номерами, файл с нероссийскими номерами, файл с номерами, не поддающимися идентификации.
Критерии отнесения номера к определенному типу:
- российский: длина 11 знаков, начинается с 7 или 8.
- нероссийский: длина 12 – 13 знаков, начинается с любой цифры кроме 7 или 8.
- остальные: все остальные случаи.
Во всех номерах должны быть удалены все знаки кроме цифр и знаков, разделяющих номера между собой.
У российских номеров начальный код «8» должен быть заменен на «7», номера «79102450000» и «89102450000» должны считаться дублями.
Если обнаруживается дубль, то удаляется вся строка с данными. Удалению подлежит та строка, которая находится ниже.
Примеры.
Для номера 79102450000 являются дублями следующие случаи:
89102450000, 8-910-245-00-00, 7(910)-245-00-00, 7.910.245.0000, тел:89102450000, доб. 250; 7 910 245 00 00 и т.д. по аналогии.
P.S. По окончании работ предоставляется в пользование само приложение, а также его исходники.