Поиск и удаление дублей данных в Microsoft Excel
В прикрепленном файле – две базы данных. Необходимо разработать приложение, которое бы сверяло эти базы внутри себя и между собой на наличие дублей номеров телефонов. При этом приложение должно сортировать номера на российские и нероссийские и делить их на две разные базы.
Дубли необходимо удалять, оставляя при этом одну самую свежую запись (в каждой базе есть столбец с датой).
Т.е. если в базе №1 есть номер телефона "Х" и в базе №2 есть номер "Х", а в базе №2 запись более свежая, то из базы №1 удаляем строку с телефоном "Х". В итоге номер "Х" остается в базе №2.
При поиске дублей должны учитываться разные написания номеров телефонов: 7910..., 8910... и т.д.
Т.е. номера 79105245152, 89105245152, 8-910-524-5152, 7-910-5245152 должны идентифицироваться как дубли.
Все номера телефонов должны быть приведены к единому формату: "79102459093" без пробелов и тире, начиная с цифры "7" (для российских номеров).
Последовательность действий приложения.
1. Определение номера: российский или нет. Если нет, сортировка номера в отдельный файл, удаление из файла с российскими номерами, проверка на дубли среди нероссийских номеров..
2. Если номер российский – приведение к единому формату + удаление дублей.