Удаление дубликатов строк в Exel файле
Есть большой экселевский файл с клиентской базой интернет-магазина. Вида см. «скрин 1». Всего в базе 2 столбца: 1-й ФИО, 2-й E-Mail и тысячами строк. Каждая строка = одному заказу от клиента.
Но в базе иногда встречаются «дубликаты». Причем дубликаты такие, что ФИО клиента разные, а E-Mail один. Например, клиент сделал всего 3 заказа. Из них 2 заказа для себя и 1 заказ в подарок родственнику. См. на скриншоте строки 12, 13, 14.
Таким образом в базе данный E-Mail повторяется 3 раза, а надо чтобы он присутствовал в базе всего 1 раз + ЛЮБОЕ ФИО из строки 12, 13, 14, т.к. оно ассоциировано с этом E-Mail.
Базу надо почистить от таких дубликатов.
Т.е., например, строка 13 и 14 удаляется, а строка 12 остается (Email + ФИО ассоциированные) В экселе сделать данную процедуру, стандартной функцией УДАЛИТЬ ДУБЛИКАТЫ НЕ получится, т.к. при использовании данной функции, естественно мы расширяем диапазон ячеек со столбца E-Mail и на столбец ФИО. В этом случае удалится только строка 14, т.к. 13=14 ФИО=E-MAIL, А 12 И 13 СТРОКА ОСТАНУТСЯ. Это неверно! Нам нужно, чтобы осталась, только одна строка, например 14, а 13 и 12 были удалены, т.к. все они на один E-Mail.
Файл клиентской базы «для чистки» предоставить не могу, по понятным соображениям. От вас надо написать подробную инструкцию текстом или видео-инструкцию, как мы можем самостоятельно решить данную задачу.
Оплата Яндекс.Деньги или WebMoney на выбор.