Скрипт маппинга
Нужно сделать скрипт/программу для маппинга url_1 c url_2 на основе привязанных к ним фраз
Пример данных в исходном файле - https://docs.google.com/spreadsheets/d/1lQCAop1wJlWd-C_QGJt-6RfRpeFqKPgCN7qiSeWlIL8/edit?usp=sharing
Примерный алгоритм работы с данными из файла:
1. Берем url_id_vbr = 1, к нему привязано 30 фраз/id_фраз
2. Задача найти в столбце url_banki, url к которому привязано наибольшее кол-во фраз/id_фраз привязанных к url_id_vbr = 1 и присвоить этому url (всей совокупности этого url) в столбце mapping_url_id, id = 1
Далее берем url_id_vbr = 2, находим в столбце url_banki, url к которому привязано наибольшее кол-во фраз/id_фраз привязанных к url_id_vbr = 2 и присваиваем этому url в столбце mapping_url_id, id = 2
и т.д.
Если на шаге 2, в столбце url_banki у выбранного url уже стоит значение в столбце mapping_url_id, то не перезаписываем у него это значение, а добавляем новое через запятую без пробела - 1,2,3
В исходном файле может быть несколько сот тысяч строк, обычно около 100к
В заявке напишите на чем планируется реализация