Программа расстановки ссылок в размноженные статьи
Нужна программа для умной расстановки ссылок в размноженные статьи. Желательно реализовать на платформе С++.
Идея такова:
К примеру имеется 100 статей, в них нужно вставить точное кол-во разных анкоров, при том кол-во ссылок на 1 статью не должно превышать (к примеру ) 5.
В итоге в целом нам нужно встроить в статьи около 500 ссылок.
У нас 17 различных анкоров, с заданными пропорциями
Ссылка1 – 75 шт.
Ссылка2 – 55 шт.
Ссылка3 – 40 шт.
Ссылка4 – 40 шт.
Ссылка5 – 40 шт.
Ссылка6 – 40 шт.
Ссылка7 – 30 шт.
Ссылка8 – 30 шт.
Ссылка9 – 25 шт.
Ссылка10 – 20 шт.
Ссылка11 – 20 шт.
Ссылка12 – 20 шт.
Ссылка13 – 20 шт.
Ссылка14 – 10 шт.
Ссылка15 – 10 шт.
Ссылка16 – 10 шт.
Ссылка17 – 10 шт.
Нужно что бы все анкоры встали в статьи именно в том объеме, который расписан выше и без дублей.
Бывает, что в тексте часто встречаются однотипные слова поэтому было бы неплохо что бы программка вставляла анкоры в разные места статьи случайным образом.
Еще необходимо, что бы был параметр, задающий кол-во текста между анкорами, что бы избежать тех случаев, когда разные ссылки могут встать, к примеру, в одном предложении.
Программа должна проставлять сначала первую ссылку во все статьи потом вторую и тд., до лимита ссылок в статье (в данном случае у нас он 5), если лимит достигнут то программа ищет места под сслыки в других статьях. Это нужно для того что бы первым делом занять второстепенный анкор например “автомобиль bmw”(такое вхождение может быть всеголишь одно в тексте его нужно занимать первым делом), а следущий проход поставит ссылку в другом месте просто на “автомобиль”, естественно нужно продумать тот момент что бы не было двойной ссылки типа автомобиль bmw.
Перед расстановкой ссылок нужно сделать анализатор статей на кол-во вхождений ключевых запросов. На основе этого анализа и будет составляться очередность расстановки ссылок.
И наконец, когда программа завершает расстановку она должна выдавать отчет о том сколько и каких ссылок она смогла расставить в статьи, и общий объем ссылок.