Разделение базы запросов по темам.

Дмитрий18 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
23.06.2008

Имеется база данных запросов к поисковикам около 20 000 000 записей. (восновном английская)

Необходимо разбить ее на темы, а темы на список однословных ключей.

Каждый ключ находящийся в файле для однословного ключа должен максимально соответсвовать общей теме для данного списка файлов.

В результате база не должна сократится по кол-ву ключей.

Жду Ваших предложений по способам как Вы предлагаете это сделать.