Простой рендомайзер
не важно на чем.
если php то и интерфейс не нужен. параметры и так вбить можно.
.....
генерируются комбинации строк. в строках могут быть слова, могут цифры. в принципе не важно для работы скрипта.
алгоритм:
два файла. основной, разбавочный.
скрипт в процентном соотношении (указываются в настройках) берет построчно текст из файлов вырезая из источника. таким образом исключаем повторения. первая строка взятая для генерации становится именем тхт файла. расстановка строк взятых из первого и второго файла тоже генерируются случайно.
настройки:
указываем какой процент второго файла брать. соответственно оставшийся процент берется из первого.
указываем процент точек/запятых. (можно просто указывать количество )
указываем сколько (строк/результатов) должно быть в тхт файле.
указываем сколько файлов нам нужно сгенерировать.
на выходе получаем:
тхт файлы которые названы по имени первой строки взятой для генерации, эта же строка участвует в генерации тела тхт файла. файл состоит из (n) строк указанных в настройках.
программа должна быть в состоянии обрабатывать многотысячные файлы. содержащие по 20,30,50 тысяч строк.
пример:
содержимое первого файла:
1-1
1-2
1-3
1-4
1-5
1-6
1-7
1-8
1-9
1-10
1-11
1-12
1-13
1-14
1-15
1-16
1-17
1-18
1-19
1-20
содержимое второго файла:
2-1
2-2
2-3
2-4
2-5
2-6
2-7
2-8
2-9
2-10
2-11
2-12
2-13
2-14
2-15
2-16
2-17
2-18
2-19
2-20
настройки:
процент второго файла - 20-40%
сколько точек/запятых - 70/30
сколько (строк/результатов) брать - от 3-6
сколько файлов нам нужно - 3 (в примере точно задано, а в рабочем варианте тоже диапазон задается)
результат:
файл 1-19.txt содержит
1-7. 1-1, 2-11. 1-19. 2-18.
файл 1-6.txt содержит
1-2. 1-6. 1-14. 2-4, 1-17.
файл 1-4.txt содержит
1-4, 1-10. 2-6. 2-13. 1-12.
то что осталось в файлах.
содержимое первого файла:
1-3
1-5
1-8
1-9
1-11
1-13
1-15
1-16
1-18
1-20
содержимое второго файла:
2-1
2-2
2-3
2-5
2-7
2-8
2-9
2-10
2-12
2-14
2-15
2-16
2-17
2-19
2-20
естесственно пустые строки подрезаются. в примере оставлены для наглядности.