Интеллектуальный анализ данных (Data mining)
Теоретико-практическое задание по дата-майнингу, а именно по кластеризации.
Теоретическая часть — 10 страниц максимум:
- пару страниц о дата-майнинге, зачем нужен, где применяется, чем полезен;
- зачем нужна кластеризация, какие алгоритмы используются, налить какой-нибудь воды про нее;
- примеры прикладные (скажем, обзор софта некоторого или что-то в этом роде);
- заключение
Практическая часть (главная):
- методом кластеризации проанализировать выборку данных с помощью программы (любую, национальности/зарплаты/рождаемость и т.п.);
- объяснить зачем это делаем (какая прикладная польза);
- программа не важна, главное подкрепить скриншотами и комментариями к ним;
- собственно подкрепить заключением на тему - зачем это делали/что получили/что видно из скриншотов.
Сроки - воскресенье 16.06, вечер