Провести тестирование алгоритмов маш обучения k-Means и fuzzy k-Means

Владислав8 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
15.06.2019

Цель задания:

С помощью библиотеки Mahout провести пару экспериментов по кластеризации, имея набор данных с помощью алгоритмов машинного обучения k-Means и fuzzy k-Means.

Необходимо сделать следующее:

1) Настроить кластер(3 машины) Hadoop Cloudera и Apache Mahout (CDH)

2) Провести вышеописанный эксперимент и получить результаты

Алгоритмы не нужно реализовывать, они готовы и находятся в библиотеке Mahout.

Первый пункт не обязателен, главное провести эксперименты, можно на уже готовом кластере если есть возможности по аренде.

Возможно проведение эксперимента с помощью Spark и библиотеки MLlib.