Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Все задания выполняются на dataset: https://www.kaggle.com/crowdflower/twitter-user-gender-classification

1. Предобработка данных (http://scikit-learn.org/stable/modules/preprocessing.html)

https://machinelearningmastery.com/how-to-prepare-data-for-machine-learning/

Оценить качество данных (полноту, точность и полезность данных). Оценить долю пропущенных значений и дубликатов в данных, наличие шумов и выбросов (http://scikit-learn.org/stable/auto_examples/ensemble/plot_bias_variance.html).

Обработка пропущенных данных и дубликатов- https://devpractice.ru/pandas-work-with-nan-part4/

https://www.datacamp.com/courses/cleaning-data-in-python

https://www.tutorialspoint.com/python/python_data_cleansing.htm

Обработка шума и выбросов. При наличии в данных шума и выбросов стоит проводить исследования в два этапа: 1) с выбросами и 2) с их отсутствием. Далее сравнить полученные результаты .

https://machinelearningmastery.com/how-to-use-statistics-to-identify-outliers-in-data/

2. Построение модели

В зависимости от поставленной задачи, использовать следующие модели:

https://habr.com/company/microsoft/blog/317512/

3. Отбор признаков

Отобрать наиболее информативные признаки - http://scikit-learn.org/stable/modules/feature_selection.html

4. Оценка качества модели

http://scikit-learn.org/stable/model_selection.html

Примечание. Задание рекомендуется выполнять с использованием специализированного пакета для машинного обучения scikit-learn на языке Python.

Задания 3-6 из прикрепленного файла

3 года назад
cipallina
25 летБеларусь
3 года в сервисе
Был
2 года назад
  • Похожие заказы
  • Здравствуйте! Нужен специалист, который может добавить в Телеграм чат базу номеров и знает, как это сделать! Прошу откликнуться тех, кто может это сделать. Напишите сроки и цену.

    Базы данных5 заявок
    Закрыт
    3 года назад
  • Ищу человека, который способен спарсить (собрать) уникальную аудиторию из Instagram. Объём работы составляет около 65-80 млн. человек.  Предоплаты нет, оплата за результат. Цену обговариваем, либо согласуем при заключении договора. Если нужно, можем составить договор.  Также желательно получить ПО, ...

    Базы данных2 заявки
    Закрыт
    3 года назад
  • В существующую базу данных, которая содержит формулы колеровки цветов, необходимо добавить форму ввода новых цветов, а также возможность привязки цвета к покупателю. И возможность поиска цвета по покупателю.

    Базы данных3 заявки
    Закрыт
    3 года назад
  • Здравствуйте! Необходимо разработать админ панель, основные функции - работа с существующей БД (mysql): - управление заказами - печать квитанций - экспорт данных - создание отчетов Есть исходники существующей клиентской версии (все подробности расскажу), с которой можно взять все необходимые sql запросы, логику ...

    Базы данных7 заявок
    Закрыт
    3 года назад
  • Приветствую! Задание следующее: Есть форма ввода данных. Нужно допилить ее. А именно - после ввода данных на основной части формы происходит выдача пользователю еще одного поля (при этом основная форма скрывается). Из всех полей данные нужно ...

    Базы данных1 заявка
    Закрыт
    3 года назад
  • Требуется специалист по сбору данных из Instagram в проект тестирования новейшего сервиса автоматизированного менеджера по продажам. Своевременная оплата согласно выполнению

    Базы данных3 заявки
    Закрыт
    3 года назад