Описание профиля отсутствует
  • $18

    Все задания выполняются на dataset: https://www.kaggle.com/crowdflower/twitter-user-gender-classification 1. Предобработка данных (http://scikit-learn.org/stable/modules/preprocessing.html) https://machinelearningmastery.com/how-to-prepare-data-for-machine-learning/ Оценить качество данных (полноту, точность и полезность данных). Оценить долю пропущенных значений и дубликатов в данных, наличие шумов и выбросов (http://scikit-learn.org/stable/auto_examples/ensemble/plot_bias_variance.html). Обработка пропущенных данных и дубликатов- https://devpractice.ru/pandas-work-with-nan-part4/ https://www.datacamp.com/courses/cleaning-data-in-python https://www.tutorialspoint.com/python/python_data_cleansing.htm Обработка шума ...

    Базы данных1 заявка
    Закрыт
    3 года назад