Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Требуется: датасет в формате .csv, готовый и рабочий эксперимент Azure ML, презентация с подробными скриншотами эксперимента и с описанием выполняемых действий, оформление не требуется. Данные на усмотрение исполнителя, важно пройти все шаги, указанные ниже.

Срок: до 20.11.2023

Шаги выполнения:

Выбрать и описать набор данных для анализа, а также сформулировать задачу, которая будет решаться в рамках проекта. В качестве набора данных можно использовать данные из различных контестов (kaggle и т.п.).
Произвести описание характеристик и физического смысла каждого атрибута данных. Оценить количественные характеристики набора данных, в том числе количество пропущенных значений, типы признаков (числовые, порядковые, категориальные и так далее).
Произвести предварительную обработку данных, включая, при необходимости, очистку, обработку пропущенных значений, выделение признаков, генерацию признаков и так далее.
Провести описательный анализ данных. Этот этап включает в себя определение шкалы измерения каждого признака, выявление аномальных значений, визуализацию распределения каждого признака, при необходимости — проверку на нормальность, построение корреляционных матриц и матриц совместных распределений каждого признака с целевой переменной, выявление коррелированных признаков и признаков, не несущих информации для данной задачи. При необходимости произвести понижение размерности и поиск аномалий.
Сделать выводы.
Проверить сбалансированность набора данных (в случае выявления несбалансированности принять меры). Выбрать и обосновать выбор метрик качества модели. Разделить набор данных на обучающую и тестовую выборки. Обосновать количественные характеристики и метод разделения (временной, случайный, последовательный).
Обучить несколько базовых моделей для решения выбранной задачи.
Проанализировать результаты, сделать выводы.
Выбрать наиболее перспективную модель для решения поставленной задачи. Постараться улучшить полученный результат. Это можно осуществить введением суррогатных признаков, отбором признаков, нормализацией данных, ансамблированием моделей, изменением алгоритма предварительной обработки данных. Сравнить полученные результаты.
Представить результаты моделирования в наглядном виде (графики, таблицы сравнения моделей, таблицы классификации, и другие). Сделать выводы, сравнить с существующими аналогичными решениями, порассуждать о перспективах решения проблемы.

6 месяцев назад
Nakiono
34 годаКазахстан
6 месяцев в сервисе
Был
6 месяцев назад
  • Похожие заказы
  • Cделать в fastreport шаблон документа, приложение Бизнес Пак.

    Базы данныхнет заявок
    Закрыт
    5 месяцев назад
  • $35

    и так нужна база для футбольных матчей, что нужно? нужно около 300000 матчей со следующими статистическими данными, 1. названия матча год месяц день, владение обеих команд, колличество ударов за матч обеих команд, колличество ударов в ...

    Базы данных4 заявки
    Закрыт
    6 месяцев назад
  • Есть файл HTML, в нем уже созданы элементы. Нужно создать базу MySQL и файлы которые обеспечат корректное взаимодействие структуры HTML с базой данных. Создать условия авторизации и доступа к базе.  ТЗ в закрепе, фаил HTML отправлю ...

    Базы данных7 заявок
    Закрыт
    6 месяцев назад
  • $150

    здравствуйте ищу исполнителя для реализации проекта есть 2 бота с товарами создаными на платформе bot-t.ru . здесь их документация по апи https://docs.google.com/document/d/13-LF7VIycK4MqA... . необходимо их связать с crm системой sendpulse для того что б она ...

    Базы данных3 заявки
    Закрыт
    6 месяцев назад
  • Генерировать B2B лиды для крупных компаний, связанных с сахаром icumsa 45 в указанных отраслях и регионах. Целевые отрасли: 1. Пищевая промышленность 2. Производство напитков 3. Логистические компании Специфика сахара icumsa 45: высокорафинированный сахар, получаемый из ...

    Базы данных1 заявка
    Закрыт
    6 месяцев назад
  • $200

    Необходимо решить вопрос с базой данных. Наблюдается ситуация, когда процессы, которые сами по себе не представляют большого веса или сложности, блокируют исполнение всего остального, в следствии чего перестает работать весь сайт. Проверка процессов ...

    Базы данных6 заявок
    Закрыт
    6 месяцев назад
  • Есть файл эксель, в нём подробное техническое расписание движения транспорта. Требуется из этого файла эксель, в котором забито техническое расписание, выбирать ряд строк и столбцов, и делать красивое расписание для людей. Пропуская ...

    Базы данных1 исполнитель
    Закрыт
    6 месяцев назад
  • Ищу опытного ИНДИВИДУАЛЬНОГО разработчика для создания полноценной CRM-системы, специально адаптированной для транспортного бизнеса. Цель - разработать CRM-платформу, которая упростит и оптимизирует управление потенциальными клиентами и операциями. ТРЕБУЕТСЯ ИНДИВИДУАЛЬНЫЙ РАЗРАБОТЧИК. ПРИ ОТКЛИКЕ УКАЖИТЕ ССЫЛКУ НА ...

    Базы данных7 заявок
    Закрыт
    6 месяцев назад
  • $300

    Необходимо получить базу участников ивента, которое состоится 13-16 ноября 2023 года. На выходе получаем иксель файл с полями - имя, должность, компания, локация, соц.сети, о компании,+ если есть дополнительные данные. Интересуют: участники, спикеры, организаторы, ...

    Базы данных1 исполнитель
    Завершен
    6 месяцев назад