Найдите исполнителя для вашего проекта прямо сейчас!
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.

Question 1A (10 points) - there are 4 "business related" questions.Considering the IBM_HR_Attrition business case and data (do not open Excel when answering the question - you may use MongoDB and Dataiku only) 1. (2.5 points) What did you choose to be your "business success" variable (choose something different than Attrition)? Can you please define it? Why did you choose that variable? 2. (2.5 points) Provide a count of possible unique business outcomes? How many business successesdoes your data have? 3. (2.5 points) Is there any interesting business insight when you calculate the average commute per your "business success" buckets? (In other words ... what is the average commute for your business success and business failure and what is the insight? )4. (2.5 points) This question will depend on the environment you chose:-If you chose Dataiku answer this question only: Why did you NOT choose MongoDB to find answers to these questions?-If you chose MongoDB answer this question only: Why did you NOT choose Dataiku to find answers to these questions?(Word count: 50-75 for each question) Question 1B (10 points)Please provide any code you have designed for Question 1A.  Explain your code.  Question 2A (10 points)Using MongoDB Compass (or alternatively the online Mongo Atlas):1. How many Pokemon (how many documents) are Flying or Grass (in Type_1) and have Attack greater than 65?  What insight does it bring? 2. What is the average Speed of all the Pokemon that have Attack greater than 75 and are not Legendary? Explain how you can interpret the results.   You will need to provide the MongoQL syntax in the next question. PLEASE SAVE YOUR CODE!(Word count: 75-150 for each question) Question 2B (10 points)Please paste any code that you have designed for Question 2A and explain which sub-question does it belong to.  You will receive 5 points for correct code for Question 2A.1 and another 5 points for correct code for Question 2A.2  Question 3A (10 points)Consider your Pokemon data in Hadoop (in Dataiku). Answer the following questions using your PySpark templates! Alternatively, you can build your model in the Dataiku LAB. You should build a logistic regression model to predict the value of Legendary = 1, by using Sp_Attack. Do NOT split your data into training and testing!! Use all the data to train your model! Dependent variable (Y) : "legendary"Independent variable / feature (X1): "sp_attack"  In you answer, please provide the model output, including all the coefficients and AUC ROC for this model. (You will receive max points for accurate results.)   Question 3B (10 points)1.(5 points) Can you explain any business insight from the model? what is the interpretation of the coefficient of sp_attack? 2. (5 points) Provide the code that you've used to build your regression in Question 3A. (copy and paste the code below your business insight).

вот так выглядят вопросы на которые мне нужна помощь с ответамитак же есть файлы которые я так понимаю и есть база данных которую нужно анализировать через Dataiku или MongoDB

4 года назад
guest_15911240199462
4 года в сервисе
Был
4 года назад
  • Похожие заказы
  • Здравствуйте Необходимо однократно спарсить данные с разных 20-ти сайтов. Мы предоставляем ссылки на разделы в рамках сайта (пример 1 : https://sunlight.net/catalog/chasy-sokolov.html пример 2: https://www.bestwatch.ru/watch/filter/region:vip/) данные из которых надо выгрузить и унифицировать для дальнейшей загрузки в БД

    Базы данных9 заявок
    Закрыт
    4 года назад
  • Написать антиплагиат систему. (веб-приложение)  Система должна определить процент заимствования взагружаемом документе и отобразить этот процент пользователю. (Один документ приблизительно 90 листов.)  Системадолжна обеспечить проверку загружаемых пользователям документов в формате doc, docx, rtf. Каждый загруженный документ должен загружаться ...

    Базы данных2 заявки
    Закрыт
    4 года назад
  • Необходимо собрать базу [b]частных белорусских[/b] компаний численностью сотрудников от 20 человек. Территориально расположенных в Беларуси. Необходимые поля: номер, наименование, численность сотрудников, веб-сайт, контакты.

    Базы данных3 заявки
    Закрыт
    4 года назад
  • Спроектировать в ms sql базу данных (8 и больше сущностей, не обязательно подробную) для интернет магазина по продаже компьютерных комплектующих. Произвести инфологическое моделирование: создание даталогической и физической модели в ERWin (желательно). Описать связи и атрибуты. Дополнительно: ...

    Базы данных6 заявок
    Закрыт
    4 года назад
  • Лет 6 тому назад была создана внутренаая система для учета туристов в туристической фирме а также автоматическое создание договоров. Сейчас надо доработать или видоизменить систему:  [list=1][*]Система фиксации внесенных данных. Кто и когда внес данные по оплатам [*]Изменение ...

    Базы данных2 заявки
    Закрыт
    4 года назад
  • $25

    Имеется таблица эксель, нужно брать данные из таблички и генерировать из исходного файла [url=https://vk.com/doc42765238_552358301?hash=124e694a8c158fde33&dl=e91b28fa4f68df8330]https://vk.com/doc42765238_552358301?hash=124e694a8c158fde33&dl=e91b28fa4f68df8330[/url] картинку в формате PDF(jpeg) с надписями. [url=https://vk.com/doc29113437_553067437?hash=27ff7b59b0fe559c3c&dl=945b40a830a8bb039e]https://vk.com/doc29113437_553067437?hash=27ff7b59b0fe559c3c&dl=945b40a830a8bb039e[/url] Это конечный вариант. Таблица с данными будет выдана исполнителю.

    Базы данныхнет заявок
    Закрыт
    4 года назад