Фриланс: решение лабораторных работ
Разместите заказ на фриланс-бирже и предложения поступят уже через несколько минут.
Необходимо сделать 8 практических работ, задания по типу: копировать и вставлять, заполнять таблицы по анализу, составлять тз, диаграммы в visio, sql запросы и так далее, задания несложные и с подробными объяснениями, примеры и требования прикладываю. От вас умение работать с офисным пакетом и грамотно оформлять отчеты (по требованиям).
СРОЧНО!! ДЕДЛАЙН 22 СЕНТЯБРЯ
Выполнить ЛР на jupyter
Вариант 24
MAGIC Gamma Telescope Data Set
Название файла: magic04.data
Ссылка: http://archive.ics.uci.edu/ml/datasets/MAGIC+Gamma+Telescope
Первый признак: fLength (столбец No 1)
Второй признак: fWidth (столбец No 2)
Класс: class (столбец No 11)
Алгоритмы: K-means, Affinity Propagation, Mean Shift, mini-batch K-Means
Меры качества: условная энтропия, парные меры TP, FN, FP, TN, индекс Rand
Найти лучший алгоритм кластеризации относительно меры качества: индекс Rand
необходимо написать 13 лабораторных работ, код должен быть написан как будто за 1 курс, необходимы к каждому коду блок-схемы.
Задания брать отсюда https://studfile.net/preview/7069727/
в каждом задании выбирать 11 вариант
Выполнить на Jupyter. Вариант 22.
Индивидуальные условия для заданий:
Алгоритм: FPGrowth
День недели (поле order_dow таблицы orders): “0”
Код департамента (поле department_id таблицы products): “8”
Запрос: Определить список товаров, которые были приобретены ровно два раза
Показатель оценки ассоциативных правил: лифт (lift) \
В соответствии с индивидуальным заданием (вариантом), выполнить следующие работы:
1.????При помощи модуля sqlite3 откройте базу данных Instacart в файле instacart.db.
2.????Загрузите таблицы departments и products в датафреймы Pandas. При помощи запроса SELECT извлеките из таблицы order_products__train записи, соответствующие указанным в индивидуальном задании дню недели (поле order_dow таблицы orders) и коду департамента (поле department_id таблицы products) и загрузите в датафрейм Pandas. Определите количество строк в полученном датафрейме, количество транзакций (покупок) и определите количество товаров (столбец product_id) в транзакциях датафрейма.
3.????Выполните к датафрейму запрос, указанный в индивидуальном задании.
4.????Постройте транзакционную базу данных из полученного датафрейма, используя в качестве идентификатора транзакции столбец order_id, а в качестве названий товаров - поле product_name из датафрейма для таблицы products, соответствующее столбцу product_id. Найдите в транзакционной базе данных транзакцию с наибольшим количеством товаров и выведите ее на экран.
5.????Постройте по транзакционной базе данных бинарную базу данных в формате датафрейма пакета mlxtend. По бинарной базе данных определите три наиболее популярных товара и определите количество покупок (транзакций) этих товаров.
6.????При помощи указанного в индивидуальном задании метода построения популярных наборов предметов постройте популярный набор предметов с минимальной поддержкой не менее 3, имеющий максимальную длину. При отсутствии таких наборов уменьшите поддержку до 2. В случае нехватки вычислительных ресурсов (слишком долгой работы программы) при построении популярных наборов предметов сокращайте число записей в наборе данных (например, делая выборку половины записей набора).
7.????Используя пакет mlxtend или реализацию на Python, постройте набор ассоциативных правил для полученного популярного наборов предметов. Используйте уровень достоверности (confidence), равный 0.65.
8.????Для построенного набора ассоциативных правил вычислите показатель (меру) оценки ассоциативных правил, указанную в индивидуальном задании, и определите ассоциативные правила с наилучшим значением показателя оценки.
Результат лабораторной работы оформить в виде .ipynb. Обязательно сопровождать представленный программный код комментариями и ссылками на выполненные пункты задания.