Лабы по индексам, базы данных
1. Индексы. Найти dataset (csv file) , содержащий более 1 000 000 записей. Нормализовать dataset и создать на основе него схему реляционную БД. Придумать задачу для
данных, описать функциональность системы. Загрузить в БД 80% dataset. Например dataset, содержащий статистику вызова службы 101 за определенный период. Для этого dataset может быть задача
регистрации вызова службы 101, фиксации результата, поиска ближайшей бригады
скорой помощи и т.д. Реализовать основную функциональность системы (запросы к реляционной БД). Предусмотреть необходимые индексы. Сравнить время
выполнения и статистику запросов без и с индексами. Вывести информацию о фрагментации индексов, загрузить оставшиеся 20% dataset, посмотреть как изменить фрагментация индексов. Для сдачи необходимо предоставить следующее:
- Описание dataset (название столбцов и описание того, что они хранят)
- Схему реляционной БД
- Описание задачи и функциональности
- Реализация функциональности (запросы к реляционной БД)
- Описание созданных индексов
- Для каждого запроса вывести статистику выполнения запроса с и без индексов. Показать,
что индекс используется в запросе (вывести план выполнения запроса)
- Информацию о фрагментации индексов до и после загрузить оставшихся 20% dataset. Сделать
выводы.
Пример оформления 1 лабы прикрепляю
2. NoSQL. MongoDB Расширить основную функциональность системы дополнительной (Предварительно согласовать). Данные для доп. функциональности сохранить в
MongoDB. Например, для каждой бригады скорой помощи сохранять бланк вызова. *Реализовать интерфейс к первому заданию на любом языке (для оценки 4 и 5 +20 баллов). Для оценки 3 достаточно показать навыки работы с MongoDB через консольный интерфейс. Для
более высокого бала через драйвер и интерфейс приложения (сохранение, поиск,
изменение).
3. OLAP Разработать структуру OLAP хранилища для статистики из dataset. Привести запрос на агрегацию данных
таблицы фактов. Привести пример 3-х возможных запросов (текст запроса и его
реализация) к OLAP хранилищу.