
Проект аналитика данных
Тема проекта : " Ключевые факторы для победы в гонке Формулы-1"
Проект заключается не в том, чтобы просто проанализировать данные Формулы-1, а сделать логическое умозаключение: что влияет на победу, а что - нет.
Как должен выглядеть проект:
1. В описании будут приложены данные( если их будет недостаточно, собрать ещё из других источников). Также, можно использовать библиотеку fastf1(https://theoehrly.github.io/Fast-F1/fastf1.html)
https://www.kaggle.com/datasets/rohanrao/formula-1-world-championship-1950-2020?resource=download
2. Поднять простую базу данных, хотя бы SQLite, туда их загрузить.
3. Можно что-то питоном собрать (по апи или соскрапить)
4. Потом запросом вытянуть данные в код к примеру, проанализировать зависимости в коде (посчитать корреляцию, создать графики, определить, может, степени и коэффициенты зависимости)
5. Потом написать то, что называется адхок-отчёт, где по сути будет список проанализированных факторов, разбитый на две группы - что влияет на победу (и почему так решили, с графиками и цифрами из предыдущего шага) и что не влияет и тоже почему. Это может быть вордовский документ или гугл док.
6. Круто, если будет что-то типа Power BI , подключить к базе данных и визуализировать параметры.
Итого без пунктов 3 и 6 будет в итоге:
Текстовый файл SQL запроса.
Файл с кодом, где будет анализ факторов.
Файл гугл док, где будет итог анализа.
Пункт 3 это ещё один файл с кодом, пункт 6 может быть как скрин так и файл POWER BI.
Заявки фрилансеров
