Задание в R-studio
Необходимо выполнить несложное задание в R-studio.
1) Откройте Codebook. Выпишите все переменные, которые использованы в датасете, и их возможные значения (шкалы)
2) Постройте тепловую карту данных. Сделайте вывод о том, какие перeменные и насколько коррелируют между собой, можно ли заметить очевидные паттерны связи.
3) 1) Постройте множественную регрессию, в которой зависимой переменной будет переменная свободы прессы, а независимыми - уровень безработитцы, была ли страна ранее колонией, уровень выбросов С02, ВВП на душу населения, индекс демократизации Ванханена.
2) Выпишите уравнение регрессии.
3) Проинтерпретируйте каждый предиктор (и константу) при условии, если они значимы. Опишите значение r^2.
4) Сформулируйте гипотезу, которую можно проверить этой моделью. Что здесь выступает контрольной переменной (переменными)?
4)Теперь переоцените модель со следующими независимыми переменными: свобода религии, ВВП на душу населения, свобода выражения мнений, уровень свободы государства (freedom house). Зависимая переменная - та же.
1) Постройте модель с вышеописанной спецификацией.
2) Выпишите уравнение регрессии.
3) Проинтерпретируйте каждый предиктор (и константу) при условии, если они значимы. Опишите значение r^2.
5) 1) Какая модель лучше может подходить под задумку исследования, если мы изучаем свободу прессы? Включение каких предикторов и контрольных переменных кажется более разумным - в первой или второй модели?
2) Приведите пример, какие еще предикторы и контрольные переменные могут быть в модели.
3) Приведите пример мешающей переменной (необязательно из используемых).
4) Проверьте обе модели на гетероскедастичность и сделайте содержательные выводы.