[수학]/R로 배우는 통계학
[통계학/R] 인과관계, 상호작용 : 인과관계 예시, 상호작용이 있는 회귀식의 예시, 상호작용항 실습 코드
seom-j
2023. 7. 18. 11:50
📌 인과관계
A → B에서, 영향을 주는 관계 혹은 영향을 받는 관계 파악
관계에 방향성이 확실히 존재함에 유의
A : 원인, 독립변수 (Antecedent Variable)
B : 결과, 종속변수 (Consequent variable)
이때, 다양한 척도로 파악 가능
ex)
흡연여부 → 폐암여부 (범주 - 범주 : 카이제곱분석)
음주량 → 간암여부 (수치 - 범주 : 로지스틱회귀분석)
성별 → 음주량 (범주 - 수치 : ANOVA, 분산분석)
대부분의 통계 분석은 인과관계에 관심 있음
실제로 분석의 7~80%가 인과관계를 파악함
📌 상호작용
독립변수들 간의 영향을 주고 받아 종속변수에 미치는 영향력이 서로 달라지는 경우,
상호작용 항을 추가 (대부분 상호작용을 하는 독립변수의 곱으로 이루어진 항)
ex)
교육연수가 더 많은 사람이 근무연수에 따른 임금이 더 많은 경우
임금 = a + b1교육연수 + b2근무연수 + b3교육연수근무연수
상호작용이 있는 경우 회귀식의 해석
- 상호작용항이 통계적으로 의미가 있는지 확인
- 유의미할 경우 개별 독립변수들의 유의도 무시
- 무의미할 경우 상호작용항을 제거하고 개별 독립변수 사용
📌 상호작용항 실습 코드
⬇️ 과거 게시글, 선형회귀분석 中 코드 일부
lm_fit3 <- lm(Ozone ~ Solar.R + Wind + Temp + Solar.R*Wind, data = na.omit(airquality))
summary(lm_fit3)
➡️ Solar.R과 Wind의 상호작용항이 0.001238로 0.05보다 작아 유의미함
➡️ Solar.R과 Wind의 상호작용항이 유의미하므로 Solar.R과 Wind의 p-value가 중요하지 않아짐