[수학]/R로 배우는 통계학

[통계학/R] 인과관계, 상호작용 : 인과관계 예시, 상호작용이 있는 회귀식의 예시, 상호작용항 실습 코드

seom-j 2023. 7. 18. 11:50

 

📌 인과관계

A → B에서, 영향을 주는 관계 혹은 영향을 받는 관계 파악

관계에 방향성이 확실히 존재함에 유의

 

A : 원인, 독립변수 (Antecedent Variable)

B : 결과, 종속변수 (Consequent variable)

 

이때, 다양한 척도로 파악 가능

 

ex)

흡연여부 → 폐암여부 (범주 - 범주 : 카이제곱분석)

음주량 → 간암여부 (수치 - 범주 : 로지스틱회귀분석)

성별 → 음주량 (범주 - 수치 : ANOVA, 분산분석)

 

대부분의 통계 분석은 인과관계에 관심 있음

실제로 분석의 7~80%가 인과관계를 파악함

 

 

📌 상호작용

독립변수들 간의 영향을 주고 받아 종속변수에 미치는 영향력이 서로 달라지는 경우,

상호작용 항을 추가 (대부분 상호작용을 하는 독립변수의 곱으로 이루어진 항)

 

ex)

교육연수가 더 많은 사람이 근무연수에 따른 임금이 더 많은 경우

임금 = a + b1교육연수 + b2근무연수 + b3교육연수근무연수

 

상호작용이 있는 경우 회귀식의 해석

  • 상호작용항이 통계적으로 의미가 있는지 확인
  • 유의미할 경우 개별 독립변수들의 유의도 무시
  • 무의미할 경우 상호작용항을 제거하고 개별 독립변수 사용

 

 

📌 상호작용항 실습 코드

⬇️ 과거 게시글, 선형회귀분석 中 코드 일부

lm_fit3 <- lm(Ozone ~ Solar.R + Wind + Temp + Solar.R*Wind, data = na.omit(airquality))
summary(lm_fit3)

➡️ Solar.R과 Wind의 상호작용항이 0.001238로 0.05보다 작아 유의미함

➡️ Solar.R과 Wind의 상호작용항이 유의미하므로 Solar.R과 Wind의 p-value가 중요하지 않아짐