상세 컨텐츠

본문 제목

[DISSERTATION]조절효과 분석으로 학위논문 마무리

DISSERTATION

by 대학원생D군 2023. 3. 16. 18:50

본문

반응형

안녕하세요,

지난 포스팅에서 이중차분법(DID)에서 한 단계 나아간 삼중차분법(DDD)에 대하여 살펴보았습니다. 결국 삼중차분법에도 조절효과 분석의 원리가 포함되어 있기 때문에 조절효과 개념을 한번 살펴본 후 삼중차분법 포스팅을 보면 조금 더 이해가 편할 것 같습니다.

 

[DISSERTATION]삼중차분법(DDD)으로 집단 간 정책효과 차이 분석

안녕하세요, 지난 포스팅에서 정책효과를 추정하는 방법 중 하나인 이중차분법(DID)의 개념을 살펴보았습니다. 이중차분법의 수식은 아래와 같았습니다. 이중차분법의 경우 처치/통제 변수와 개

paratussemper.tistory.com

조절효과는 사회과학 연구에서 굉장히 많이 활용되고 있습니다. 구글 스칼라에 '조절효과' 키워드를 넣어서 2022년부터 출판된 연구를 검색해 본 결과 11,900개의 검색결과가 확인되었습니다. 그만큼 많이 활용되는 개념이며 이후 매개효과와 함께 조절효과 분석이 활용되기 때문에 유용성이 높습니다.

따라서 이번 포스팅에서는 조절효과의 개념을 간략하게 살펴보고 다음 포스팅에서 실제 분석하는 방법을 살펴보겠습니다.

 

조절효과의 기본개념

우선 조절효과가 등장하게 된 배경, 조절효과가 필요한 이유는 독립변수와 종속변수 간의 관계(영향)가 특정변수(조절변수)에 따라서 달라질 수 있기 때문입니다. 구글 스칼라에서 검색된 연구들 중 "장애인 차별 경험과 우울감의 관계 연구:종교활동의 조절효과를 중심으로"라는 연구는 "제목만 보았을 때" 장애인 차별 경험이 우울감에 미치는 영향이 종교활동 여부 또는 수준에 따라서 달라질 수 있다는 문제인식에서 출발한 연구일 것으로 보입니다. 그렇기 때문에 조절효과의 관심은 조절변수가 변할 때 독립변수가 종속변수에 미치는 영향이 어떻게 달라지는지입니다. 

 

간단한 수식을 통한 이해

간단한 수식(X=독립변수; Y=종속변수; Z=조절변수)으로 살펴보겠습니다.

  • Y = b0+b1 X + b2 Z + b3 X Z

위의 수식을 아래와 같이 바꾸면 직관적으로 이해할 수 있습니다. 

  • Y = b0+(b1 + b3 Z) X+ b2 Z 

위의 수식을 보면 X가 Y에 미치는 영향, 즉 X의 회귀계수는 (b1+b3 Z)입니다. 즉, X의 회귀계수는 Z의 값에 따라 달라지게 됩니다.

 

조금 더 구체적인 예시로 살펴보겠습니다. 상호작용항을 포함한 회귀분석을 수행한 결과가 다음과 같다고 합시다.

  • Y = 3+2 X + 3 Z + 3 X Z

앞서 설명드린 방법으로 수식을 수정하면 아래와 같이 다시 쓸 수 있습니다. 

  • Y = 3+(2 + 3 Z) X+ 3 Z 

조절효과 개념 자체가 조절변수가 변할 때 X가 Y에 미치는 영향이 어떻게 변하는지(2 + 3 Z)를 살펴보는 것이므로 Z에 여러 값을 대입시켜 보겠습니다. Z는 1, 2, 3만을 갖는다고 가정하겠습니다.

  • Z=1 then X의 회귀계수 = (2+3 * 1) = 5 
  • Z=2 then X의 회귀계수 = (2+3 * 2) = 8
  • Z=3 then X의 회귀계수 = (2+3 * 3) = 11

위의 결과를 토대로 해석하면 Z값이 커질수록 X가 Y에 미치는 영향이 커진다고 이해할 수 있습니다. 그러나 회귀계수의 유의미성은 Z의 값에 따라서 달라질 수 있다는 점에 유의해야 합니다.

 

조절효과 유무 

우선 상호작용항의 회귀계수인 b3가 통계적으로 유의미한지 살펴봅니다. 만일 통계적으로 유의미하지 않다는 것은 귀무가설인 b3=0을 의미하는 것이므로 Z의 값이 아무리 커져도 또는 작아져도 X가 Y에 미치는 영향은 b1입니다. 즉 조절효과가 없음을 의미합니다.

  • Y = b0+b1 X + b2 Z + b3 X Z
  • Y = b0+(b1 + 0 Z) X+ b2 Z

그러나 앞서 언급한 것처럼 Z의 값에 따라 회귀계수의 유의미성이 달라질 수 있기 때문에 추가적인 분석을 수행하는 경우도 있습니다.

 

조절효과와 평균중심화

이전 포스팅에서 조절효과 분석을 위한 평균중심화 코드를 살펴보았습니다. 해당 포스팅에서도 언급한 것처럼 평균중심화를 한다고 해서 다중공선성이 해결될 것인지는 의문입니다. 다만 평균중심화를 하면 회귀계수 해석이 용이해진다는 장점이 있습니다. 평균중심화를 하는 경우 회귀계수의 의미는 조절변수가 평균값을 가질 때 독립변수가 종속변수에 미치는 영향을 의미합니다.

 

[SAS]조절효과 분석을 위한 평균중심화 with PROC MEANS, SQL

안녕하세요, 논문을 검색하다 보면 조절효과를 분석하는 논문을 어렵지 않게 찾아볼 수 있습니다. 여기서 말하는 조절효과란 독립변수와 종속변수 간의 관계가 조절변수에 따라서 달라지는 것

paratussemper.tistory.com

이러한 개념은 다른 형태로 활용될 수 있습니다. 우리의 관심은 항상 평균이 아닐 수도 있습니다. 즉, 조절변수가 특정값을 가질 때의 회귀계수와 그 유의미성을 살펴보는데 활용할 수 있습니다. 다음 포스팅에서 코드를 이용해서 조금 더 자세히 살펴보겠습니다. 

 

감사합니다!

☆ 저의 설명이 정답이 아니며 틀린 부분이 있을 수 있으니 주의하여 활용하시기 바랍니다.

반응형

관련글 더보기

댓글 영역