상세 컨텐츠

본문 제목

[SAS ODA]논문 필수 패널회귀분석, 클릭으로 끝내기

SAS

by 대학원생D군 2023. 3. 9. 05:43

본문

반응형

안녕하세요,

요즘 사회과학 계열의 학위논문을 살펴보면 많은 분들이 패널회귀분석을 사용한 논문을 쉽지 않게 확인할 수 있습니다. 그러나 패널회귀분석의 개념을 완전하게 이해하고 활용하는 것은 결코 쉽지 않습니다. 울드리지(Wooldridge)의 계량경제학을 번역한 계량경제학1 책의 목차를 살펴보더라도 패널데이터 분석에 대한 내용이 없음은 패널회귀분석의 이론 자체가 정말 단순하지 않음을 보여줍니다.

 

계량경제학 1 | Jeffrey M. Wooldridge - 교보문고

계량경제학 1 | ▶ 이 책은 계량경제학을 다룬 이론서입니다. 계량경제학의 기초적이고 전반적인 내용을 학습할 수 있습니다.

product.kyobobook.co.kr

패널데이터분석 이론을 공부해보고 싶은 분들께서는 한치록 교수님의 저서인 패널데이터분석과 민인식 교수님과 최필선 교수님의 저서인 STATA 패널데이터분석 16-17버전을 추천드립니다.

 

패널데이터강의 | 한치록 - 교보문고

패널데이터강의 | 『패널데이터강의』는 〈임의효과 모형〉, 〈고정효과 모형〉, 〈정태적 모형의 심화 주제들〉, 〈도구변수 추정〉, 〈선형 동태적 패널모형과 추정〉, 〈동태적 패널모형의

product.kyobobook.co.kr

 

STATA 패널데이터분석 16-17버전 | 민인식 - 교보문고

STATA 패널데이터분석 16-17버전 | 시계열과 횡단면의 특성을 동시에 갖고 있는 패널데이터를 이용한 분석이 최근 다양한 분야에서 활발하게 이루어지고 있다. 기존의 통계프로그램이 횡단면 또는

product.kyobobook.co.kr

이번 포스팅에서는 SAS ODA를 사용하여 클릭 몇번으로 패널회귀분석을 하는 방법을 알아보겠습니다. 패널자료를 만드는 방법은 아래의 포스팅을 참고하시면 됩니다.

 

[SAS]패널자료 수집, 불균형패널자료를 균형패널자료로 만들기

안녕하세요, 패널자료를 다루는 방법에 대해서 살펴보겠습니다. 단순하게 패널자료를 묘사하면 동일한 대상(ID)을 여러 차례 측정(TIME)한 자료라고 생각하시면 됩니다. 예를 들어 전자공시시스

paratussemper.tistory.com

 

이번에는 SASHELP.CLASS가 아닌 SAS Help의 PROC PANEL 프로시저 예제 데이터셋을 활용해 보겠습니다. 아래의 링크를 통하여 데이터를 생성하는 코드를 복사한 후.

 

SAS Help Center

 

documentation.sas.com

아래의 프로그램 창에 붙여넣기 하여 실행시키서 Airline이라는 데이터셋을 생성합니다.

AirlineID라는 개체와 Year라는 시간이 결합된 패널데이터셋임을 확인할 수 있으며 6개 Airline의 1970년부터 1984년까지의 자료입니다. 

 

패널데이터분석은 작업 및 유틸리티 > 계량경제 > 패널데이터 모델을 통해서 분석할 수 있습니다. 패널 데이터 모델을 클릭하면 아래와 같은 화면을 확인할 수 있습니다. 우선 WORK.AIRLINE 데이터셋을 지정한 후 횡단면 ID에는 AirlineID, 시간 ID에는 Year를 입력합니다. 다음으로 종속변수와 연속변수 등(독립변수)에는 분석 모델에 맞춰서 넣으시면 되는데 저는 종속변수를 IC, 연속변수에는 IQ와 IFF를 투입해 보았습니다. 연속변수에 독립변수와 통제변수를 넣으시면 됩니다.

다음으로 모델 단계에서 모델 유형은 선형, 모델효과는 주 효과 모델, 모형설정은 우선 임의효과를 선택합니다. 이는 하우즈만 검정(Hausman test)을 통하여 고정효과모형과 확률효과모형(임의효과모형) 중 적합한 모형을 선택하기 위함입니다. 

다음으로 옵션을 살펴보면 공분산 행렬 추정값이 있습니다. Newey & West, OLS, HCCME 등 다양한 추정방식을 선택할 수 있는데 이분산성이나 자기상관성 여부 등에 따라서 적절한 공분산 행렬을 선택하면 됩니다. 선택에 따라 표준오차가 달라지고 p-value, 즉 관심변수의 통계적 유의미성이 달라지게 되기 때문에 보다 신중하게 고려해야 합니다.

이후 분석을 실행해보면 아래와 같은 결과를 확인할 수 있습니다. 가장 먼저 하우스만 검정 결과를 살펴보면 귀무가설을 기각하지 못하는 것으로 나타났습니다. 이러한 경우 임의효과모형의 회귀계수 추정 결과를 논문에 반영하시면 됩니다. 만일 하우스만 검정 결과 귀무가설을 기각한다면 고정효과모형 분석을 진행하면 됩니다.

고정효과모형 분석의 경우 모델 탭 > 모델 설정 > 선형모델: 고정 효과로 설정하면 됩니다. 개체에 고정효과를 설정하고 싶으면 일원, 시간에 고정효과를 설정하고 싶으면 일원, 시간, 개체와 시간 모두에 고정효과를 설정하고 싶으면 이원을 선택하면 됩니다. 그리고 고정 효과 표시를 클릭하면 고정효과 회귀계수 추정치를 확인할 수 있는데 만일 추정해야 되는 더미가 많다면 클릭하지 않으시는 것을 추천합니다. 

아래의 그림은 개체에 대한 고정효과를 설정하여 분석한 결과입니다. 개체가 6개 밖에 되지 않아 개체의 고정 효과를 추정한 결과(Cross Sectional Effect)를 출력하였습니다. 여러 표 중 F검정 결과를 살펴보면 귀무가설을 기각할 수 있는 것으로 나타나 고정효과모형을 사용할 수 있음을 확인하였습니다.

고정효과모형 분석을 위하여 SAS ODA가 활용한 코드는 아래와 같습니다.

ods noproctitle;
ods graphics / imagemap=on;

proc sort data=WORK.AIRLINE out=Work.preProcessedData;
	by AirlineID Year;
run;

proc panel data=Work.preProcessedData;
	id AirlineID Year;
	model lC=lQ lPF / fixone printfixed;
run;

proc delete data=Work.preProcessedData;
run;

이상으로 SAS ODA를 활용하여 패널데이터분석을 하는 방법을 알아보았습니다.

궁금하신 점은 댓글로 남겨주세요:)

감사합니다!

☆ 제 코드는 정답이 아니며 틀린 부분이 있을 수 있으니 주의하여 활용하시기 바랍니다.

반응형

관련글 더보기

댓글 영역