안녕하세요,
패널자료를 다루는 방법에 대해서 살펴보겠습니다. 단순하게 패널자료를 묘사하면 동일한 대상(ID)을 여러 차례 측정(TIME)한 자료라고 생각하시면 됩니다. 예를 들어 전자공시시스템 재무제표 자료를 활용하여 국내 주요 기업의 재무를 분석한다고 생각해 보겠습니다. 특정 연도의 자료만 활용하여 분석할 수 있으나 여러 연도 자료를 통합하여 활용한다면 더욱 많은 시사점을 도출할 수 있을 것입니다. 그렇기 때문에 다수의 연구자들은 단년도 자료보다는 패널자료 분석을 선호합니다.
패널자료를 처음 만드시는 분들은 아래와 같이 엑셀에 데이터를 입력하시는데 이렇게 하시면 제대로 분석을 할 수 없습니다.
아래와 같이 수집해야 합니다. 연도(year)와 기업(name)의 위치에 주의하셔야 합니다. 이렇게 수집된 자료를 활용해서 다양한 분석이 가능합니다.
SAS에서는 패널회귀분석을 위한 프로시저로 PROC PANEL을 지원하고 있고 PROC PANEL 프로시저를 이용하여 고정효과나 확률효과 모형 분석을 수행합니다. 최근에는 위와 같은 불균형 패널자료의 경우 PROC PANEL을 이용하여 분석할 수 있지만 몇 년 전에는 불가능했던 것으로 기억합니다. 그래서 균형패널자료로 만들어서 분석해야만 했습니다. 아래의 코드는 위의 엑셀 자료를 SAS데이터셋으로 만드는 코드입니다. 간단한 예제 데이터를 살펴보면 A, B 기업의 자료는 2019년부터 2022년까지 자료가 있으나 C 기업의 자료는 2019년은 없고 2020년부터 2022년까지의 자료만 있는데 이를 불균형패널자료라고 보시면 됩니다.
DATA UNBALANCE;
INPUT name $3. year stock asset;
DATALINES;
A 2019 43 123
B 2019 67 45
A 2020 45 12
B 2020 18 43
C 2020 181 654
A 2021 123 456
B 2021 238 23
C 2021 276 324
A 2022 43 5
B 2022 123 23
C 2022 356 31
;
RUN;
불균형패널자료를 균형패널자료로 만드는 방법 중 하나는 직접 눈으로 확인하며 삭제하는 방법입니다. 2019년 자료나 C기업의 자료를 삭제하면 되겠지요. 그러나 대한민국 전체 기업의 재무자료를 분석하신다면 직접 눈으로 확인하여 삭제하는 것은 현실적으로 불가능합니다. 저 역시 관측치가 10만 개에 달하는 불균형패널자료를 균형패널자료로 변환해야 되는 문제에 직면하게 되었고 아래와 같은 코드를 찾아서 활용하였습니다. 아래의 코드는 2019년부터 2022년까지의 자료가 하나라도 없는 기업, 즉 C기업의 자료를 삭제하는 코드입니다.
PROC FREQ DATA=UNBALANCE NOPRINT;
TABLE NAME / OUT=FREQ(WHERE=(COUNT=4));
RUN;
PROC SQL;
CREATE TABLE WANT AS
SELECT UNBALANCE.* FROM UNBALANCE, FREQ
WHERE UNBALANCE.NAME=FREQ.NAME
;
RUN;
PROC PRINT DATA=WANT;
RUN;
위의 코드 논리는 아주 간단합니다.
이러한 논리로 만들어진 코드를 실행시키면 아래와 같은 결과물을 얻을 수 있습니다. 2019년 자료가 없었던 C기업은 NAME의 빈도가 3이었기 때문에 최종 데이터셋인 WANT에서는 삭제되었습니다.
최대한 자세하게 설명한다고 하였으나 여전히 어려움이 있으신 분들을 위해서 활용법을 알려드리면
제가 가장 애정하는 코드를 공개한 만큼 유용하게 활용하시길 바랍니다.
궁금하신 점은 댓글로 남겨주세요:)
감사합니다!
☆ 제 코드는 정답이 아니며 틀린 부분이 있을 수 있으니 주의하여 활용하시기 바랍니다.
[SAS ODA]논문 필수 패널회귀분석, 클릭으로 끝내기 (2) | 2023.03.09 |
---|---|
[SAS ODA]기술통계분석 클릭으로 끝내기(히스토그램, 박스플롯) (3) | 2023.03.06 |
[SAS]PROC MEANS로 기술통계분석 끝내기(feat. 집단별 분석) (2) | 2023.03.05 |
[SAS]기술통계분석부터 회귀분석까지 한방에 끝내는 매크로 (7) | 2023.02.27 |
SAS ODA 주요 기능 살펴보기 (4) | 2023.02.26 |
댓글 영역