안녕하세요,
이전 포스팅에서 패널자료 형태, 불균형패널자료를 균형패널자료로 만드는 방법, SAS ODA를 활용하여 클릭으로 패널회귀분석을 하는 방법을 살펴보았습니다. 그러나 여러 패널 데이터셋을 결합하는 방법을 모른다면 제가 앞서 설명한 것을 해보기도 전에 좌절을 경험하게 됩니다. 물론 용량이 크지 않다면 엑셀 VLOOKUP을 이용해서 데이터셋을 결합할 수 있지만 대용량 자료라면 엑셀로 하는 것에 한계가 있습니다. 이에 이번 포스팅에서는 간단한 SAS 코드를 이용해서 패널 자료를 결합하는 방법을 살펴보겠습니다.
[SAS]패널자료 수집, 불균형패널자료를 균형패널자료로 만들기
안녕하세요, 패널자료를 다루는 방법에 대해서 살펴보겠습니다. 단순하게 패널자료를 묘사하면 동일한 대상(ID)을 여러 차례 측정(TIME)한 자료라고 생각하시면 됩니다. 예를 들어 전자공시시스
paratussemper.tistory.com
[SAS ODA]논문 필수 패널회귀분석, 클릭으로 끝내기
안녕하세요, 요즘 사회과학 계열의 학위논문을 살펴보면 많은 분들이 패널회귀분석을 사용한 논문을 쉽지 않게 확인할 수 있습니다. 그러나 패널회귀분석의 개념을 완전하게 이해하고 활용하
paratussemper.tistory.com
우선 아래의 코드를 이용해서 데이터셋을 만들어봅니다. 관측치가 4개밖에 없는 아주 작은 데이터셋입니다.
DATA A;
INPUT ID $ TIME X1;
CARDS;
AA 1 3
BB 1 4
AA 2 3
BB 2 6
;
RUN;
DATA B;
INPUT ID $ TIME X2;
CARDS;
AA 1 7
BB 1 2
AA 2 4
BB 2 3
;
RUN;
ID와 TIME 변수가 아래의 데이터셋이 패널자료임을 보여줍니다. 물론 이렇게 작은 데이터셋은 엑셀을 이용해서 결합하는 것이 편합니다. 아래의 데이터셋을 결합해서 X1과 X2의 평균을 구해보겠습니다.
A와 B데이터셋을 결합하기 위해서는 기준 변수가 필요합니다. 즉, 개별 관측치를 대표하는 변수를 만들어야 합니다. 이를 위하여 ID와 TIME을 활용할 수 있습니다. 즉, ID와 TIME을 결합하면 개별 관측치를 대표하는 기준 변수를 만들 수 있습니다. 이는 패널자료의 특성을 고려할 때 1 시점의 AA라는 ID를 가진 관측치는 1개이기 때문입니다. 저는 ||와 COMPRESS 함수를 함께 사용합니다.
DATA A1;
SET A;
KEY = ID||TIME;
KEY1 = COMPRESS(ID||TIME);
KEY2 = CAT(ID, TIME);
RUN;
DATA B1;
SET B;
KEY = ID||TIME;
KEY1 = COMPRESS(ID||TIME);
KEY2 = CAT(ID, TIME);
RUN;
위의 코드를 실행시키면 아래와 같은 데이터셋 2개를 얻을 수 있습니다. ||나 CAT를 사용하여 얻은 기준변수를 만들더라도 두 데이터셋의 공백이 다른 경우 결합이 되지 않기 때문에 COMPRESS를 사용하는 것이 좋습니다.
이후 DATA STEP의 MERGE를 이용해서 두 데이터셋을 결합합니다. MERGE를 사용하기 전에 기준 변수인 KEY1을 기준으로 데이터셋을 정렬해야 합니다. 참고로 SQL을 사용하여 데이터셋을 결합하는 경우 PROC SORT를 사용하여 데이터셋을 정렬하지 않아도 됩니다.
PROC SORT DATA=A1;
BY KEY1;
RUN;
PROC SORT DATA=B1;
BY KEY1;
RUN;
DATA FINAL;
MERGE A1 B1;
BY KEY1;
DROP KEY KEY2;
RUN;
위의 코드를 실행시키면 아래와 같이 데이터셋이 잘 결합된 것을 확인할 수 있습니다.
마지막으로 PROC MEANS 프로시저를 활용하여 결합한 데이터셋의 X1과 X2의 평균을 구하였습니다.
PROC MEANS DATA=FINAL;
VAR X1 X2;
RUN;
PROC MEANS에 대한 설명은 아래의 포스팅을 참고하시면 됩니다.
[SAS]PROC MEANS로 기술통계분석 끝내기(feat. 집단별 분석)
안녕하세요, 이전 포스팅에서 SAS 프로그램을 이용해서 기술통계분석부터 회귀분석까지 한방에 끝낼 수 있는 코드를 소개해드렸습니다. 이번 포스팅에서는 지난번에 소개해드린 매크로의 첫 번
paratussemper.tistory.com
이상으로 패널 자료 결합을 위한 코드를 살펴보았습니다. ||와 COMPRESS를 잘 사용해서 패널 회귀분석까지 무난하게 끝내시길 바랍니다.
감사합니다!
[SAS] 패널 분석 매크로(1) (일원 임의효과 고정효과 하우즈만 검정) (0) | 2023.04.05 |
---|---|
[SAS] 복수응답 설문조사 문항 개별 더미변수 만들기(find 함수) (2) | 2023.03.29 |
[SAS ODA]엑셀 데이터셋 업로드 및 불러오기 (0) | 2023.03.23 |
[SAS ODA]로지스틱 회귀분석 클릭으로 끝내기 (4) | 2023.03.21 |
[SAS ODA]선형회귀분석 클릭으로 끝내기(조절효과/상호작용항) (3) | 2023.03.19 |
댓글 영역