안녕하세요,
몇년전부터 머신러닝, 딥러닝에 대한 관심이 많이 증가하였습니다. 그러나 머신러닝 관련 책을 살펴보면 회귀분석에 대한 내용이 포함되어 있습니다. 머신러닝의 알고리즘과 비교하면 선형 회귀분석은 단순한 방법이지만 선형 회귀분석은 오래 전부터 지금까지 사회과학 연구에서는 많이 활용되고 있는 분석 방법입니다. 이번 포스팅에서는 SAS ODA에서 선형회귀분석을 하는 방법을 살펴보겠습니다.
이번 포스팅에서도 역시 SASHELP.CLASS 데이터셋을 사용합니다. 작업 및 유틸리티 > 선형 모델 > 선형회귀로 선형회귀분석을 할 수 있습니다. 우선 데이터셋을 입력하고, 종속변수에 종속변수를, 분류변수(범주형 변수), 연속변수에 설명변수를 클릭합니다. 효과 모수화나 결측값 처리는 기본 값으로 분석하면 됩니다.
다음으로 모델을 클릭하면 모델 효과를 추가할 수 있는데 상호작용항을 고려하지 않는 경우 각 변수를 클릭하여 단일 효과 > 추가를 클릭하면 됩니다. 만일 조절효과 분석을 위하여 상호작용항 변수를 만들고 싶다면 아래와 같이 원하는 변수 2개를 클릭한 후 단일 효과 > 교차 버튼을 클릭하면 됩니다.
조절효과 개념에 대한 자세한 설명은 아래의 포스팅을 참고하시면 됩니다.
[DISSERTATION]조절효과 분석으로 학위논문 마무리
안녕하세요, 지난 포스팅에서 이중차분법(DID)에서 한 단계 나아간 삼중차분법(DDD)에 대하여 살펴보았습니다. 결국 삼중차분법에도 조절효과 분석의 원리가 포함되어 있기 때문에 조절효과 개념
paratussemper.tistory.com
위의 모델 단계까지 마치면 코드가 생성되고 달리기 버튼을 클릭하면 분석을 할 수 있습니다. 그러나 회귀진단을 위해서는 옵션에서 원하는 통계량을 클릭해야 합니다. 회귀진단 방법은 다음 포스팅에서 상세히 살펴보고 이번 포스팅에서는 기본 통계량만 출력되도록 옵션을 설정하였습니다.
SAS ODA에서는 모델 선정 기능을 지원하는데 전진선택, 후진선택, 단계별 선택 방법을 사용할 수 있습니다. 예측 모형을 만드는 것이 목적인 경우 유용하게 활용할 수 있습니다. 이번 포스팅에서는 없음으로 설정하였습니다.
다른 프로시저와 마찬가지로 선형회귀분석결과를 테이블로 생성할 수 있습니다. 예측값과 그 신뢰구간, 잔차, 영향통계량 데이터셋을 만들 수 있습니다.
분석결과를 살펴보겠습니다. 분석결과 초반에 나오는 표들은 논문 작성에 크게 필요한 내용이 아니라서 넘어가셔도 됩니다.
논문 작성에 필요한 주요 정보는 아래와 같이 정리되어 출력됩니다. F Value와 유의수준, R-Square, Adjusted R-Square 뿐만 아니라 AIC, BIC, SBC 정보도 확인할 수 있습니다. 그리고 회귀계수와 그 유의미성을 확인할 수 있는데 Age, Weight는 통계적으로 유의미한 것으로 나타났습니다.
회귀진단에 사용되는 여러 그래프를 확인할 수 있는데 해당 내용은 다음 포스팅에서 자세히 다뤄보겠습니다.
위의 분석결과를 출력하기 위하여 아래와 같이 복잡한 코드가 사용되었습니다. 코드는 다음 포스팅에서 옵션 하나하나 뜯어보겠습니다.
ods noproctitle;
ods graphics / imagemap=on;
proc glmselect data=SASHELP.CLASS outdesign(addinputvars)=Work.reg_design;
class Sex / param=glm;
model Height=Age Weight Sex Weight*Sex / showpvalues selection=none;
run;
proc reg data=Work.reg_design alpha=0.05 plots(only)=(diagnostics residuals
observedbypredicted);
where Sex is not missing;
ods select DiagnosticsPanel ResidualPlot ObservedByPredicted;
model Height=&_GLSMOD /;
output out=work.Reg_stats p=p_ lcl=lcl_ ucl=ucl_ lclm=lclm_ uclm=uclm_;
run;
quit;
proc delete data=Work.reg_design;
run;
이전에 엑셀 데이터 분석을 이용해서 회귀분석을 하는 방법을 알아보았습니다. SAS ODA는 분석에 특화된 프로그램이라 엑셀과 다르게 여러 통계량을 편하게 확인할 수 있다는 강점이 있고 엑셀과 마찬가지로 클릭으로 분석을 할 수 있기 때문에 굉장히 편리합니다.
[Excel]엑셀 데이터 분석으로 회귀분석 끝내기(VIF구하기)
안녕하세요, 이전 포스팅에서 엑셀 데이터 분석 기능을 활용해서 기술통계분석, t-검정, 상관분석을 수행하는 방법을 알아보았습니다. 자세한 내용은 제 블로그의 개별 포스팅을 참고하시면 됩
paratussemper.tistory.com
지금까지 SAS ODA로 하는 회귀분석에 대하여 알아보았습니다.
궁금하신 점은 언제든 댓글로 남겨주세요!
감사합니다!
[SAS ODA]엑셀 데이터셋 업로드 및 불러오기 (0) | 2023.03.23 |
---|---|
[SAS ODA]로지스틱 회귀분석 클릭으로 끝내기 (4) | 2023.03.21 |
[SAS ODA]상관분석 클릭으로 끝내기(공분산 행렬, 산점도) (0) | 2023.03.17 |
[SAS]조절효과 분석을 위한 평균중심화 with PROC MEANS, SQL (2) | 2023.03.10 |
[SAS ODA]논문 필수 패널회귀분석, 클릭으로 끝내기 (2) | 2023.03.09 |
댓글 영역