상세 컨텐츠

본문 제목

[SAS] 선형회귀분석 (feat. PROC GLMSELECT)

SAS

by 대학원생D군 2023. 4. 13. 09:00

본문

반응형

안녕하세요,

지난 포스팅에서 PROC REG, PROC GLM 패키지를 살펴보았습니다. PROC REG는 회귀진단을 위한 다양한 통계량과 그래프를 얻을 수 있었지만 범주형 변수를 사용하기 위해서는 더미변수 변환을 해야 했고 PROC GLM은 범주형 변수 사용이 편리했지만 여러 통계량을 얻을 수 없고 무엇보다 모형선택 방법을 사용할 수 없다는 한계가 있었습니다. 

 

[SAS] 선형회귀분석 (feat. PROC REG 더미변수 만들기)

안녕하세요, 이번 포스팅에서는 SAS 프로그램에서 코드를 작성하여 선형회귀분석을 하는 방법을 살펴보겠습니다. SAS ODA에서 클릭으로 선형회귀분석을 하는 방법은 아래의 포스팅을 참고해 주시

paratussemper.tistory.com

 

[SAS] 선형회귀분석 (feat. PROC GLM)

안녕하세요, 지난 포스팅에서 SAS 프로그램의 PROC REG 프로시저를 활용하여 다중회귀분석, 선형회귀분석을 하는 방법을 살펴보았습니다. PROC REG의 경우 여러 회귀진단 통계량을 확인할 수 있다는

paratussemper.tistory.com

반응형

이번에는 PROC GLMSELECT 프로시저를 살펴보겠습니다. SASHELP GLMSELECT 설명을 살펴보면 위에서 언급한 PROC REG와 PROC GLM의 한계를 보완한 프로시저임을 알 수 있습니다.

SAS Institute Inc.

이번 포스팅에서도 SASHELP.BASEBALL 데이터셋을 사용하여 분석해보겠습니다. 설명변수는 NHITS NRUNS (이상 연속형), league(범주형)이고 종속변수는 SALARY입니다. 다만 PROC GLMSELECT는 PROC GLM과 비교할 때 몇 가지 옵션이 추가되지만 크게 걱정하지 않으셔도 됩니다. 회귀분석을 위한 기본 코드는 아래와 같습니다.

  • proc glmselect data=데이터셋;
    • class 범주형 변수(ref='기준값') / param=glm;
    • model 종속변수=설명변수(연속형, 범주형) / showpvalues selection=none STB;
    • run;
proc glmselect data=SASHELP.BASEBALL;
	class league(ref='American') / param=glm;
	model SALARY=nhits nruns league / showpvalues selection=none STB;
run;

분석결과는 아래와 같이 출력됩니다. 회귀분석이 목표라면 초반부에 나온 결과물은 무시하셔도 됩니다.

아래의 내용만 제대로 파악하셔서 논문 테이블을 채우면 됩니다. 모형정보와 관련하여 F 통계량, R-sqaure, Adjusted R-square, AIC, AICC SBC,  RMSE 통계량이 출력됩니다. 그리고 회귀계수를 살펴보면 비표준화 회귀계수, 표준오차, t 통계량, p-value가 출력되며 STB 옵션을 사용하였기 때문에 표준화회귀계수도 함께 출력되었습니다.

고차항 회귀분석이나 조절효과 분석의 경우에도 PROC GLM 과 같이 변수|변수를 입력하시면 됩니다.이때 결과는 아래와 같이 출력되며 여러 분석에 유용하게 활용할 수 있습니다.

proc glmselect data=SASHELP.BASEBALL;
	class league(ref='American') / param=glm;
	model SALARY=nhits|nhits nruns league / showpvalues selection=none STB;
run;

proc glmselect data=SASHELP.BASEBALL;
	class league(ref='American') / param=glm;
	model SALARY=nhits|nruns league / showpvalues selection=none STB;
run;

PROC GLMSELECT는 PROC REG와 함께 결합하여 사용할 때 더 유용합니다. 그렇기 때문에 SAS ODA에서 클릭으로 선형회귀분석을 하는 경우 PROC GLMSELECT와 PROC REG를 함께 사용하고 있습니다.  

 

[SAS ODA]선형회귀분석 클릭으로 끝내기(조절효과/상호작용항)

안녕하세요, 몇년전부터 머신러닝, 딥러닝에 대한 관심이 많이 증가하였습니다. 그러나 머신러닝 관련 책을 살펴보면 회귀분석에 대한 내용이 포함되어 있습니다. 머신러닝의 알고리즘과 비교

paratussemper.tistory.com

다음 포스팅에서 PROC GLMSELECT와 PROC REG를 함께 사용하여 회귀분석하는 코드를 살펴보겠습니다.

 

궁금하신 점은 언제든 댓글로 담겨주세요:)

감사합니다!

☆ 제 코드는 정답이 아니며 틀린 부분이 있을 수 있으니 주의하여 활용하시기 바랍니다.

반응형

관련글 더보기

댓글 영역