안녕하세요,
티스토리 첫 포스팅에서는 SAS OnDemand for Academics(SAS ODA)에 대해서 간략하게 알아보도록 하겠습니다!
어떤 프로그램을 사용할까?
우선 아래의 외국 포스팅에서 제시된 통계패키지별 구글 스칼라 인용 횟수를 살펴보면 2000년대 중후반을 기준으로 큰 변화가 있어 보입니다. 2000년대 중후반을 기점으로 SPSS의 인용 횟수는 급격하게 하락하였고 SAS 또한 완만하지만 계속해서 하락하는 추세를 보여주고 있습니다. 이와 함께 R, Stata의 인용 횟수는 점차 증가하는 추세를 보이고 있습니다.
The Popularity of Data Science Software | r4stats.com
Comparison of the popularity or market share of data science, statistics, and advanced analytics software: SAS, SPSS, Stata, Python, R, Mathworks, MATLAB, KNIME, RapidMiner
r4stats.com
전체적으로 SAS 사용자는 감소하고 있지만, 국내에서는 건강보험심사평가원 보건의료빅데이터개방시스템, 국민건강보험공단 자료 등을 활용해야되는 의학, 보건계열 연구자와 대학원생들에게는 여전히 학습이 필요한 통계 프로그램입니다. 물론 주변에 보건학을 전공하시는 연구자들을 보면 SAS 뿐만 아니라 stata, R도 함께 사용하고 있습니다.
SAS OnDemand for Academics의 등장
설치형 SAS 프로그램의 구입 비용은 상당합니다. 그렇기 때문에 재정 상황이 넉넉하지 않은 연구자 입장에서는 기관이 구독하지 않는 이상 사용이 어려웠습니다. 또한 몇 년 전까지만 해도 설치형 SAS 프로그램은 윈도우 친화형이라 윈도우에서만 설치가 가능했고 맥 사용자는 패러럴즈를 사용하거나 맥에 윈도우를 설치하지 않는 이상 사용이 어려웠습니다. 그리고 비상업적인 목적으로 활용이 가능한 University Edition는 맥에서도 사용이 가능하였으나 가상 머신을 설치하는 과정에서 어려움을 겪는 사용자들이 많았습니다.
이에 SAS는 UE 서비스를 종료하고 SAS OnDemand for Academics(SAS ODA)를 제공하고 있습니다. 클라우드 기반의 SAS ODA는 무료이며 언제, 어디서나 인터넷을 사용할 수 환경 속에서 컴퓨터나 노트북이 있으면 SAS ODA라는 프로그램을 이용할 수 있다는 장점이 있습니다. 그리고 1인당 5기가의 클라우드 저장 공간을 제공합니다.
https://welcome.oda.sas.com/
직접 사용해본 SAS ODA의 장점
우선 SAS ODA에서는 몇 번의 클릭으로 다양한 분석이 가능합니다. SPSS가 통계 분석을 처음 접하는 사람들에게 아직도 사랑받는 이유는 여러 가지 이유가 있겠지만 몇 번의 클릭으로 다양한 통계분석을 수행할 수 있다는 점이 크다고 생각됩니다. 통계 지식만을 습득하는 것도 어려운 일인데 코딩까지 배워야 된다면 학습 부담이 배가 될 것이고 통계학에 대한 흥미가 많이 떨어질 것입니다. 그리고 통계학의 특성상 단순히 통계학 이론을 학습하는 것뿐만 아니라 직접 데이터를 분석하며 여러 통계량의 의미와 해석에 대해서 익숙해지는 것도 중요합니다. 이러한 측면에서 상대적으로 낮은 진입장벽을 갖고 있는 SPSS가 강점을 갖고 있습니다. (stata에서도 클릭으로 분석할 수 있습니다.)
SAS ODA에서도 클릭으로 여러 통계분석을 수행할 수 있습니다. 좌측의 '작업 및 유틸리티'를 클릭하면 SAS ODA에서 제공하는 통계분석 기법을 확인할 수 있습니다. 논문을 쓰다보면 가장 먼저 하는 기술통계분석의 경우 '통계량' 내의 '요약 통계량' 또는 '데이터 탐색' 기능을 통해서 수행할 수 있습니다. 분석하고자 하는 데이터를 입력하고 분석 변수를 지정해주면 우측에 코드가 나옵니다. 우선 코드는 무시하고 위의 달리기 버튼을 누르면 분석 결과를 확인할 수 있습니다.
그리고 분석에 사용한 코드도 제시되기 때문에 복사하여 다른 분석에서 충분히 활용가능합니다.
proc means data=SASHELP.BASEBALL chartype mean std min max n vardef=df;
var nAtBat;
run;
SAS ODA에서는 사회과학에서 많이 활용되는 패널분석, 요인분석이나 주성분분석과 같은 다변량 분석, 군집분석, 시계열 분석 등 다양한 분석기법을 클릭으로 해볼 수 있습니다. SAS HELP나 여러 커뮤니티 자료 등을 찾아보기 전에 SAS ODA를 통해서 코드를 살펴보는 것도 좋은 방법입니다. 그리고 이러한 분석은 SAS 서버를 이용하기 때문에 사용자의 컴퓨터 성능이 그다지 좋지 않아도 할 수 있습니다. 참고로 꽤 오래전 PROC PANEL 프로시저를 이용하여 패널 분석을 하려고 했는데 노트북의 성능이 좋지 않아 분석할 수 없었던 경험이 있습니다.
앞으로 블로그를 통해서 통계학적인 지식을 전달하기에는 많이 부족하기 때문에 SAS 코드를 설명하는데 집중하려고 합니다! 제 코드가 정답이 아니고 틀린 부분이 있을 수도 있으니 실제 사용하실 때 주의해주시기 바랍니다.
감사합니다!
궁금한 SAS 코드가 있다면 댓글로 남겨주세요:)
[SAS ODA]논문 필수 패널회귀분석, 클릭으로 끝내기 (2) | 2023.03.09 |
---|---|
[SAS ODA]기술통계분석 클릭으로 끝내기(히스토그램, 박스플롯) (3) | 2023.03.06 |
[SAS]PROC MEANS로 기술통계분석 끝내기(feat. 집단별 분석) (2) | 2023.03.05 |
[SAS]패널자료 수집, 불균형패널자료를 균형패널자료로 만들기 (2) | 2023.03.03 |
[SAS]기술통계분석부터 회귀분석까지 한방에 끝내는 매크로 (7) | 2023.02.27 |
댓글 영역