상세 컨텐츠

본문 제목

[Excel]엑셀 분석도구로 t검정 클릭으로 끝내기

DATA & WORLD

by 대학원생D군 2023. 3. 8. 05:51

본문

반응형

안녕하세요,

지난 포스팅에서 엑셀 분석도구 기능을 활용해서 기술통계분석을 하는 방법을 설명해 드렸습니다. 이번 포스팅에서는 엑셀 분석도구로 t-검정(t-test)을 하는 방법을 알아보겠습니다.

 

[Excel]엑셀 분석도구 기능 활성화, 엑셀로 기술통계분석

안녕하세요, 이전 포스팅에서 SAS, R을 이용해서 기초적인 분석을 수행하는 코드를 설명해 드렸습니다. 사실 SAS, R의 경우 프로그램을 설치하였다고 해서 바로 제가 설명드린 코드를 활용해서 데

paratussemper.tistory.com

t-검정은 두 집단의 평균이 통계적으로 유의미하게 다른지 분석할 때 사용됩니다. 학위논문의 경우 관행적인 최소 분량이 있는 경우도 있습니다. 제가 생각할 때 분량을 늘리는 가장 쉬운 방법은 기술통계 내용을 풍성하게 하는 것이고 이때 t-검정이 유용하게 활용될 수 있습니다. 물론 연구의 주제나 분석 변수에 따라서 적절하게 활용해야 합니다.

지난 포스팅에 이어서 SASHELP.CLASS 데이터셋을 활용해서 성별에 따라 체중(Weight)의 차이가 있는지 분석해 보겠습니다. 

t검정의 경우 두 집단의 분산이 같은 경우(등분산)와 그렇지 않은 경우(이분산)를 구분해야 되고, 분석하고자 하는 집단이 대응 표본(e.g. 사전-사후 비교)인지 아닌지를 구분하여 분석해야 합니다. 엑셀의 경우 아래와 같이 (1) t-Test: Paired Two Sample for Means, (2) t-Test: Two-Sample Assuming Equal Variances, (3) t-Test: Two-Sample Assuming Unequal Variances로 구분되어 있습니다.

일단 데이터셋의 Name을 볼 때 대응 표본은 아님을 알 수 있습니다. 그러나 t-검정을 수행하기 전에 두 집단의 분산이 같은지 아닌지 여부를 살펴보아야 합니다. 이를 위하여 F-Test: Two-Sample for Variances를 클릭하여 등분산 여부를 검정해야 합니다. 아래의 그림과 같이 Variable 1 Range에는 남성의 관측치, Variable 1 Range에는 여성의 관측치 범위를 입력하시면 됩니다. 이때 중요한 것은 Labels에 절대 클릭하시면 안됩니다. Labels에 클릭하는 경우 첫 번째 관측치가 변수명이 되어버립니다. 

아래의 분석 결과를 살펴보면 p-value가 0.33으로 귀무가설을 기각하지 못하는 것으로 나타났습니다. 참고로 귀무가설은 '두 집단의 분산이 동일하다'입니다.

그러므로 등분산을 가정하는 t-Test: Two-Sample Assuming Equal Variances를 클릭하여 분석해야 합니다. 위와 마찬가지고 Labels에는 절대 클릭하시면 안 되고 변수의 범위를 지정하시면 됩니다.

분석결과는 아래와 같이 제시됩니다. 남성 집단과 여성 집단의 체중 평균, 분선, 관측치, 자유도, t통계량을 확인할 수 있습니다. 실질적으로 연구자의 가장 큰 관심사인 유의수준(p-value)를 살펴보면 0.07인 것을 알 수 있습니다. 10% 이내로 귀무가설을 기각할 수 있고 성별에 따라 체중 평균은 통계적으로 유의미한 차이가 있다는 결론에 이르게 됩니다. 그러나 학문 분야마다, 연구자의 성향에 따라 유의수준을 5% 이내로 하는 경우도 있으니 참고하시기 바랍니다 

이상으로 엑셀 분석도구를 활용한 t검정을 클릭으로 끝내는 방법을 알아보았습니다.

 

궁금하신 점은 댓글로 남겨주세요:)

감사합니다!

반응형

관련글 더보기

댓글 영역