안녕하세요,
지난 포스팅에서 엑셀 분석도구 기능을 활용해서 기술통계분석을 하는 방법을 설명해 드렸습니다. 이번 포스팅에서는 엑셀 분석도구로 t-검정(t-test)을 하는 방법을 알아보겠습니다.
[Excel]엑셀 분석도구 기능 활성화, 엑셀로 기술통계분석
안녕하세요, 이전 포스팅에서 SAS, R을 이용해서 기초적인 분석을 수행하는 코드를 설명해 드렸습니다. 사실 SAS, R의 경우 프로그램을 설치하였다고 해서 바로 제가 설명드린 코드를 활용해서 데
paratussemper.tistory.com
t-검정은 두 집단의 평균이 통계적으로 유의미하게 다른지 분석할 때 사용됩니다. 학위논문의 경우 관행적인 최소 분량이 있는 경우도 있습니다. 제가 생각할 때 분량을 늘리는 가장 쉬운 방법은 기술통계 내용을 풍성하게 하는 것이고 이때 t-검정이 유용하게 활용될 수 있습니다. 물론 연구의 주제나 분석 변수에 따라서 적절하게 활용해야 합니다.
지난 포스팅에 이어서 SASHELP.CLASS 데이터셋을 활용해서 성별에 따라 체중(Weight)의 차이가 있는지 분석해 보겠습니다.
t검정의 경우 두 집단의 분산이 같은 경우(등분산)와 그렇지 않은 경우(이분산)를 구분해야 되고, 분석하고자 하는 집단이 대응 표본(e.g. 사전-사후 비교)인지 아닌지를 구분하여 분석해야 합니다. 엑셀의 경우 아래와 같이 (1) t-Test: Paired Two Sample for Means, (2) t-Test: Two-Sample Assuming Equal Variances, (3) t-Test: Two-Sample Assuming Unequal Variances로 구분되어 있습니다.
일단 데이터셋의 Name을 볼 때 대응 표본은 아님을 알 수 있습니다. 그러나 t-검정을 수행하기 전에 두 집단의 분산이 같은지 아닌지 여부를 살펴보아야 합니다. 이를 위하여 F-Test: Two-Sample for Variances를 클릭하여 등분산 여부를 검정해야 합니다. 아래의 그림과 같이 Variable 1 Range에는 남성의 관측치, Variable 1 Range에는 여성의 관측치 범위를 입력하시면 됩니다. 이때 중요한 것은 Labels에 절대 클릭하시면 안됩니다. Labels에 클릭하는 경우 첫 번째 관측치가 변수명이 되어버립니다.
아래의 분석 결과를 살펴보면 p-value가 0.33으로 귀무가설을 기각하지 못하는 것으로 나타났습니다. 참고로 귀무가설은 '두 집단의 분산이 동일하다'입니다.
그러므로 등분산을 가정하는 t-Test: Two-Sample Assuming Equal Variances를 클릭하여 분석해야 합니다. 위와 마찬가지고 Labels에는 절대 클릭하시면 안 되고 변수의 범위를 지정하시면 됩니다.
분석결과는 아래와 같이 제시됩니다. 남성 집단과 여성 집단의 체중 평균, 분선, 관측치, 자유도, t통계량을 확인할 수 있습니다. 실질적으로 연구자의 가장 큰 관심사인 유의수준(p-value)를 살펴보면 0.07인 것을 알 수 있습니다. 10% 이내로 귀무가설을 기각할 수 있고 성별에 따라 체중 평균은 통계적으로 유의미한 차이가 있다는 결론에 이르게 됩니다. 그러나 학문 분야마다, 연구자의 성향에 따라 유의수준을 5% 이내로 하는 경우도 있으니 참고하시기 바랍니다
이상으로 엑셀 분석도구를 활용한 t검정을 클릭으로 끝내는 방법을 알아보았습니다.
궁금하신 점은 댓글로 남겨주세요:)
감사합니다!
[DATA&R]휘발유 가격 재역전, 주유소 평균 판매가격은?(R시각화) (5) | 2023.03.12 |
---|---|
[Excel]엑셀 데이터 분석으로 상관분석 클릭으로 끝내기 (0) | 2023.03.11 |
[DATA&R]버블플롯을 활용한 마약 의존도 및 위험도 시각화 (2) | 2023.03.07 |
[DATA&R]나이키 리셀 열풍 속 아디다스, 뉴발란스의 반격 (4) | 2023.03.04 |
[Excel]엑셀 분석도구 기능 활성화, 엑셀로 기술통계분석 (2) | 2023.03.02 |
댓글 영역