Be Brave, Be Humble

논문 작성) 모수/ 비모수 방법론 선택 (정규성 검토가 전부는 아니다) 본문

Statistics/Medical and Bio

논문 작성) 모수/ 비모수 방법론 선택 (정규성 검토가 전부는 아니다)

해쨔니 2022. 8. 1. 19:38

Parametric (모수)/ Non-parametric (비모수) 방법론에 관련하여 자문 받았던 내용들을 기반으로 작성하겠습니다.

 

1. 모수/ 비모수가 뭔가요?

데이터값 자체로 분석하는 게 모수적 방법이며, 데이터의 rank(순위)를 사용하는 것이 비모수적 방법론입니다.

키를 예로 들면

모수적 방법론은 181, 179, 130 이 값 자체를 사용하며

비모수적 방법론은 130, 170, 181로 정렬하여 130은 1등, 170은 2등, 181은 3등 이렇게 순위를 부여하여 이 '순위 차이'를 계산하는 것입니다.

 

 

2. 어떻게 선택하나요? 30명이면 모수 아닌가요?

이전 포스팅에도 말했듯이 샘플사이즈에 절대적인 기준이란 없습니다. 제발 30명을 잊으세요.

데이터가 정규성을 만족하면 모수적 방법론, 만족하지 않으면 비모수적 방법론을 사용합니다.

다만, 데이터가 10~20명 정도로 매우 적은 경우는 정규성 여부와 상관없이 비모수 방법론을 쓰시는 것을 추천드립니다. 모수적 방법론으로 쓰면 비모수로 변경하라는 리비전 코멘트 받을 확률이 높습니다.

 

 

3. 정규성은 어떻게 검토하나요?

Shapiro-Wilks 분석이 가장 많이 사용됩니다. 이 때 주의할 점은 p-value가 0.05보다 커야 정규성을 만족한다는 겁니다. (가설이 'H0: 정규분포이다/ H1: 정규분포가 아니다'이기 때문) 

QQ plot으로 러프하게 보는 방법도 있습니다. 

 

 

4. *** 정규성을 만족하지 않으면 무조건 비모수인가요?

가장 중요한 부분입니다. 이전에 포스팅한 power가 여기 또 등장합니다.

일반적으로 Sample size가 클수록 power는 높아집니다. Power가 높아지면, 아주 작은 차이로도 H0를 기각할 수 있습니다.

예를들어, 'H0: 두 그룹의 키는 같다/ H1: 두 그룹의 키는 다르다' 라는 가설이 있습니다.

이 때 샘플사이즈가 아주아주 크면 두 그룹의 키가 고작 0.001cm밖에 차이가 나지 않는데도 H0를 기각할 수 있습니다. 상식적으로 생각해보면 아주 작은 차이인데도 이걸 차이가 난다고 주장할 수 있다는 것입니다.

 

정규성 검토도 마찬가지입니다. 샘플이 아주아주 많으면(경험상 100개만 넘어도), 정규분포에서 아주 살~~~짝 어긋나는데 p-value가 매우 작게 나와 정규성을 따르지 않는다고 나옵니다. 이런 경우 위에서 언급한 QQ plot 혹은 커널 그래프로 판단합니다. 사람의 눈은 생각보다 정확합니다. 

 

 

5. 모수/ 비모수엔 어떤 방법론이 있나요?

a) 두 군 비교

모수: independent t-test   <->   비모수: wilcoxon rank-sum test (SPSS는 Mann Whitney U test)

b) 짝지은 그룹 비교

모수: paired t-test   <->   비모수: wilcoxon signed rank test

c) 세 그룹 비교

모수: ANOVA   <->   비모수: Kruskal-Wallis test

 

+) 사실 기초분석을 비모수로 했으면 회귀분석도 비모수로 하는 것이 아다리가 맞으나 이 부분을 지적하는 리뷰어는 거의 없습니다. 따라서 기초통계라고 할 수 있는 위 세가지 경우는 비모수로 진행하되 그 이후 분석인 회귀분석 등은 그냥 사용합니다. 전부 rank로 바꾸는 비모수 방법론도 있긴하지만 굳이..

 

6. *** 모수/ 비모수 어떤 게 더 좋은가요?

비모수 방법론을 쓰는 게 맞다면 당연히 비모수를 써야합니다만, 모수적 방법론을 써도 되는 경우에는 모수를 추천드립니다.

왜냐하면 데이터 사이즈가 적절하고 정규분포에서 많이 벗어나지 않는다면, 모수적 방법이나 비모수적 방법이나 p-value가 크게 다르지 않음에도 불구하고 대부분의 경우 모수적 방법론이 power가 높게 나오기 때문입니다.

 

 

 

Comments