To love

귀무가설과 대립가설 본문

통계학 /가설 검정

귀무가설과 대립가설

Student9725 2020. 8. 4. 12:08

1. 사실과 입장

 

우리는 어떤 사건을 보면 그 사건을 하나의 입장으로 받아들이곤 합니다. ‘비가 30mm 내린다는 사실을 비가 많이 온다는 입장으로 받아들입니다. 이러한 특성이 기초통계의 생각에 그대로 녹아나 있습니다.

 

일상생활에서 사실 fact를 표현하는 방식은 말과 글입니다. 이를 조금 더 구체화하기 위해 현상을측정하고, 그 과정에서 척도를 이용한다면 시각화 한다면, 표나 그래프, 숫자가 되겠지요. 사회조사분석사 시험의 개념에 따르면, 측정은 현상을 숫자로 표현하는 것이고, 척도는 숫자들을 체계화 시킨 것입니다.

 

통계학에선 사실을 고급진 용어로 data라고 합니다. 입장model, 다른 말로 분포라고 합니다. 어떤 사실이 어떤 입장을 따른다. 또는 어떤 사실이 어떤 입장에 부합한다. 라는 말은 data가 특정한 분포를 따른다는 말과 같습니다. 예를 들어, 대한민국 남자 20대 대학생의 키는 정규분포를 따른다는 말은 남자 20대 대학생의 키를 모두 측정하여 히스토그램이라는 그래프로 그렸을 떄, 그 그래프의 모양이 정규분포의 모양과 비슷하다는 말입니다.

 

 

2. 모집단의 표현

 

통계학의 주 관심은 모집단입니다. 정확히 말하면 모집단이 가진 다양성입니다. 모집단이 가진 다양성을 숫자를 통해 표현 할 수도, 범주를 통해 표현할 수도 있습니다. 어떤 방법으로 표현할건지는 이전에 다룬 변수의 종류와 연관이 있습니다. 숫자로 분석이 가능한, 다시 말해 수학을 사용할 수 있는 변수가 있고, 그렇지 않은 변수가 존재한다고 했습니다. 전자를 양적변수, 후자를 질적 변수라고 한다고도 했습니다.

 

질적 변수의 표현은 원 그래프, 막대 그래프, 빈도표로 가능합니다. 양적 변수의 표현은 그보다 더 복잡합니다. 히스토그램, 상자그림, 평균, 표준편차 등 익숙한 여러 개념들이 모두 양적변수의 표현입니다. 이들 개념은 이후에 하나하나 자세히 다루겠습니다.

 

 

3. 귀무가설과 대립가설

 

과학과 관련된 논문에서는 종종 모집단이 자신의 입장에 가까운 형태를 하고 있다고 주장하기 위한 방법으로 통계학을 사용합니다. 이 때 나와 정반대되는 입장이 있고, 그 입장이 틀렸다고 주장하는 방식으로 나의 입장이 옳음을 증명합니다.

 

이 때, 나의 입장은 기존연구의 한계점이나 새로운 방법론을 제안하는 경우가 많다고 합니다. 그래서 기존의 입장을 의심하며 시작하게 되는데, 기존의 입장을 의심해보았을 떄, 의심의 여지가 없으면 의심 자체가 의미가 없게 됩니다. 그래서 가설 검정의 결과에서 기존의 입장을 지지하는 방향을 표현한다는 의미로 기존의 입장을 귀무가설이라고 합니다. 반면 나의 입장, 새로운 입장은 귀무가설과 반대된다는 의미로 대립가설이라고 합니다. 가설의 통계적인 의미는 모집단의 특성에 관한 진술, 주장 혹은 추측입니다.

 

입장을 의심하는 방법은 사실을 가져오는 것입니다. 예를 들어, 귀무가설은 기존 연구의 입장이 비가 50mm이상 올 때, 많이 온다고 하겠다’ -> ‘비가 많이온다이고, 비가 많이 왔다고 주장을 했다. 데이터를 살펴보니 30mm 왔다.

 

그런데 문제가 하나 있습니다. 20mm의 차이는 과연 허용해 줄 수 있는 가벼운 차이일까요? 아니면 절대 허용할 수 없는 굉장히 큰 차이일까요?

 

이 문제를 풀려면, 먼저 귀무가설의 입장이 어떤지를 알아야합니다. 수학적 표현으로는 귀무가설의 분포를 알아야 합니다. 그런 후 귀무가설의 분포에서 20mm의 차이가 큰지 작은지 살펴보아야 합니다.

 

다음 글에서는 20mm의 차이가 큰지 작은지 어떻게 알 수 있을지에 대한 개념인 p값에 대해 다루겠습니다.

Comments