To love

1. 선형회귀분석에 관한 이해 통계학의 주 된 관심사는 어떤 현상에 내재된 다양성 또는 불확실성입니다. 통계학 입문 교과서 맨 앞에서는 다양성을 표현하기 위한 한 형태로 ‘변수’라는 개념을 약속합니다. 두 개 이상의 변수가 존재할 때, 이 변수들간의 관계에도 관심을 가지게 됩니다. 각각의 변수들이 수량형인지 범주형인지에 따라 다양성의 형태가 달라지므로 분석 방법도 달라집니다. 많은 책들이 두 변수간의 관계를 서술하기 시작하면서 갑자기 X와 Y라고 이름 붙이고 시작하는 이유는 이를 명확하게 구분하기 위함이 아닐까 합니다. 회귀분석이란 데이터를 통해 Input변수(X)를 기반으로 output변수(Y)의 값을 알아내고자 하는 통계적 모델을 만드는 것과 관련이 있습니다. Input변수를 기반으로 output변수..
기초통계학은 크게 2가지의 분석 기법으로 나누어 볼 수 있습니다. 한 자료에서 모집단이 몇 개 있느냐 연구자의 입장에 따라 바라보는 통계학과, 한 변수와 다른 변수들 간 관계가 무엇인지 탐구하는 통계학입니다. 전자의 대표적인 예시가 두 집단 평균 차이 검정, 또는 분산분석이고, 후자의 대표적인 예시는 상관분석과 회귀분석입니다. 1. 산점도 좌표평면은 데카르트라는 학자의 위대한 발명품입니다. 숫자들로만 표현된 자료를 그림으로 바꾸어 표현하는데 유용하게 사용된다는 점에서 위대합니다. 데이터를 점으로 표현하여, 점이 퍼저있는 그림을 그린 것을 산점도라고 합니다. 상관분석 이전에 반드시 산점도를 작성해야 합니다. 상관계수를 구하는 목적이 상관계수라는 숫자 이전에 두 변수 간 관계에 관심이 있기 때문입니다. 상관..
1. 오컴의 면도날 어떤 현상을 설명할 떄, 그 설명이 너무 복잡하면 머리에 쥐가 나기 마련입니다. 설명을 간단하게 하는 것, 또는 가정을 적게하는 것이 장떙이라는 '오컴의 면도날'이라는 이론이 있습니다. 오컴은 한 논리학자의 이름이고, 면도날은 필요하지 않은 가설을 잘라버린다는데서 유래했다고 합니다. 예를 들어, 새까맣게 그을린 나무가 있다고 가정하자. 이는 나무가 벼락에 맞았기 때문이거나, 아니면 누군가가 어떤 장치를 이용해서 나무가 완전히 잿더미로 변하지 않도록 적절히 그을린 다음 자신이 그을렸다는 흔적을 완전히 없앤 것일 수도 있다. 이 상황을 판단할 다른 증거가 없는 경우 오컴의 면도날을 적용해 본다면, 나무가 그을린 것은 벼락에 맞았기 때문이라고 추론하는 것이 옳다. 왜냐하면, 나무가 벼락에 ..