목록통계학 /기술통계 (4)
To love
이전 글 '변수의 의미와 분류'에서 변수의 종류에 대해서 배웠습니다. 변수는 크게 양적변수와 질적변수가 있다고 했고, 둘의 차이는 수학을 쓸 수 있느냐 없느냐 여부라고 했습니다. 하나의 변수를 가진 자료를 일변수(또는 일변량) 자료라고 합니다. 변수가 2개 이상이면 다변량 자료라고 합니다. 자료의 형태에 궁금증을 갖는 이유는 자료가 어떤형태냐 변수가 뭐냐에 따라기술통계 방법이 달라지기 떄문입니다. 이제 각각의 변수의 갯수와 종류에 따라 분석방법을 나열하고, 하나씩 차근차근 설명하겠습니다. 변수가 1개인 경우 변수가 질적이라면, 원 그래프와 막대 그래프를 그립니다.변수가 양적이라면, 빈도표와 히스토그램, 분위수와 상자그림을 이용하거나 변수의 특징을 나타내는 숫자로 요약을 사용합니다. 변수가 2개인 경우 변..
기술통계학을 시작하기 전에, '통계학의 의미와 분류'라는 글에서 언급했던 내용을 잠시 복습하고, 모집단과 표본에 대한 내용을 정리하고 가려고 합니다. 기술하려는 대상이 모집단인지 표본인지 명확히 알아야 어떻게 자료를 기록하고 서술하는 표현을 사용할지, 왜 그렇게 표현해야만 하는지 이해가 가기 떄문입니다. 추측통계학의 목적에 현재의 상태를 파악하는 일이 있다고 했고, '전체를 파악할 수 없을 정도의 큰 대상'의 경우를 생각해보았습니다. 이전 글에서 언급한 예시입니다. 2016년 겨울, 많은 시민들이 광화문 광장에서 촛불을 들었습니다. 많은 언론에서는 시위에 참여한 시민의 숫자에 크게 관심이 있었습니다. 거의 매 집회마다 경찰측과 주최측의 인원추산은 차이가 꽤 있었고 누구의 주장이 맞는지 갑론을박도 있었습니..
많은 통계학 교과서에서 처음 등장하는 개념은 '변수'입니다. 변수란 우리가 연구, 조사, 관찰하고 싶은 대상의 특성입니다. 그런데 이런 개념을 왜 약속할까요? 변수라는 말에 그 의미가 있습니다. 그대로 변하는 수라는 뜻이고, 영어로 하면 variable 입니다.vary가 다양하다는 뜻이니, able과 함께 생각해보면 다양할 수 있는 수, 다양하게 변하는 수라고 생각이 되네요. 이전 글에서 통계학은 다양성(불확실성)의 문제를 다루고 해결책을 제시하는 학문이라고 했습니다. 다양성을 다루기 위해서는 먼저 다양성을 어떤 형태로든 표현해야겠죠. 이것이 변수인 것입니다. 변수의 예로는 사람의 종교, 혈액형, 성별, 오늘의 최고기온, 일년간 교통사고의 수 등이 있습니다. 종교라는 말은 불교, 기독교, 천주교, 등등의..
많이 더운 것 같은데 왜 온도가 저것밖에 안되지?물가가 많이 오른 것 같은데 정부의 물가상승률 발표는 왜 저래?기상청의 통계는 맞는 적이 없어. 매번 틀리자나. 통계학과 학부생인 저도 저런말을 자주하니, 실생활에서 통계는 부정적인 이미지로 많이 사용되는 것 같습니다. 심지어, 라는 제목의 책까지 있을 정도라니까요. 그렇다면 통계는 정말 믿을 수 없는 것일까요?통계를 다루는 통계학은 또 무엇일까요?통계와 통계학은 같은 것일까요? 1. 통계학이란 무엇일까요? 아래는 교과서와 교양서 속 통계학의 의미입니다. 통계학이란 어떤 결론을 얻기 위해 자료를 수집하고, 정리 요약하는 방법이다. - 통계학 입문, 정문사 어느 집단에 대한 경향이나 특징을 알기위해 관측, 조사, 실험한 결과를 숫자나 문자로 나타낸 것이 통계..