Transcript 피어슨은 누구?
칼 피어슨 [Karl Pearson, 1857.3.27~1936.4.27] 두 집단의 비교 이야기 차례 피어슨은 누구? 통계학이란… 피어슨의 업적 피어슨에게 배워보자! 내가 생각하는 통계학 피어슨은 누구? 영국의 수리통계학자·우 생학자. 인류의 유전에 관한 통계적 분석, 두개 (頭蓋)의 계측(計測), 결 핵의 통계 등으로 유명 하다. 피어슨파 수리통 계학의 창시자, 생물통 계학의 선구자로 알려져 있으며 과학비평가로서 도 이름이 높음. 통계학이란… 1 응용 수학의 한 분야로서 명확하지 않은 관찰 결과를 수집하고 해석하는 작업을 포함. 확률론은 통계 이론을 정립하기 위한 필수 도 구임. 통계학statistics은 확률을 뜻하는 라틴 어 단어인 staticsticus로부터 유래하였습니 다. 또한 정치가를 뜻하는 이탈리아어인 statista로부터 유래했다는 설도 있습니다. 통계학이란… 2 많은 분야의 연구에서 주어진 문제에 대하여 적절한 정보를 수집하고 분석하여 해답을 구 하는 과정은 아주 중요함. 이런 방법을 연구 하는 과학의 한 분야가 통계임. 통계학을 필요로 하는 연구 분야는 농업, 생 명과학, 환경과학, 산업연구, 품질보증, 시장 조사 등 매우 많음. 피어슨의 업적 - 과학의 근본원리(The Grammar of Science) 1892년 펴낸 철학 서적. 수학과 기하학ㆍ통계학ㆍ물리학에서 법학과 정치학, 신학ㆍ문학ㆍ미술까지 아우르는 최 고의 과학서 중 하나로 평가 받음. 레닌도 이 책을 인용하고 아인슈타인의 상대 성이론도 여기에서 영향을 받았다는 분석도 있다. 피어슨의 업적 - 통계학 케임브리지대학 킹스칼리지 수학과를 수석으 로 졸업한 후 독일로 건너가 정치학박사 학위 를 받음. 확률을 따져 결론을 이끌어내는 통계기법을 개발, 현대통계학의 지평을 연 사람. 1936년 4월27일 79세로 사망할 때까지 인종 간 우열의 존재를 통계학적으로 부정하는 등 업적을 남김. 피어슨의 업적 - 분포함수 1 통계 역학에서, 통계 집단에 대한 확률밀도를 나타내는 함수. 예를 들면, N개의 같은 종 입 자로 이루어지는 계에서, 그 역학적 상태가 공간 내의 체적요소 d내에 찾아 볼 수 있는 확 률을 fNd로 적을 때 fN을 분포함수라 함. 피어슨의 업적 – 분포함수 2 누적분포함수(累積分布函數)라고도 한다. 확 률변수 X에 대하여 Pr(X≤x)를 x의 함수로 생 각하여 Pr(X≤x)=F(x)라 놓고, 이것을 확률변 수 X의 분포함수라고 한다. 분포함수는 다음 성질을 갖음. 피어슨의 업적 – 분포함수 3 이러한 분포함수에는 연속형(連續型) 확률변 수 X의 분포함수와 이산형(離散型) 확률변수 X의 분포함수가 있다. 예를 들면, 동전을 던 질 때 앞면이 나오면 X=1, 뒷면이 나오면 X =0으로 하면, X는 하나의 확률변수이고 그 분포함수 F(x)는 다음과 같이 됨. 피어슨에게 배워보자! 1 변량 : 자료를 수량으로 나타낸 것. 도수 : 각 계급에 속하는 자료의 수 도수분포표 : 전체의 자료를 열 개의 계급으 로 나누고, 각 계급에 속하는 도수를 조사하 여 나타낸 표. 계급 : 변량을 일정한 간격으로 나눈 구간. 계급의 크기 : 일정하게 나누어진 구간의 너 비. 피어슨에게 배워보자! 2 계급값 : 계급의 중앙의 값. 히스토그램 : 도수분포표에서 계급을 가로축, 도수를 세로축으로 하여 그려낸 직사각형 모 양의 그래프. 중앙값 : 변량을 크기 순서대로 세울 때, 중앙 에 오는 값.(메디안이라고도 합니다.) 평균 : 한 집단을 이루는 수나 양을 대표하는 하나의 수. (중앙값과 다릅니다 !!) 피어슨에게 배워보자! 3 최빈값 : 도수분포표에서 도수가 가장 큰 계 급의 계급값.(자주 나타나는 것을 말함.) 산포도 : 변량들이 흩어져있는 정도를 하나의 수로 나타낸 값. 분산 : 자료나 어떤 확률분포의 흩어진 정도 를 나타내는 하나의 측도. 표준편차 : 분산의 양의 제곱근. 피어슨에게 배워보자! 4 상관도 : 두 변량 x,y가 어떤 관련성이 있는가 를 알아보기 위하여 이들을 순서쌍으로 하는 점(x,y)를 좌표평면 위에 나타낸 그래프. 상관표 : 두 변량의 도수분포표를 함께 나타 내어 서로의 관계를 알아보기 쉽게 만든 표. 내가 생각하는 통계학 얼핏 통계학이라는 단어를 들으면 딱딱하게 생각하기 마 련이지만, 통계는 수학에 기초를 두고 있지만 그 내용이 과학적이면서 한편으로는 예술적인 면이 있다고 생각합 니다. 객관적이지만 주관적인 포장이 얼마든지 가능하다 는 소리도 됩니다. 그래서 책에 보면 통계라는 말에 허구 라든지 마술이라는 용어를 붙여 쓰기도 합니다. 영국의 정치가인 디즈레일리는 '거짓에는 세 가지가 있어, 거짓 과 새빨간 거짓, 그리고 통계가 그것이다'라고 말했습니 다. 이를 통해 딱딱하던 통계에 대해 약간 좀 더 친밀해 졌다고 생각합니다.