피어슨은 누구?

download report

Transcript 피어슨은 누구?

칼 피어슨
[Karl Pearson,
1857.3.27~1936.4.27]
두 집단의 비교 이야기
차례
피어슨은 누구?
통계학이란…
피어슨의 업적
피어슨에게 배워보자!
내가 생각하는 통계학
피어슨은 누구?
영국의 수리통계학자·우
생학자. 인류의 유전에
관한 통계적 분석, 두개
(頭蓋)의 계측(計測), 결
핵의 통계 등으로 유명
하다. 피어슨파 수리통
계학의 창시자, 생물통
계학의 선구자로 알려져
있으며 과학비평가로서
도 이름이 높음.
통계학이란… 1
응용 수학의 한 분야로서 명확하지 않은 관찰
결과를 수집하고 해석하는 작업을 포함.
확률론은 통계 이론을 정립하기 위한 필수 도
구임. 통계학statistics은 확률을 뜻하는 라틴
어 단어인 staticsticus로부터 유래하였습니
다. 또한 정치가를 뜻하는 이탈리아어인
statista로부터 유래했다는 설도 있습니다.
통계학이란… 2
많은 분야의 연구에서 주어진 문제에 대하여
적절한 정보를 수집하고 분석하여 해답을 구
하는 과정은 아주 중요함. 이런 방법을 연구
하는 과학의 한 분야가 통계임.
통계학을 필요로 하는 연구 분야는 농업, 생
명과학, 환경과학, 산업연구, 품질보증, 시장
조사 등 매우 많음.
피어슨의 업적 - 과학의 근본원리(The
Grammar of Science)
1892년 펴낸 철학 서적.
수학과 기하학ㆍ통계학ㆍ물리학에서 법학과
정치학, 신학ㆍ문학ㆍ미술까지 아우르는 최
고의 과학서 중 하나로 평가 받음.
레닌도 이 책을 인용하고 아인슈타인의 상대
성이론도 여기에서 영향을 받았다는 분석도
있다.
피어슨의 업적 - 통계학
케임브리지대학 킹스칼리지 수학과를 수석으
로 졸업한 후 독일로 건너가 정치학박사 학위
를 받음.
확률을 따져 결론을 이끌어내는 통계기법을
개발, 현대통계학의 지평을 연 사람.
1936년 4월27일 79세로 사망할 때까지 인종
간 우열의 존재를 통계학적으로 부정하는 등
업적을 남김.
피어슨의 업적 - 분포함수 1
통계 역학에서, 통계 집단에 대한 확률밀도를
나타내는 함수. 예를 들면, N개의 같은 종 입
자로 이루어지는 계에서, 그 역학적 상태가
공간 내의 체적요소 d내에 찾아 볼 수 있는 확
률을 fNd로 적을 때 fN을 분포함수라 함.
피어슨의 업적 – 분포함수 2
누적분포함수(累積分布函數)라고도 한다. 확
률변수 X에 대하여 Pr(X≤x)를 x의 함수로 생
각하여 Pr(X≤x)=F(x)라 놓고, 이것을 확률변
수 X의 분포함수라고 한다. 분포함수는 다음
성질을 갖음.
피어슨의 업적 – 분포함수 3
이러한 분포함수에는 연속형(連續型) 확률변
수 X의 분포함수와 이산형(離散型) 확률변수
X의 분포함수가 있다. 예를 들면, 동전을 던
질 때 앞면이 나오면 X=1, 뒷면이 나오면 X
=0으로 하면, X는 하나의 확률변수이고 그
분포함수 F(x)는 다음과 같이 됨.
피어슨에게 배워보자! 1
변량 : 자료를 수량으로 나타낸 것.
도수 : 각 계급에 속하는 자료의 수
도수분포표 : 전체의 자료를 열 개의 계급으
로 나누고, 각 계급에 속하는 도수를 조사하
여 나타낸 표.
계급 : 변량을 일정한 간격으로 나눈 구간.
계급의 크기 : 일정하게 나누어진 구간의 너
비.
피어슨에게 배워보자! 2
계급값 : 계급의 중앙의 값.
히스토그램 : 도수분포표에서 계급을 가로축,
도수를 세로축으로 하여 그려낸 직사각형 모
양의 그래프.
중앙값 : 변량을 크기 순서대로 세울 때, 중앙
에 오는 값.(메디안이라고도 합니다.)
평균 : 한 집단을 이루는 수나 양을 대표하는
하나의 수. (중앙값과 다릅니다 !!)
피어슨에게 배워보자! 3
최빈값 : 도수분포표에서 도수가 가장 큰 계
급의 계급값.(자주 나타나는 것을 말함.)
산포도 : 변량들이 흩어져있는 정도를 하나의
수로 나타낸 값.
분산 : 자료나 어떤 확률분포의 흩어진 정도
를 나타내는 하나의 측도.
표준편차 : 분산의 양의 제곱근.
피어슨에게 배워보자! 4
상관도 : 두 변량 x,y가 어떤 관련성이 있는가
를 알아보기 위하여 이들을 순서쌍으로 하는
점(x,y)를 좌표평면 위에 나타낸 그래프.
상관표 : 두 변량의 도수분포표를 함께 나타
내어 서로의 관계를 알아보기 쉽게 만든 표.
내가 생각하는 통계학
얼핏 통계학이라는 단어를 들으면 딱딱하게 생각하기 마
련이지만, 통계는 수학에 기초를 두고 있지만 그 내용이
과학적이면서 한편으로는 예술적인 면이 있다고 생각합
니다. 객관적이지만 주관적인 포장이 얼마든지 가능하다
는 소리도 됩니다. 그래서 책에 보면 통계라는 말에 허구
라든지 마술이라는 용어를 붙여 쓰기도 합니다. 영국의
정치가인 디즈레일리는 '거짓에는 세 가지가 있어, 거짓
과 새빨간 거짓, 그리고 통계가 그것이다'라고 말했습니
다. 이를 통해 딱딱하던 통계에 대해 약간 좀 더 친밀해
졌다고 생각합니다.