이 글은 내가 응용통계학과 학부생으로써 배운 내용을 정리 및 복습하기 위해 기록한다.
수리통계학을 공부하기 위해 꼭 알아야 하는 개념이다. 천천히 알아보도록 하자.
pmf : 확률질량함수 (probability mass function)
pdf : 확률밀도함수 (probability destiny function)
cdf : 누적분포함수 (cumulative distribution function)
1. pmf
이산형 확률 분포 (discrete probability distribution)을 함수로 나타낸 형태이며, 다음과 같은 특성을 갖는다.
pmf는 모든 확률변수 X에 대하여 0에서 1사이의 값을 가지며, 모든 확률변수 X의 합인 경우 확률질량함수 pmf는 1이 된다.
2. pdf
연속형 확률 분포 (continuous probability distribution)을 함수로 나타낸 형태이며, 다음과 같은 특성을 갖는다.
3. cdf
pdf(pmf) f(x)의 적분값(합)을 F(x)라고 할 때, 다음과 같은 특징이 있으면 F(x)는 cdf 이다.
쉽게 정리하면
pmf는 시그마(∑)를 사용하며 이산형인 확률변수의 분포를 함수로 나타낸 것이고
pdf는 인테그랄(∫)을 사용하며 연속형인 확률변수의 분포를 함수로 나타낸 것이다.
cdf는 이들과 좀 더 다른 결을 가지며, pdf(pmf)의 적분값(합)을 함수로 나타낸 것이다.
예를 들어, 정규분포를 살펴보자
정규분포의 분포함수 f(x)는 pdf이며,
의 성질을 갖는다. 이 식의 증명은 추후에 할 것이다. ∫속의 함수가 pdf인 f(x)이
고, 위 식 자체는 F(∞)-F(-∞)=1-0=1임을 이해하였다면 pdf와 cdf의 관계를 이해했을 것이다.
앞으로 내가 한학기 동안 배운 내용을 이런식으로 간략하게 정리하는 시간을 방학동안 가질 것이다. 부족한 내용은 보충하고 이해했던 내용은 정리하면서 데이터 분석의 기초가 될 수 있는 학부 과목을 탄탄하게 다지는 계기가 되었으면 좋겠다.
'Statistics > 수리통계학' 카테고리의 다른 글
푸아송 분포(Poisson's distribution) (0) | 2021.07.17 |
---|---|
[수리통계학] mgf(적률생성함수) (7) | 2021.06.22 |