통계훌리 [1152871] · MS 2022 · 쪽지

2022-06-25 07:01:02
조회수 289

확률밀도함수에 대해 이해하기

게시글 주소: https://orbi.kr/00057303377

0. 연속확률변수에서의 확률

연속확률변수에서 확률을 구해보자.

예를 들어 우리가 200ml 비커에 물을 무작위로 넣은 후 비커에 몇 ml 담겼는지를 확률변수 X라고 하자.

그렇다면 P(X=50)은 얼마인가?

조금만 생각해보면 0에 수렴할 것이라는걸 알 것이다.

확률값은 0이지만 이것이 불가능한 event가 아니라는 것에 주의하자.

대부분의 연속확률변수가 가질 수 있는 값은 무한히 많기 때문에 특정 확률값은 0이 나오게 된다.

이때문에 우리는 0이 나오지 않는 무언가가 필요하고 그것이 바로 확률밀도함수이다.


1. 확률밀도함수는 cdf를 미분한 것이다.

cdf = cumulative distribution function (누적분포함수)


그냥 확률변수 X가 x보다 작을 확률이 cdf라고 생각하면 된다.



2. 확률밀도함수의 함숫값은 확률값이 아니다.

확률밀도함수는 이름에서 알 수 있듯이 밀도(density)를 구하는 함수이고 함숫값이 확률은 아니다.

밀도(density)는 각각의 확률에 비례한다.

즉 확률밀도함수로 연속확률변수의 확률분포를 알 수 있는 것이다.



3. 확률밀도함수를 적분하면 cdf가 된다.

cdf를 미분하면 확률밀도함수가 되니, 당연히 반대로 적분하면 cdf를 구할 수 있다.



이를 이용하면 특정 구간의 확률을 구할 수 있다.



오르비 수식 입력 기능이 불편해서 좀 있다가 PC에서 내용 조금 수정하도록 하겠습니다.

0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.