환웅 데이터

STAT134 Lec20 본문

확률론

STAT134 Lec20

환 웅 2022. 10. 23. 17:44

Section 4.5 Cummulative Distribution Function (CDF) 누적분포함수

누적분포함수, 확률밀도함수를 누적하여 구할 수 있는 확률분포함수이다. 누적분포함수는 확률변수가 x 이하의 모든 값을 가질 확률을 누적함으로써 정의된다. 즉, random variable이 특정 값보다 작거나 같을 확률을 나타내는 함수다.

주어진 random variable X의 CDF는 다음과 같이 정의한다.

PDF와 CDF의 관계

CDF를 미분하면 PDF, 반대로 PDF를 적분하면 CDF가 된다.

PDF는 f(x)로 표기하고, CDF는 F(x)로 표기한다.

Section 4.2 Exponential Distribution (지수 분포)

어떤 사건이 처음으로 발생하기까지의 걸린 시간을 random variable t라고 하고, 렉쳐 노트에서 지수 분포의 PDF를 확인해보자. 지수분포는 시간에 대한 분포이기에 t가 항상 0보다 같거나 큰 값이다.

모수인 람다(λ)는 단위 시간동안 평균발생횟수를 의미하고, 지수 분포는 주로 CDF를 이용한다.

어떤 사건이 처음 발생하기까지의 걸린 시간이 시간 t를 초과하는 것은 다음과 같다.

아래 그림에서 파란 면적이 이에 해당한다. P(T > t) 는 survival function이라고도 불린다.

주황색으로 색칠된 면적은 지수 분포의 CDF이다.

CDF and survival function

CDF를 미분하면 PDF가 된다는 점을 잊지말자.

The Memoryless Property (무기억성 성질)

 

여기서 s와 t는 시간을 나타내는 변수라고 하자.

P(X > t)가 의미하는 것은 어떤 사건이 t 시점 이후에 발생할 확률을 의미하며, 이는 어떤 사건이 t시점까지 발생하지 않았다는 말과 같다. 이와 마찬가지로, P(X > t + s)가 의미하는 것은 어떤 사건이 t + s 시점 이후에 발생할 확률을 의미한다.

 

이때, 무기억성 성질은 어떤 사건이 t 시점까지 발생하지 않았다는 조건하에 t + s 시점까지도 발생하지 않을 확률은 t와 t + s시점 사이의 길이인 s 시간 동안 어떤 사건이 발생하지 않을 확률과 같다고 말한다. 이는 P(X > s)로 나타낼 수 있으며, 이 전 t시간 동안 어떤 사건이 발생하지 않았다는 사실을 기억하지 않아도 된다고 말해 무기억성 성질을 띈다고 한다.

 

이제 렉쳐노트를 한번 살펴보자.

정리하자면 Memoryless Property는 지나온 시간에 의해 앞으로 일어나게 될 사건이 아무런 영향을 받지 않는다고 말한다.

무기억성은 기하 분포와 지수 분포에 적용될 수 있다. (향후 추가 예정)

 

Works Cited: 

https://blog.naver.com/PostView.nhn?isHttpsRedirect=true&blogId=oyuniee&logNo=221348849851&parentCategoryNo=&categoryNo=20&viewDate=&isShowPopularPosts=true&from=search 

 

확률질량, 확률밀도함수의 의미?

통계파트로 넘어오면서 가장 먼저 배우게 되는 것이 확률변수, 확률변수의 종류로 이산확률변수와 연속확률...

blog.naver.com

https://www.theissaclee.com/ko/courses/rstat201/week4/

 

확률변수의 명함, 누적분포함수 (Cumulative distribution function) | Issac Lee

code.sourceCode span { display: inline-block; line-height: 1.25; } code.sourceCode span { color: inherit; text-decoration: inherit; } code.sourceCode span:empty { height: 1.2em; } .sourceCode { overflow: visible; } code.sourceCode { white-space: pre; posit

www.theissaclee.com

https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=yunjh7024&logNo=220829584385 

 

Story 7.2 [연속형] 확률변수의 기댓값과 분산

지난 포스트에서 연속형 확률변수의 정의에 대해 알아보았다. 이번 포스트에선 연속형 확률변수의 기댓값과...

blog.naver.com

https://deep-learning-study.tistory.com/498

 

[확률론] 연속형 확률분포 - 지수 분포(Exponential distribution)

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 지수 분포(Exponential Distribution)  정규분포 다음으로..

deep-learning-study.tistory.com

 

https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=yunjh7024&logNo=220831849534 

 

Story 7.4 [연속형] 지수분포와 무기억성질

지수분포는 실제로 많은 영역에서 다양하게 이용된다. 지수 분포의 활용도가 굉장히 높은 이유는 지수분포...

blog.naver.com

https://m.blog.naver.com/mykepzzang/220843050893

 

[확률과 통계] 41. 연속확률분포(5) - 지수 분포, Exponential Distribution

이번에 알아 볼 지수분포는 감마분포의 특수한 경우입니다. 우선 감마분포의 확률밀도함수를 다시 살펴보죠...

blog.naver.com

 

'확률론' 카테고리의 다른 글

STAT134 Lec23  (1) 2022.10.26
STAT134 Lec21  (0) 2022.10.24
STAT134 Lec19  (0) 2022.10.23