📄 연구

[통계] 사전 확률 (Prior Probability) / 가능도(Likelihood) / 사후 분포(Posterior Distribution)

빅데희터 2024. 3. 7. 09:24
반응형

사전확률(Prior Probability)

- 새로운 정보나 데이터를 얻기 전에, 어떤 가설이나 사건에 대해 갖고 있는 초기 믿음

- ex) 코로나에 걸릴 확률이 20%라고 가정했을 때 20%가 그 병에 대한 사전 확률. 아직 어떠한 검사 결과도 보지 않았을 때 그 병에 걸렸을 것이라고 믿는 초기 확률값

 

 

가능도(Likelihood)

- 주어진 데이터가 특정 가설이나 파라미터값에 대해 얼마나 '잘 맞는지'를 나타낸값

- 사전 확률과는 다르게, 새로운 데이터를 바탕으로 계산됨

- ex) 병원에서 코로나 검사를 받았고 결과가 양성이 나왔다고 했을 때, 이 검사 결과가 처음에 생각했던 그 병을 실제로 가지고 있을 '가능성'을 얼마나 높이는지. 즉, 양성 결과가 나올 확률을 가능도(likelihood)라고 할 수 있음

 

 

사후 분포(Posterior Distribution)

-사후 분포는 새로운 데이터를 받아들여 초기 믿음( 사전 확률)을 업데이트한 후의 확률분포. 

-즉, 새로운 정보를 반영하여 수정된 확률

- ex) 코로나 검사 결과 양성을 받고 나서, '이 병에 실제로 결렸을 확률이 얼마나 될까?'를 다시 생각 -> 처음에는 20%였던 사전 확률이 검사 결과를 통해 업데이트되어 50%로 변경될 수 있음. 이때 업데이트된 확률(50%)가 사후 분포

 

 


(챗  GPT 답변)

베이지안 통계를 친구의 생일 선물 고르기에 비유해 보기

 

사전 확률 (Prior Probability)

친구의 생일날 어떤 선물을 할지 결정해야 하는 상황. 당신은 친구가 과학책을 좋아한다고 알고 있음. 이 정보를 바탕으로 과학책을 생일 선물로 고를 확률이 70%라고 생각해 보자. 이때 70%가 사전 확률이다. 즉, 새로운 정보 없이 당신이 가진 기존의 정보나 믿음을 바탕으로 추정한 것.

 

가능도(Likelihood)

그런데 친구와 대화를 하다가 최근에 새로운 취미로 요리에 관심을 가지기 시작했다는 사실을 알게 됨. 이 새로운 정보(데이터)는 친구가 요리 책을 선물로 받았을 때 기뻐할 '가능성'을 나타낸다. 즉, 가능도는 새로운 정보다 얼마나 중요한지, 그리고 당신이 처음 생각한 선물을 얼마나 바꿔야 하는지 알려줌

 

사후 분포(Posterior Distribution)

이제 주어진 정보를 바탕으로 과학책과 요리책 중, 어떤 것을 선물로 줄지 다시 고민해야 함. 친구가 요리에도 관심이 있다는 새로운 정보를 바탕으로, 요리책을 선물할 확률을 이제 80%로 생각하게 됨. 이렇게 새로운 정보를 반영하여 업데이트된 확률이 사후분포임. 즉, 모든 정보를 고려했을 때 최종적으로 내린 결정의 확률값.

 

 

 

반응형