본문 바로가기
AI/인공지능(CNN)

[인공지능] 머신 러닝의 핵심 열쇠 : 베이즈 정리(Bayes' Theorem)

by Yoon_estar 2025. 11. 1.
728x90
반응형

데이터를 다루고 머신러닝을 공부하는 사람이라면 반드시 알아야할 핵심 개념 베이즈 정리에 대해 이야기해보려 합니다. 머신러닝 교재의 첫 장을 장식하는 베이즈 정리는 단순히 이론을 넘어 실제 복잡한 문제를 푸는 강력한 도구가 됩니다. 


왜 베이즈 정리가 중요할까?

대부분의 기계 학습(Machine Learning) 방법론들은 어떤 가설을 설정하고, 데이터라는 관찰 결과를 토대로 그 가설을 지속적으로 업데이트해 나가는 과정입니다. 베이즈 정리는 이러한 사후확률(Posterior Probability)의 업데이트 과정을 수학적으로 명쾌하게 설명해줍니다. 

  • 간단하면서도 강력함 : 베이즈 정리에 기반한 베이즈 분류기(Bayes Classifier)는 다른 복잡한 기계 학습 방법론들에 비해 알고리즘이 상대적으로 간단하지만, 현실 세계의 많은 문제를 효과적으로 풀 수 있는 장점이 있습니다. 
  • 확률론적 감각 향상 : 베이즈 정리를 깊이 있게 공부하면, 머신러닝을 심도 있게 이해하기 위해 필수적인 확률론에 대한 감을 키울 수 있습니다. 
  • 지속적인 지식 업데이트 : 베이즈 정리를 이용하면 새로운 관찰 결과(데이터)를 토대로 사후 확률을 지속적으로 업데이트해 나갈 수 있습니다. 

따라서 머신러닝 전무가가 되기 위해서 베이즈 정리에 대한 제대로 된 이해가 필수적입니다. 


베이즈 정리 : 수식과 용어 정리

베이즈 정리를 나타내는 가장 기본적인 공식은 다음과 같습니다. 

$$P(A\mid B)=\frac{P(B\mid A)P(A)}{P(B)}$$이 공식에는 네 가지 핵심 용어가 등장합니다. 이 공식의 가장 큰 매력은 4가지 확률 중 3개를 알면, 우리가 알고 싶어하는 나머지 1개(사후 확률) $P(A|B)$를 자동으로 계산할 수 있다는 점입니다. 

용어 기호 의미
사전 확률(Prior Probability) P(A) 사전 정보로부터 알고 있는 사건 A의 확률
사후 확률(Posterior probability) P(A|B) 증거 B가 주어졌을 때 사건 A가 발생할 확률
우도(Likelihood) P(B|A) A가 발생했을 때 B가 관측될 확률
정규화 상수(Marginal probability) P(B) 가능한 모든 A에 대해 B가 발생할 전체 확률

 


확률(Probability)과 우도(Likelihood)의 차이

두 용어는 혼동하기 쉽지만, 초점을 어디에 두느냐에 따라 다릅니다. 

  • 확률(Probability) : 알려진 확률에 기반하여 미래 이벤트의 가능성을 예측하는 데 중점을 둡니다. 
    • ex) 주사위를 던졌을 때 3이 나올 확률
  • 우도(Likelihood) : 관찰된 데이터($B$)와 특정 가설/모델($A$)간의 일치 정도를 평가하는 데 중점을 둡니다. 
    • ex) $A$라는 가설이 사실일 때, $B$라는 데이터가 관찰될 가능성

베이즈 분류기의 대표 주자 : 나이브 베이즈(Naive Bayes)

베이즈 정리를 기반으로 한 대표적인 분류 모델이 바로 나이브 베이즈(Naive Bayes)입니다. 

  • 나이브(Naive)의 의미 : 순진한 이라는 뜻처럼 이 모델은 모든 특성(Feature)이 서로 완전히 (Independent)이라고 가정하고 베이즈 정리를 활용하여 확률을 계산합니다. 
  • 작동 방식 : 확률 이론에 기초하여 동작하며, 데이터가 특정 클래스에 속할 사후 확률을 계산한 후, 가장 확률이 높은 클래스로 데이터를 분류하는 방식으로 작동합니다. 

베이즈 정리의 적용 예시

다양한 예시들이 검색하면 나옵니다. 이 예시들에 대해선 다른 블로그들을 참고하였고, 이해한 내용들을 작성해보려고 합니다. 

예시로는 유방암 검사 예시, 거짓말 탐지기 예시 등이 있었습니다. 아래는 참고한 글 링크입니다. 

https://brunch.co.kr/@aischool/3

 

베이즈 정리(Bayes’ Theorem)의 정의와 의미

역사상 가장 중요한 통계학 이론 | 통계학 역사상 가장 중요한 이론 중에 하나이자 머신러닝에서 광범위하게 사용되는 수학적이 개념인 베이즈 정리(Bayes’ Theorem)-베이즈룰(Bayes Rule)-에 대해 알

brunch.co.kr

https://deep-learning-study.tistory.com/424

 

[확률론] 베이즈 정리(Bayes' Rule)

고려대학교 김성범 교수님의 확률/통계 강의와 교재 'Sheldon Ross, A First Course in Probability (10th edition)' 를 공부하고 정리한 내용입니다. 김성범 교수님의 확률 강의는 정말 명강의라고 생각합니다!

deep-learning-study.tistory.com

 

겉보기에는 99%라는 높은 검사 정확도(우도)를 가지고 있지만, 베이즈 정리를 통해 계산하면 사전 확률(유방암 발병률)이 매우 낮기 때문에 검사 결과가 양성이더라도 실제로 유방암에 걸렸을 사후 확률은 예상보다 훨씬 낮을 수 있습니다. 이는 베이즈 정리가 새로운 데이터(검사 결과)보다 기존의 사전 지식(발병률)이 최종 추론(사후 확률)에 미치는 영향을 얼마나 강조하는지를 보여주는 대표적인 예시입니다.

 

 

반응형