1. 조건부 확률이란?
한 사건이 다른 사건의 발생에 의존적인 경우입니다.
" | "는 해당 기호 뒤에 위치한 사건이 발생했을 때(조건)라는 의미입니다.
ex) 지각할 확률 P(A) = 5%
조건: 타이어가 펑크(F) 났을 때 지각할 확률은 100%이다.
P(A|F) = 100 %
2. 독립이란?
하나의 사건이 다른 사건에 영향을 미치지 않는 경우를 말합니다.
이 때, 사건들이 독립이라면 두 사건의 확률을 곱할 수 있습니다.
ex) 동전이 앞면, 스페이드를 뽑을 확률
P(H, S) = P(H) * P(S) = 1/2 * 1/4 = 1/8 -> 12.5%이다.
3. 예시를 통한 실습
1. 그럼 만약 A, J가 동시에 지각할 확률을 계산할 경우는 어떻게 될 것인지 확인해보겠습니다.
- 서로 독립이므로 곱하면 된다는 것은 안좋은 판단입니다.
- A, J는 서로 같이 야근을 했기 때문에 지각을 했을 수도 있기 때문입니다. 그래서 조건부 확률이 필요합니다.
- P(A|J) = J가 지각 했을 때(조건) A도 지각할 확률 20%
- P(A|J) = 20%
- 이 것이 두 사건이 동시에 일어날 확률을 계산하는 진짜 방법입니다. 이를 "승법 정리"라고도 합니다.
- P(J) * P(A|J) = 10% * 20% = 2%
그리고 알아야 할 것은 아래의 이미지의 교집합 부분과 같이 두 사건이 동시에 발생할 확률은 어느 한 사건이 단독으로 발생할 확률보다 클 수 없습니다.
2. 컴퓨터의 바이러스 감염 여부에 따른 확률을 계산
- 사건 " + "는 바이러스 검사 결과 양성인 경우입니다.
- 사건 " - "는 바이러스 검사 결과가 음성일 경우입니다.
- 사건 " V "는 실제 바이러스 감염된 경우입니다.
- P(+ | V) = 99% -> 바이러스 감염된 컴퓨터를 검사하면 양성일 확률입니다.
- P(- | not V) = 99% -> 바이러스 감염되지 않은 컴퓨터 검사 시 음성일 확률입니다.
- P(V) = 1% -> 무작위로 한 대의 컴퓨터를 골랐을 때 감염된 확률입니다.
- 저희는 P(V | +)를 알아내려면 "베이즈 정리"를 활용해야 합니다.
베이즈 정리
P(A | B) * P(B) = P(B | A) * P(A) 입니다.
베이즈 정리는 트리 구조를 통해 확인하면 더욱 더 빨리 이해가 될 것입니다.
위의 트리의 숫자들을 이용하여 계산 하겠습니다.
P(V | +) * P(+) = P(+ | V) * P(V)
P(+) : 양성 판정 받을 확률 = 99 + 99 / 10000 = 1.98 입니다.
(P(B)=P(B∣A)*P(A)+P(B∣not A)*P(not A)) 이렇게 계산하셔도 됩니다.
P(+ | V) : 99 / 100 = 99% 입니다.
P(V) = 100 / 10000 = 1% 입니다.
이제 위의 수들을 베이즈 정리에 대입하면 P(V | +)의 값을 알 수 있습니다.
P(V | +) * 1.98 = 99% * 1% -> P(V | +) = (99% * 1%) / 1.98
즉, P(V | +) = 50% 입니다.
이상입니다.
'Data Analyst > 기초 통계' 카테고리의 다른 글
[기초 통계] A/B 테스트 (0) | 2024.12.18 |
---|---|
[기초 통계] 1종 오류, 2종 오류 (0) | 2024.10.30 |
[기초 통계]가설 검정(Hypothesis Test) (0) | 2024.10.29 |
[기초 통계] 표본 분포 이해하기 (0) | 2024.10.28 |
[기초 통계] 정규분포, 비대칭도, 첨도 (0) | 2024.10.23 |