Q1. p-value이란?
우선 p-value에 대해 알기 전에 p가 무엇인지 알아야 합니다.
여기서 p는 probability(확률)의 약자입니다. 즉, p-value는 확률 값이라는 의미입니다.
Q2. 그럼 p-value가 무엇에 대한 확률인가?
어떠한 사건이 우연히 발생할 확률입니다.
Q3. 왜 p-value는 항상 0.05보다 작아야 합니까?
우선 p-value가 가질 수 있는 값은 0~1까지 입니다.
그냥 수학학자들이 해당 값으로 정한 것입니다.(해당 문제에 대해 알아봤지만 모르겠습니다.)
즉, 5% 정도면 우연이 아닐 것이라는 추정이라는 뜻이기도 합니다.
또는
내용 정리
p-value가 0.05 이하라는 것은 어떠한 사건이 우연히 일어났을 것이라는 가능성이 없다는 것입니다.
또 다르게 말하면 이 사건은 우연히 발생한 것이 아니라 분명히 뭔가 거기에 이유, 혹은 인과관계, 원인이 있다고 추정을 하는 것입니다.
만약, p-value가 0.05보다 크면, 이 사건은 우연히 발생한 것이다 라고 생각하고, 이 사건에는 인과관계가 없다고 판단하는 것입니다.
그래서 p-value가 0.05보다 작으니 유의하다(의미가 있다) 라는 말이 나온 것입니다.
예시
귀무가설 : 이디야 커피매장은 스타벅스 매장 근처에 입점하지 않는다.
대립가설 : 이디야 커피매장은 스타벅스 매장 근처에 입점한다.
p-value < 0.05 가정하겠습니다.
귀무가설은 기각이 됩니다. 왜냐하면 " 이디야 커피매장은 스타벅스 매장 근처에 입점하지 않는다"라는 사건이 우연히 일어났을 것이라는 가능성이 없는 것으로 되기 때문입니다. 그래서 대립가설이 채택되게 됩니다.
해당 내용은 Sapientia a Dei님의 영상을 보고 공부한 내용입니다.
이상입니다.
'Data Analyst > 기초 통계' 카테고리의 다른 글
[기초 통계] 표본 분포 이해하기 (0) | 2024.10.28 |
---|---|
[기초 통계] 정규분포, 비대칭도, 첨도 (0) | 2024.10.23 |
[기초 통계] 정규분포, 중심 극한 정리 (0) | 2024.10.22 |
[기초 통계] Positive & Negative Skew(Mean vs Median) (1) | 2024.10.21 |
[기초 통계] 이산 데이터 VS 연속성 데이터 (2) | 2024.10.16 |