Data Analyst/기초 통계

[기초 통계] p-value(유의 확률)

hmm06 2024. 10. 16. 21:02

Q1. p-value이란?

우선 p-value에 대해 알기 전에 p가 무엇인지 알아야 합니다.

여기서 p는 probability(확률)의 약자입니다. 즉, p-value는 확률 값이라는 의미입니다.

 

Q2. 그럼 p-value가 무엇에 대한 확률인가?

어떠한 사건이 우연히 발생할 확률입니다.

 

Q3. 왜 p-value는 항상 0.05보다 작아야 합니까?

우선 p-value가 가질 수 있는 값은 0~1까지 입니다.

그냥 수학학자들이 해당 값으로 정한 것입니다.(해당 문제에 대해 알아봤지만 모르겠습니다.)

즉, 5% 정도면 우연이 아닐 것이라는 추정이라는 뜻이기도 합니다.

또는 


내용 정리

p-value가 0.05 이하라는 것은 어떠한 사건이 우연히 일어났을 것이라는 가능성이 없다는 것입니다.

 

또 다르게 말하면 이 사건은 우연히 발생한 것이 아니라 분명히 뭔가 거기에 이유, 혹은 인과관계, 원인이 있다고 추정을 하는 것입니다.

 

만약, p-value가 0.05보다 크면, 이 사건은 우연히 발생한 것이다 라고 생각하고, 이 사건에는 인과관계가 없다고 판단하는 것입니다.

 

그래서 p-value가 0.05보다 작으니 유의하다(의미가 있다) 라는 말이 나온 것입니다.

 

예시

귀무가설 : 이디야 커피매장은 스타벅스 매장 근처에 입점하지 않는다.

대립가설 : 이디야 커피매장은 스타벅스 매장 근처에 입점한다.

 

p-value < 0.05 가정하겠습니다.

귀무가설은 기각이 됩니다. 왜냐하면 " 이디야 커피매장은 스타벅스 매장 근처에 입점하지 않는다"라는 사건이 우연히 일어났을 것이라는 가능성이 없는 것으로 되기 때문입니다. 그래서 대립가설이 채택되게 됩니다.

 


해당 내용은 Sapientia a Dei님의 영상을 보고 공부한 내용입니다.

이상입니다.

728x90