1. 이산데이터(Discrete Data)
우선 Count할 수 있는 데이터입니다.
우리가 예상할 수 있는 경우의 수를 셀 수 있을 때를 말합니다.
예 : 주사위, 한 반에 있는 학생 수, 각 집마다의 방 개수 등..
Categorical Data라고도 합니다.
2. 연속성 데이터(Continuous Data)
우선 Measured(~을 재다)한 데이터 입니다.
연속성 데이터는 저희가 셀 수 없는 단위로 되어 있습니다. 그 이유는 예시를 들어 설명하겠습니다.
저의 키를 매우 정확하게 말하면 177.89623•••으로 해당 키의 소수점 자리들을 제대로 알 수 없으며 셀 수 없습니다.
즉, 이러한 데이터를 연속성 데이터라 합니다.
그래서 해당 데이터를 세기 위해 그룹화하여 말하는 것입니다. 위의 키를 짐작으로 177.8 또는 177.9의 그룹들에 해당하니 키는 그 정도 하겠구나 라는 느낌으로요.
즉, 측정되서 나오는 데이터들이 연속성 데이터입니다.
예 : 키, 몸무게, 운동선수 기록 시간, 집값(어떠한 기준으로 재어진 가격입니다.)
연속성 데이터는 위의 이산데이터의 그래프와는 달리 빈도표/빈도분포표(Frequency Table)를 활용하여 표현합니다.
빈도표/빈도분포표(Frequency Table)는 Group을 지어서 테이블을 만듭니다.
해당 내용은 Data Scientist 이지영님의 영상을 보고 공부한 내용입니다.
이상입니다.
728x90
'Data Analyst > 기초 통계' 카테고리의 다른 글
[기초 통계] 표본 분포 이해하기 (0) | 2024.10.28 |
---|---|
[기초 통계] 정규분포, 비대칭도, 첨도 (0) | 2024.10.23 |
[기초 통계] 정규분포, 중심 극한 정리 (0) | 2024.10.22 |
[기초 통계] Positive & Negative Skew(Mean vs Median) (1) | 2024.10.21 |
[기초 통계] p-value(유의 확률) (1) | 2024.10.16 |