글 : 권정민
만화: 주형
구매 사이트 : 클릭!
이 책은 확실히 저같이 아예 모르는 사람도 읽기 편하고 데이터를 직접 만져볼 때 무심코 지나갈만한 중요한 내용들 또한 찝어서 알려주는 책이였습니다.
그리고 확실히 만화로 되어있어서 처음 접근하기 좋았고 재밌게 읽었던 것 같습니다.
이제 저는 해당 책에서 읽었을 때 기억하면 좋을 것 같은 내용들을 쓰려고 합니다!!
1. 범위 제한을 통한 정확도 향상
데이터 분석의 근간의 논리고, 논리는 명확한 정의와 범위의 제한으로부터 시작됩니다.
모호하게 '포괄'한 '보편적인' 것은 데이터 분석에서는 거의 통용되지 않습니다.
즉, 주변의 상황을 확인하고, 가지고 있는 데이터 분석의 제약 사항을 확인하여 이를 맞춰 나갈 때, 제대로 된 데이터 기반 의사 결정을 할 수 있습니다.
2. 평균이란 무엇인가?
대푯값(평균)이 진실을 잘 '요약'해주기는 하지만, 모든 진실을 완벽하게 반영하는 것은 아니라는 것을 기억합시다.
무언가를 요약하면, 그만큼 세부적인 정보는 버려지는 것은 어쩔 수 없습니다. 그래서 해당 값이 어떤 집합을 대표하고 요약 된 것인지를 고려해야 한다.
평균외에도 종종 등장하는 값은 '중앙값'과 '최빈값'이 있습니다.
중앙값 : 가운데에 위치하는 값
최빈값 : 가장 많은 원소가 포함된 범위의 값
우리는 대푯값을 볼 때, 평균만이 아니라 그 분포가 어떻게 생겼는지를 고민해보아야 합니다.
평균과 다른 대푯값을 같이 본다든가, 분포의 모양을 추정할 수 있는 간략한 그래프라도 같이 볼 수 있도록 해봐야 합니다.
제 생각에는 프로젝트같은 작업을 할 때 해당 수치들의 분포 모양을 잘 살펴봐야 할 것 같습니다.
3. 데이터 문해력
데이터 문해력은 일반적인 문해력처럼, 데이터를 사용해서 '읽고 쓰고 말하고 듣는' 능력을 뜻합니다.
데이터 읽는 방법
1. 데이터 출처와 목적을 우선 파악해야 합니다.
2. 데이터에서 누락된 부분은 없는지도 확인해야 합니다.
3, 그 논리에 허점이 없는지를 확인해야 합니다.
확률은 명확하지 않은 신뢰구간과 함께 오고, 확신이란 정말로 낮은 확률에서나 가능한 이야기며, '높은 확률로' 말할 수 있는 것도 있지만 그렇지 않은 것도 부지기수입니다.
4. 느낀점
해당 책의 마지막 부분입니다. 아직 취준생이지만 취준 생활을 하면서 프로젝트 같은 것도 이번에 많이 해보고 있는데 미리 이 책에서 알려주는 방법들을 좀 적용해보면서 했다면 확실히 더욱 도움이 됬을 것이라 생각합니다.
그리고 평균과 관련된 내용은 확실히 중요한 것 같습니다. 저는 요즘 통계 관련 책들을 사서 계속해서 통계와 친해지려 노력을 하고있습니다. 그러다 보니 다른 책들도 읽어보면서 평균이라는 개념은 빠지지 않는 내용입니다.
그래서 한번 더 복기 할 수 있었습니다.
그리고 저는 데이터 문해력을 올릴 수 있도록 최선을 다할 것이고 위의 데이터 읽는 방법을 항상 데이터를 처음 볼 때 마다 적용해봐야 할 것 같습니다.
이상으로 데이터 분석가의 숫자유감에 대한 후기를 마치겠습니다.
'Data Analyst > BOOK' 카테고리의 다른 글
[책 리뷰] 데이터 분석가의 숫자유감 - 3 (2) | 2024.11.07 |
---|---|
[책 리뷰] 데이터 분석가의 숫자유감 - 2 (1) | 2024.11.05 |
[책 리뷰] 데이터 분석가의 숫자유감 - 1 (0) | 2024.11.01 |