[책 리뷰] 데이터 분석가의 숫자유감 - 4
·
Data Analyst/BOOK
글 : 권정민만화: 주형구매 사이트 : 클릭!이 책은 확실히 저같이 아예 모르는 사람도 읽기 편하고 데이터를 직접 만져볼 때 무심코 지나갈만한 중요한 내용들 또한 찝어서 알려주는 책이였습니다.그리고 확실히 만화로 되어있어서 처음 접근하기 좋았고 재밌게 읽었던 것 같습니다. 이제 저는 해당 책에서 읽었을 때 기억하면 좋을 것 같은 내용들을 쓰려고 합니다!!1. 범위 제한을 통한 정확도 향상데이터 분석의 근간의 논리고, 논리는 명확한 정의와 범위의 제한으로부터 시작됩니다.모호하게 '포괄'한 '보편적인' 것은 데이터 분석에서는 거의 통용되지 않습니다. 즉, 주변의 상황을 확인하고, 가지고 있는 데이터 분석의 제약 사항을 확인하여 이를 맞춰 나갈 때, 제대로 된 데이터 기반 의사 결정을 할 수 있습니다.2. 평..
[책 리뷰] 데이터 분석가의 숫자유감 - 3
·
Data Analyst/BOOK
글 : 권정민만화: 주형구매 사이트 : 클릭!이 책은 확실히 저같이 아예 모르는 사람도 읽기 편하고 데이터를 직접 만져볼 때 무심코 지나갈만한 중요한 내용들 또한 찝어서 알려주는 책이였습니다.그리고 확실히 만화로 되어있어서 처음 접근하기 좋았고 재밌게 읽었던 것 같습니다. 이제 저는 해당 책에서 읽었을 때 기억하면 좋을 것 같은 내용들을 쓰려고 합니다!!1. 추세선 그리기추세선은 데이터의 추이를 명확하게 파악하여 차트를 더 강력하게 만들어 줄 수 있습니다. 하지만, 잘못 사용한다면 차트의 데이터를 더 강력하게 잘못 이해하게 될 수도 있습니다. 즉, 추세선은 장기적으로 늘어나거나 줄어드는 형태를 보여주는 선입니다. 이를 정확하게 나타내려면 시계열 데이터 등 x축이 일정한 시간 단위로 만들어진 데이터를 사용..
[SQL] Programmers 문제 풀기(특정 기간동안 대여 가능한 자동차들의 대여비용 구하기)
·
Data Analyst/SQL
해당 문제는 Programmers에서 사용한 문제이며 모든 테이블의 자료와 출처는 Programmers임을 밝힙니다.해당 글에서는 WITH AS, JOIN, 서브쿼리를 이용하여 푸는 문제로 초보자가 하기에는 보통~어려움 정도의 난이도를 가지고 있는 것 같습니다.해당 문제 원본을 확인 하시려면 해당 사이트를 들어가시면 될 것 같습니다. 시작하겠습니다.CAR_RENTAL_COMPANY_CAR 테이블과 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블과 CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블에서 자동차 종류가 '세단' 또는 'SUV' 인 자동차 중 2022년 11월 1일부터 2022년 11월 30일까지 대여 가능하고 30일간의 대여 금액이 50만원 이상 200만원 ..
[SQL] Programmers 문제 풀기(주문량이 많은 아이스크림들 조회하기)
·
Data Analyst/SQL
해당 문제는 Programmers에서 사용한 문제이며 모든 테이블의 자료와 출처는 Programmers임을 밝힙니다.해당 글에서는 UNION, WITH AS, GROUP BY를 이용하여 푸는 문제로 초보자가 하기에는 쉬움 정도의 난이도를 가지고 있는 것 같습니다.해당 문제 원본을 확인 하시려면 해당 사이트를 들어가시면 될 것 같습니다. 시작하겠습니다.7월 아이스크림 총 주문량과 상반기의 아이스크림 총 주문량을 더한 값이 큰 순서대로 상위 3개의 맛을 조회하는 SQL 문을 작성해주세요.우선 제가 푼 방식은 가독성이 좋게 만든 것이지 좋은 코드는 아닌 듯 합니다. 그래서 좀 더 쉬운 코드도 있다고 말씀 드리고 싶습니다. 이 문제는 상반기 테이블과 7월 테이블이 있습니다. 해당 테이블들은 모두 같은 컬럼명을 ..
[책 리뷰] 데이터 분석가의 숫자유감 - 2
·
Data Analyst/BOOK
글 : 권정민만화: 주형구매 사이트 : 클릭!이 책은 확실히 저같이 아예 모르는 사람도 읽기 편하고 데이터를 직접 만져볼 때 무심코 지나갈만한 중요한 내용들 또한 찝어서 알려주는 책이였습니다.그리고 확실히 만화로 되어있어서 처음 접근하기 좋았고 재밌게 읽었던 것 같습니다. 이제 저는 해당 책에서 읽었을 때 기억하면 좋을 것 같은 내용들을 쓰려고 합니다!!1. 확률과 분포확률이란?시행 결과값의 평균을 0과 1사이로 나타낸 것을 '확률'이라고 합니다. 분포란?확률이 어떤 모습으로 퍼져 있는지를 나타내는 것을 '분포'라고 합니다. 큰 수의 법칙이란?표본의 크기가 충분히 크다면 그 때의 표본평균은 모평균에 충분히 가까워 지는 것을 말합니다. 즉, 확률은 지나간 사건의 결과를 보상해주지 않습니다. 동전 앞면이 세..
[SQL] Programmers 문제 풀기(년, 월, 성별 별 상품 구매 회원 수 구하기)
·
Data Analyst/SQL
해당 문제는 Programmers에서 사용한 문제이며 모든 테이블의 자료와 출처는 Programmers임을 밝힙니다.해당 글에서는 JOIN, DATE관련 함수, GROUP BY를 이용하여 푸는 문제로 초보자가 하기에는 쉬움 정도의 난이도를 가지고 있는 것 같습니다.해당 문제 원본을 확인 하시려면 해당 사이트를 들어가시면 될 것 같습니다. 시작하겠습니다.USER_INFO 테이블과 ONLINE_SALE 테이블에서 년, 월, 성별 별로 상품을 구매한 회원수를 집계하는 SQL문을 작성해주세요. 결과는 년, 월, 성별을 기준으로 오름차순 정렬해주세요. 이때, 성별 정보가 없는 경우 결과에서 제외해주세요.이 문제는 간단하게 년, 월, 성별 별로 구매한 회원 수를 구하면 되는 매우 간단한 문제입니다.  그래도 해당 ..
[SQL] Programmers 문제 풀기(업그레이드 할 수 없는 아이템 구하기)
·
Data Analyst/SQL
해당 문제는 Programmers에서 사용한 문제이며 모든 테이블의 자료와 출처는 Programmers임을 밝힙니다.해당 글에서는 JOIN 이용하여 푸는 문제로 초보자가 하기에는 쉬움 정도의 난이도를 가지고 있는 것 같습니다.해당 문제 원본을 확인 하시려면 해당 사이트를 들어가시면 될 것 같습니다. 시작하겠습니다.더 이상 업그레이드할 수 없는 아이템의 아이템 ID(ITEM_ID), 아이템 명(ITEM_NAME), 아이템의 희귀도(RARITY)를 출력하는 SQL 문을 작성해 주세요. 이때 결과는 아이템 ID를 기준으로 내림차순 정렬해 주세요.이 문제는 테이블을 보고 판단하기에는 살짝 헷갈릴 수도 있으나, 잘 이해한다면 쉽게 풀 수 있습니다. 우선 저희가 ITEM_ID 0번을 보고 있다고 가정하겠습니다. 이..
[책 리뷰] 데이터 분석가의 숫자유감 - 1
·
Data Analyst/BOOK
글 : 권정민만화: 주형구매 사이트 : 클릭!데이터 분석가에게 필요한 데이터를 읽는 시야는 매우 중요합니다. 저는 데이터를 거의 처음 접하다 보니 읽는 독해력이 매우 없었습니다. 그래서 데이터 왕초보도 쉽고 빠르게 읽을 수 있는 책이 찾다가 해당 책을 찾게 되었습니다. 우선 작가님께서는 실제로 데이터 분석가이기도 해서 해당 책을 고르기도 하였고 통계 관련해서도 간단히라도 써져있어서 구매한 책입니다. 이 책은 확실히 저같이 아예 모르는 사람도 읽기 편하고 데이터를 직접 만져볼 때 무심코 지나갈만한 중요한 내용들 또한 찝어서 알려주는 책이였습니다.그리고 확실히 만화로 되어있어서 처음 접근하기 좋았고 재밌게 읽었던 것 같습니다. 이제 저는 해당 책에서 읽었을 때 기억하면 좋을 것 같은 내용들을 쓰려고 합니다!..
[SQL] Programmers 문제 풀기(연간 평가점수에 해당하는 평가 등급 및 성과금 조회하기)
·
Data Analyst/SQL
해당 문제는 Programmers에서 사용한 문제이며 모든 테이블의 자료와 출처는 Programmers임을 밝힙니다.해당 글에서는 CASE와 GROUP BY를 이용하여 푸는 문제로 초보자가 하기에는 보통 정도의 난이도를 가지고 있는 것 같습니다.해당 문제 원본을 확인 하시려면 해당 사이트를 들어가시면 될 것 같습니다. 시작하겠습니다.HR_DEPARTMENT, HR_EMPLOYEES, HR_GRADE 테이블을 이용해 사원별 성과금 정보를 조회하려합니다. 평가 점수별 등급과 등급에 따른 성과금 정보가 아래와 같을 때, 사번, 성명, 평가 등급, 성과금을 조회하는 SQL문을 작성해주세요.평가등급의 컬럼명은 GRADE로, 성과금의 컬럼명은 BONUS로 해주세요.결과는 사번 기준으로 오름차순 정렬해주세요.이 문제..
[기초 통계] 조건부 확률
·
Data Analyst/기초 통계
1. 조건부 확률이란?한 사건이 다른 사건의 발생에 의존적인 경우입니다." | "는 해당 기호 뒤에 위치한 사건이 발생했을 때(조건)라는 의미입니다.ex) 지각할 확률 P(A) = 5%      조건: 타이어가 펑크(F) 났을 때 지각할 확률은 100%이다.       P(A|F) = 100 %2. 독립이란?하나의 사건이 다른 사건에 영향을 미치지 않는 경우를 말합니다.이 때, 사건들이 독립이라면 두 사건의 확률을 곱할 수 있습니다.ex) 동전이 앞면, 스페이드를 뽑을 확률       P(H, S) = P(H) * P(S) = 1/2 * 1/4 = 1/8 -> 12.5%이다.3. 예시를 통한 실습1. 그럼 만약 A, J가 동시에 지각할 확률을 계산할 경우는 어떻게 될 것인지 확인해보겠습니다.서로 독립이므..
hmm06
'Data Analyst' 카테고리의 글 목록 (2 Page)