[AARRR] AARRR 개요
·
Product Analysis/AARRR
회사가 성장하려면 핵심 지표를 찾고, 그 지표를 성장시키는 방법을 찾아야 합니다. 그럼 서비스의 지표를 어떤 식으로 측정하고 관리할 수 있을까?1. 과업 기반(Task-based)의 지표 관리- 각 조직별로 담당하는 업무를 우선 정의한 후 해당 업무를 통해 발생하는 수치들을 지표화해서 관리하는 것을 의미합니다.-  예를 들어 마케팅팀이 하는 업무, 운영팀이 하는 업무, 개발팀이 하는 업무, 사업팀이 하는 업무들 처럼 팀별로 담당하는 과업에 따라 지표를 선별하고 모니터링하는 방식으로 지표를 관리합니다. - 하지만, 이러한 과업 기반의 지표 관리의 문제점이 있습니다. 전체적으로 서비스 관점에서 무엇이 중요한 지표인지 판단하기가 어렵다는 점입니다.- 위의 내용 처럼 전체적인 관점에서 판단하기 어려우며 각 부서..
[zero-base] 이커머스 고객 Segmentation을 위한 RFM 분석 - 2
·
Project/data analysis
🔊Process03RFM 활용 서비스 이용 수준 측정 3.1 Scailing Data# ▶ Min max scale = 최대값을 1, 최소값을 0으로 표준화하는 기법from sklearn.preprocessing import minmax_scale# ▶ 최근성은 숫자가 작을수록, 즉 최근 구매일이 얼마 지나지 않은 고객이 더 점수가 높음 그래서 1을 빼주었음.rfm['Recency'] = minmax_scale(rfm['Recency'], axis=0, copy=True)rfm['Recency'] = 1-rfm['Recency']rfm['Frequency'] = minmax_scale(rfm['Frequency'], axis=0, copy=True)rfm['Monetary'] = minmax_scale..
[zero-base] 이커머스 고객 Segmentation을 위한 RFM 분석 - 1
·
Project/data analysis
RFM 분석하는 이유는?고객별 RFM 3가지 지표들을 통해서 고객 점수 부여 및 등급화에 따른 서비스 등급을 부여합니다. 그리고 월마다 중요한 그룹에 대한 비중이 떨어지고 있는지 올라가고 있는지 확인 하는 것이 RFM 분석입니다.즉, RFM 분석을 하게 되면 어떤 그룹에 타겟팅하여 마케팅할 지 정할 수 있게 됩니다.1. 문제 정의런칭 이후 서비스 정체기로 인한 영업이익, 사용 고객 수 감소2. 해결방안구매 데이터 활용 서비스 이용 현황 파악(지표 기획)3. 기대 효과정체 원인 파악 및 대응책 수립 및 실행을 통한 영업이익, 사용 고객 수 증가🔈Process011. Data 전처리1.1 Null값 확인# ▶ Null 값 확인print(df.isnull().sum())코드 결과를 보니 두 개의 컬럼 값에서..
Project - Instacart 데이터 물품 재구매 예측하기(ML)
·
Project/Machine Learning
1. Feature 생성기존 Feature 3개(user_id, product_id, reordered)에 더해 총 20개의 Feature를 새로 만든 후 해당 Feature들을 활용하여 재구매 예측 모델을 만들어 보았습니다.uxp_times_bought : user_id 와 product_id를 기준으로 사용자가 해당 제품을 몇 번 주문했는지 나타냅니다.uxp_reorder_ratio : 사용자가 특정 제품을 처음 구매한 이후 해당 제품을 얼마나 자주 재구매 했는지 계산한 비율입니다.uxp_last_five : 최근 5회 주문에서 사용자별 특정 제품의 구매 횟수입니다. uxp_ratio_last_five : 최근 5회 주문 중 제품 구매 비율(uxp_ratio_last_five)을 계산하여 해당 제품..
Project - Instacart 데이터 물품 재구매 예측하기(RFM)
·
Project/Machine Learning
1. RFM이란?Recency : 고객별로 얼마나 최근에 구매했는지Frequency : 고객별로 얼마나 자주 구매했는지Montary : 고객별로 얼마나 많은 금액을 지출했는지위의 3가지 조건을 합쳐서 RFM이라 하며, 고객의 분포를 확인하여 그룹(등급)을 나누어 분류하는 기법입니다. 저희는 위의 3가지 조건에 맞는 값들을 찾아내고 계산하여 등급을 나누어 주었습니다.하지만 저희는 Montary를 계산 하기 위한 가격이 존재하지 않았습니다. 그래서 저희는 고객이 주문한 전체 상품 수로 대체하여 계산해주었습니다.2. KMeans를 사용하여 점수 기반으로 등급 나누기우선 KMeans를 몇 개로 나눌 것인지에 대해 실루엣 계수를 사용하여 최적의 클러스터 수를 선택해보았습니다.그 결과, 4개로 나누는 것이 제일 높..
Project - Instacart 데이터 물품 재구매 예측하기
·
Project/Machine Learning
1. 프로젝트 시작...팀원들과 프로젝트 주제 설정을 하기로 하여 각각 팀원들의 관심 분야를 알아보게 되었습니다.그래서 공통적인 관심분야는 이커머스로 확인되어 이커머스 관련 프로젝트를 해보게 되었습니다. 그래서 저희는 캐글에 올라온 Instacart 장바구니 분석 데이터셋을 이용하여 재구매 여부 판단하는 프로젝트를 하기로 주제를 잡았습니다. 그리고 해당 데이터 셋에서는 가격에 대한 데이터가 따로 없어서 고객생애가치 확인 해보려 하였으나 하지 못하였습니다.하지만, 해당 데이터 셋을 통해 고객 등급을 RFM을 통해 나누는 작업을 해보자는 의견이 나왔었습니다. 머신러닝 모델은 RFM을 통해 고객 등급을 나눌 때 KMeans를 사용하여 등급을 분류하는 것이였고 두 번째로 재구매 예측을 위해 XGBoost나 Cl..
[SQL] HackerRank 문제 풀기 (Weather Observation Station 15)
·
Data Analyst/SQL
해당 문제는 HackerRank에서 사용한 문제이며 모든 테이블의 자료와 출처는 Hackerank임을 밝힙니다.해당 글에서는 서브쿼리를 사용하여 푸는 문제로 난이도가 매우 낮은 문제입니다.해당 문제 원본을 확인 하시려면 해당 사이트를 들어가시면 될 것 같습니다. 시작하겠습니다Query the Western Longitude (LONG_W) for the largest Northern Latitude (LAT_N) in STATION that is less than 137.2345. Round your answer to 4 decimal places.STATION 테이블에서 북위(LAT_N)가 137.2345보다 작은 값 중 가장 큰 북위(LAT_N)에 해당하는 서경(LONG_W)을 조회하세요. 결과는 소..
[SQL] Programmers 문제 풀기(자동차 대여 기록 별 대여 금액 구하기)
·
Data Analyst/SQL
해당 문제는 Programmers에서 사용한 문제이며 모든 테이블의 자료와 출처는 Programmers임을 밝힙니다.해당 글에서는 WITH, CASE, GROUP BY, JOIN을 이용하여 푸는 문제로 초보자가 하기에는 보통~어려움 정도의 난이도를 가지고 있는 것 같습니다.해당 문제 원본을 확인 하시려면 해당 사이트를 들어가시면 될 것 같습니다. 시작하겠습니다.CAR_RENTAL_COMPANY_CAR 테이블과 CAR_RENTAL_COMPANY_RENTAL_HISTORY 테이블과 CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블에서 자동차 종류가 '트럭'인 자동차의 대여 기록에 대해서 대여 기록 별로 대여 금액(컬럼명: FEE)을 구하여 대여 기록 ID와 대여 금액 리스트를 출력하는 SQL..
[SQL] Programmers 문제 풀기(5월 식품들의 총매출 조회하기)
·
Data Analyst/SQL
해당 문제는 Programmers에서 사용한 문제이며 모든 테이블의 자료와 출처는 Programmers임을 밝힙니다.해당 글에서는 CONCAT, MID을 이용하여 푸는 문제로 초보자가 하기에는 쉬움 정도의 난이도를 가지고 있는 것 같습니다.해당 문제 원본을 확인 하시려면 해당 사이트를 들어가시면 될 것 같습니다. 시작하겠습니다.USED_GOODS_BOARD와 USED_GOODS_USER 테이블에서 중고 거래 게시물을 3건 이상 등록한 사용자의 사용자 ID, 닉네임, 전체주소, 전화번호를 조회하는 SQL문을 작성해주세요. 이때, 전체 주소는 시, 도로명 주소, 상세 주소가 함께 출력되도록 해주시고, 전화번호의 경우 xxx-xxxx-xxxx 같은 형태로 하이픈 문자열(-)을 삽입하여 출력해주세요. 결과는 회..
[SQL] Programmers 문제 풀기(5월 식품들의 총매출 조회하기)
·
Data Analyst/SQL
해당 문제는 Programmers에서 사용한 문제이며 모든 테이블의 자료와 출처는 Programmers임을 밝힙니다.해당 글에서는 WITH, GROUP BY, JOIN을 이용하여 푸는 문제로 초보자가 하기에는 보통 정도의 난이도를 가지고 있는 것 같습니다.해당 문제 원본을 확인 하시려면 해당 사이트를 들어가시면 될 것 같습니다. 시작하겠습니다.FOOD_PRODUCT와 FOOD_ORDER 테이블에서 생산일자가 2022년 5월인 식품들의 식품 ID, 식품 이름, 총매출을 조회하는 SQL문을 작성해주세요. 이때 결과는 총매출을 기준으로 내림차순 정렬해주시고 총매출이 같다면 식품 ID를 기준으로 오름차순 정렬해주세요.해당 문제는 매우 간단합니다. 2022년 5월의 판매한 식품 별로 묶은 후 몇 개 팔렸는지 구한..
hmm06
'티스토리챌린지' 태그의 글 목록