반응형
데이터셋
- MySQL에서 제공하는 샘플 데이터셋을 활용함
- https://www.mysqltutorial.org/mysql-sample-database.aspx
- 지난 포스팅에 이어서 실습 진행함 (아래 링크를 통해 실습 2로 이동할 수 있다)
3) 베스트셀러 상품 찾기
- USA에서 구매된 상품 중 매출이 가장 높은 Top 5 상품을 찾음
- 일단 주문 테이블에 상품명이 없기 때문에, 상품 테이블을 조인해서 상품명을 추가함
- 고객 정보가 없으므로, 일단 고객 번호를 주문 테이블과 조인하여 추가함
- 고객 테이블을 마지막으로 조인해서 국가 정보를 붙임
- 국가가 USA인 레코드만 불러와서 GROUP BY를 통해 상품별 매출을 파악하고, ORDER 기준 상위 5개 LIMIT
4) Churn Rate (%)
- Churn 이란, 마지막 구매/접속일이 현재 시점 기준으로 3개월 이상 지난 고객을 의미함
- 따라서, 총 고객 중에 Churn에 해당하는 고객 비율이 얼마나 되는지를 구하는 것 -> 이탈이 얼마나 됐는지를 보는 지표
- 2005-06-01을 현재 시점으로 가정하고, 그때부터 90일 지난 고객을 CHURN으로 계산
- CHURN, NON-CHURN의 숫자를 파악
- CHURN을 만드는 테이블을 따로 정의해서, RATE 지표를 뽑아낼 수 있도록 함
반응형
'Data Science > SQL' 카테고리의 다른 글
[SQL로 맛보는 데이터 전처리 분석] 상품 리뷰데이터를 이용한 리포트 작성(실습) - 1 (0) | 2022.07.22 |
---|---|
[SQL로 맛보는 데이터 전처리 분석] 자동차 매출 데이터를 이용한 지표 추출(실습) - 2 (0) | 2022.07.12 |
[SQL로 맛보는 데이터 전처리 분석] 자동차 매출 데이터를 이용한 지표 추출(실습) - 1 (0) | 2022.07.11 |
[SQL로 맛보는 데이터 전처리 분석] 기본 문법 정리 - 2 (0) | 2022.07.07 |
[SQL로 맛보는 데이터 전처리 분석] 기본 문법 정리 - 1 (0) | 2022.07.06 |
댓글