본문 바로가기
Data Science/SQL

[SQL로 맛보는 데이터 전처리 분석] 자동차 매출 데이터를 이용한 지표 추출(실습) - 3

by 루크 Luke 2022. 7. 14.
반응형

데이터셋

- MySQL에서 제공하는 샘플 데이터셋을 활용함

https://www.mysqltutorial.org/mysql-sample-database.aspx

 

MySQL Sample Database

This page provides you with a MySQL sample database that helps you to practice with MySQL effectively and quickly. You can download the sample database and load it into your MySQL Server.

www.mysqltutorial.org

- 지난 포스팅에 이어서 실습 진행함 (아래 링크를 통해 실습 2로 이동할 수 있다)

 

[SQL로 맛보는 데이터 전처리 분석] 자동차 매출 데이터를 이용한 지표 추출(실습) - 2

데이터셋 - MySQL에서 제공하는 샘플 데이터셋을 활용함 - https://www.mysqltutorial.org/mysql-sample-database.aspx MySQL Sample Database This page provides you with a MySQL sample database that helps..

go-for-data.tistory.com

 

3) 베스트셀러 상품 찾기

- USA에서 구매된 상품 중 매출이 가장 높은 Top 5 상품을 찾음

- 일단 주문 테이블에 상품명이 없기 때문에, 상품 테이블을 조인해서 상품명을 추가함

상품 테이블을 조인하여 상품명이 추가되었음

- 고객 정보가 없으므로, 일단 고객 번호를 주문 테이블과 조인하여 추가함

고객 테이블을 곧바로 붙일 수는 없기 때문에, 주문 테이블에서 일단 고객 번호를 가져왔음

- 고객 테이블을 마지막으로 조인해서 국가 정보를 붙임

국가 정보를 추가한 것을 알 수 있음

- 국가가 USA인 레코드만 불러와서 GROUP BY를 통해 상품별 매출을 파악하고, ORDER 기준 상위 5개 LIMIT

USA 상품 중 매출 상위 5개 정보 확인

 

4) Churn Rate (%)

- Churn 이란, 마지막 구매/접속일이 현재 시점 기준으로 3개월 이상 지난 고객을 의미함

- 따라서, 총 고객 중에 Churn에 해당하는 고객 비율이 얼마나 되는지를 구하는 것 -> 이탈이 얼마나 됐는지를 보는 지표

- 2005-06-01을 현재 시점으로 가정하고, 그때부터 90일 지난 고객을 CHURN으로 계산

고객별 마지막 주문일, 현재, 차이일수, CHURN 여부를 표현함

- CHURN, NON-CHURN의 숫자를 파악

서브쿼리를 활용해서, GROUP BY CHURN을 수행

- CHURN을 만드는 테이블을 따로 정의해서, RATE 지표를 뽑아낼 수 있도록 함

 

반응형

댓글