본문 바로가기
Data Science/SQL

[SQL로 맛보는 데이터 전처리 분석] 자동차 매출 데이터를 이용한 지표 추출(실습) - 2

by 루크 Luke 2022. 7. 12.
반응형

데이터셋

- MySQL에서 제공하는 샘플 데이터셋을 활용함

https://www.mysqltutorial.org/mysql-sample-database.aspx

 

MySQL Sample Database

This page provides you with a MySQL sample database that helps you to practice with MySQL effectively and quickly. You can download the sample database and load it into your MySQL Server.

www.mysqltutorial.org

- 지난 포스팅에 이어서 실습 진행함 (아래 링크를 통해 실습 1로 이동할 수 있다)

 

[SQL로 맛보는 데이터 전처리 분석] 자동차 매출 데이터를 이용한 지표 추출(실습) - 1

데이터셋 - MySQL에서 제공하는 샘플 데이터셋을 활용함 - https://www.mysqltutorial.org/mysql-sample-database.aspx MySQL Sample Database This page provides you with a MySQL sample database that helps y..

go-for-data.tistory.com

 

2) 재구매율

- 연도별로 재구매율을 구할 수 있음

- 재구매율은 특정 기간 1 구매자 중 특정 기간 2에 연달아 구매한 구매자의 비중을 의미함

- 일단 고객번호를 기준으로 SELF JOIN함 : 이 때 다음 해에 구매한 경우로 셋팅함

다음 해에 다시 구매한 주문 기록 셋팅

- 재구매율은 두번째 customerNumber의 갯수를 첫번째 customerNumber의 갯수로 나누면 됨

- 첫번째 구매한 건들은 모두 기록되고,

- LEFT JOIN으로 다음 해 구매 건을 연결했기 때문에, 없을 수도(NULL) 있을 수도 (DATE VALUE) 있음 

- 국가별 Retention Rate를 구한다면, 국가만 추가해주면 됨

국가를 추가해서 재구매율을 계산한 결과

반응형

댓글