본문 바로가기

Store Clustering

[점포 클러스터링] #5 클러스터링(K-means method)

 

클러스터링(K-means clustering)

회귀분석을 통해 매출에 가장 영향력 많이 미치는 변수 3개로 K 평균(K-means method) 클러터링 기법으로 클러터링을 실시한다. K 평균 기법은 R, SAS, SPSS등 데이터 마이닝 통계 패키지를 통해서 실시할 수 있다.

 

1차 클러스터링 예제 점포 정보만 사용

클러스터링 속성

클러스터1

클러스터2

클러스터3

점포크기, 유무, 상권

주차장을 가지고 있으며, SKU수가 많은 점포, 도시농촌 상권

주차장이 없으며, 점포가 크고 아파트 상권, 하지만, SKU 판매 효율은 낮음

주차장이 없으며, 점포가 작고, 도심 역세권, SKU 효율이 높음

 

위와 같이 3개의 클러스터링을 도출하였다. 위의 결과는 한번에 나오는 것이 아니라, 몇 번에 걸쳐 변수 투입 및 삭제를 통해서 좋은(적당한) 클러스터의 개수를 찾게 된다. MD 및 점포실무자 등 다양한 관련부서와 협업하여, 클러스터링이 적절한 지 수 차례의 클러스터링 프로세스를 통해서 발견 하는 것이 좋다.

 

1차 점포정보를 활용한 클러스터링이 끝나고 나면, 2차 고객정보를 활용한 클러스터링을 하게 된다. 2차 클러스터링이 중요 한 이유는 점포중심으로 그룹을 나눈 후 실제 점포를 이용하는 고객을 가지고 한번 더 세분화 하는데 있다. 여기에서는 고객정보 관련하여 4개의 변수를 사용하한다.

 

2차 클러스터링 예제 고객정보 사용

클러스터링 속성

클러스터1

클러스터2

연령, 평균 구매액, 자녀 수, 평균 구매 횟수

연령대가 높고, 구매액이나 횟수가 많음

연령대가 낮고, 구매횟수가 낮음

 

2차 클러스터링은 위와 같다.

 

1차에서 3개의 클러스터, 2차의 3개의 클러스터가 도출 되었다.

3 X 2 = 6개의 클러스터가 도출 된다.

 

하이어라키 형태로 나타내면, 아래와 같다.

 

6개의 클러스터가 생성이 되면, 아래와 같이 표로 나누어서 클러스터별 특성을 자세히 기록한다. 여기에 기록 된 클러스터의 특성에 비추어 향후 점포별 전략을 작성 하게 된다.

 

클러스터를 매출, 고객, 점포정보 속성 별로 나눈 예

소스: ECR 2011 Baltic. 발표자료 중