클러스터링(K-means
clustering)
회귀분석을 통해
매출에 가장 영향력 많이 미치는 변수 3개로 K 평균(K-means method) 클러터링 기법으로 클러터링을 실시한다. K 평균
기법은 R, SAS, SPSS등 데이터 마이닝 통계 패키지를 통해서 실시할 수 있다.
1차 클러스터링 예제 – 점포 정보만 사용
클러스터링 속성 |
클러스터1 |
클러스터2 |
클러스터3 |
점포크기, 유무, 상권 |
주차장을 가지고 있으며, SKU수가 많은 점포, 도시농촌 상권 |
주차장이 없으며, 점포가 크고 아파트 상권, 하지만, SKU 판매 효율은 낮음 |
주차장이 없으며, 점포가 작고, 도심 역세권, SKU 효율이 높음 |
위와 같이 3개의 클러스터링을 도출하였다. 위의 결과는 한번에 나오는 것이 아니라, 몇 번에 걸쳐 변수 투입
및 삭제를 통해서 좋은(적당한) 클러스터의 개수를 찾게 된다. MD 및 점포실무자 등 다양한 관련부서와 협업하여, 클러스터링이
적절한 지 수 차례의 클러스터링 프로세스를 통해서 발견 하는 것이 좋다.
1차 점포정보를 활용한 클러스터링이 끝나고 나면, 2차 고객정보를 활용한
클러스터링을 하게 된다. 2차 클러스터링이 중요 한 이유는 점포중심으로 그룹을 나눈 후 실제 점포를
이용하는 고객을 가지고 한번 더 세분화 하는데 있다. 여기에서는 고객정보 관련하여 4개의 변수를 사용하한다.
2차 클러스터링 예제 – 고객정보 사용
클러스터링 속성 |
클러스터1 |
클러스터2 |
연령, 평균 구매액, 자녀
수, 평균 구매 횟수 |
연령대가 높고, 구매액이나 횟수가 많음 |
연령대가 낮고, 구매횟수가 낮음 |
2차 클러스터링은 위와 같다.
1차에서 3개의 클러스터, 2차의 3개의 클러스터가 도출 되었다.
3 X
2 = 총 6개의
클러스터가 도출 된다.
하이어라키 형태로 나타내면, 아래와 같다.
6개의 클러스터가 생성이 되면, 아래와
같이 표로 나누어서 클러스터별 특성을 자세히 기록한다. 여기에 기록 된 클러스터의 특성에 비추어 향후
점포별 전략을 작성 하게 된다.
클러스터를 매출, 고객, 점포정보 속성 별로 나눈 예
'Store Clustering' 카테고리의 다른 글
[점포 클러스터링] #7 클러스터링 후 유의해야 할 점 (0) | 2011.08.18 |
---|---|
[점포 클러스터링] #6 클러스터링 시 사용 되는 데이터 소스 (0) | 2011.08.18 |
[점포 클러스터링] #4 변수의 발견과 결정 (0) | 2011.08.08 |
[점포 클러스터링] #3 클러스터링의 유익(장점) (0) | 2011.08.08 |
[점포 클러스터링] #2 클러스터링의 목적은 무엇인가? (0) | 2011.08.04 |