라면 파는 코너에 양은냄비 왜?

2007. 4. 26. 11:44사는게 뭐길래/Data & Intelligence


오늘 재미있는 기사가 하나 났군요.

"라면 파는 코너에 양은냄비 왜?"
(한국경제, 기사보기)

바로, 저희 회사(넷스루)에서 제공하는 기술과 맞닿아 있는 분야이며, 현재 제가 소속된 파트에서 개발중인 추천 솔루션의 핵심을 이루는 기반 기술 중 하나이기도 합니다.

라면-양은냄비 처럼 함께 묶여서 판매되는 구매 연관성(Association)이 있거나, 혹은 둘 사이에 어떤 유사성(Similarity)이 있는 상품들을 흔히 연관상품이라고 말하며, 상품 추천을 위한 좋은 단서를 제공합니다.

SLR 카메라 + 렌즈 + 메모리

굳이 분석을 하고 자시고 할 것 없이, SLR 카메라를 사는 사람들에게 있어서 렌즈나 메모리는 항상 붙어 다니는 악세서리 상품이나 마찬가지입니다.
카메라를 전문으로 취급하는 쇼핑몰에 가 보면, 그 곳에서는 카메라만 파는 것이 아니라 각종 주변 기기나 카메라 관련 도서까지 취급하는 것을 볼 수 있습니다.

간단히 예를 들어서, 니콘 카메라에 대한 제품 상세정보 페이지에서 해당 기종과 악세서리 관계가 있는 렌즈나 메모리를 함께 제시한다면 간단하면서도 꽤 쓸모 있는 추천 서비스를 제공할 수 있습니다. (우리가 흔히 볼 수 있는 패키지형의 묶음 판매도 이와 같은 맥락입니다.)
 
www.79house.net 이라는 카메라 전문 쇼핑 사이트에서 다음과 같이 추천 관련된 예가 적용된 것을 볼 수 있습니다.

사용자 삽입 이미지

악세서리에 해당하는 각종 주변 기기나 소모품을 상품과 함께 선택할 수 있습니다. 간단한 접근이지만, 꽤 효과가 있을 것 같죠?



사용자 삽입 이미지

카메라와 렌즈를 묶음으로 판매합니다. 메인 상품(카메라) + 악세서리 상품 (렌즈)



여기에 약간의 손질을 해서, 해당 카메라 모델을 사는 사람들이 가장 많이 사는 악세서리 상품을 우선적으로 노출시킨다면 좀 더 깔끔한 서비스가 가능하겠지요.

보다 과학적인 분석이나 통계 과정을 거쳐서 보다 적중율이 높거나, 보다 구매 가능성이 높은 연관상품을 제시한다면 좀 더 높은 효과를 기대할 수 있을 것입니다.
조금 덜 과학적이고 조금 덜 정확한 방식일지는 모르지만, 어쨌든 위에 예로 든 사이트에서는 이미 핵심적인 추천 서비스를 제공한다고 볼 수 있습니다.

그리고, 카메라+렌즈+메모리와 같은 악세서리 관계는 별다른 통계나 과학적인 분석 없이도 직관적으로 접근할 수 있는 예라 볼 수 있으며, 소규모 쇼핑 사이트의 경우라면 그냥 판매 추이를 한 번 훑어보기만 해도 함께 팔리는 경향이 높은 상품들을 파악할 수 있을 것입니다.

기저귀와 맥주

연관 상품의 예로 아주 많이 거론되는 것이 바로 기저귀와 맥주입니다.
상품 자체로 보면 연관성이 보이지 않지만, 실제로 판매된 내용을 분석해 보았더니 예상 외로 기저귀와 맥주를 함께 사는 경우가 많다는 것입니다. (미국에서 추출된 적이 있는 실제 예입니다.)

카메라+렌즈+메모리 처럼 서로간에 악세서리 관계도 없고 직관적으로 예측 가능한 조합도 아니기 때문에, 이러한 연관 상품들을 알아내기 위해서는 실제 판매 내역을 가지고 통계를 내 보아야만 알 수 있습니다.

이와 같이 고객들의 상품 이용이나 구매 내역 데이터를 기반으로 연관된 상품을 뽑아내기 위해서는 보다 전문적인 통계 및 처리 기법이 필요합니다.
또한 이용 고객의 수가 많고, 상품 수도 많으며, 실제로 구매가 활발하게 일어날 때 쓸만한 연관성을 찾을 수 있겠지요.

그리고, 직관적으로 예측할 수 있는 뻔한 결과보다는 미처 예측하지 못했던 연관상품을 찾는 것이 보다 가치가 있을 것이며, 그 상품들의 구매가 어느정도는 발생하는 것이어야 판매 효과로 연결될 것이며, 어쩌다 한 두번 그런 연관 패턴이 발생하는 것이 아니라 어느정도는 빈번하게 그런 연관 패턴이 나타나는 것이라야 신뢰성이 있을 것입니다.

다음은  인터넷 서점 YES24(www.yes24.co.kr)에서 볼 수 있는 연관상품 추천의 예입니다.

사용자 삽입 이미지

상품 상세정보 페이지입니다. 오른쪽 영역에 '이 책을 구매한 회원들이 산 책들'이라는 추천 영역이 있습니다.



문제는!

이러한 연관성을 가지는 상품을 자동으로 찾아내는 방법이 그리 간단치 않다는 것입니다.

혹시 쇼핑몰을 운영하시는 분들이라면 고객들의 구매 내역을 가지고 이러한 정보를 산출해 보시기 바랍니다. 구매량이 적은 소규모 사이트라면 어느정도 찾아내는 것이 가능하겠지만, 구매량이 많으면 많을수록 처리 시간이 기하급수적으로 증가할뿐만 아니라, 설사 연관된 상품 목록을 찾아낸다고 해도 그 중에서 쓸만한 놈들이 어떤 것들인지를 가려내는 문제로 또 한 번 머리를 써야 합니다.

아마도... '연관성'이라는 것을 어떻게 기계적으로 정의할 것인가의 문제에 맨 처음 부딪치게 될 것이고, 그 다음에는 엄청난 처리 시간과 계산량에 짓눌릴 것이고, 또 그 다음에는 도대체 이렇게 나온 데이터가 맞긴 맞는 것인지로 고민을 하게 될 것입니다.

참고로, 저희 회사에서 접근하는 방식은 데이터 마이닝 기법입니다.
90년대 후반부터 널리 알려진 연관규칙(Association Rule) 및 순차패턴(Sequential Pattern) 분석 방법을 이용하여, 대용량 구매내역 데이터로부터 서로 구매 연관성이 있는 것들을 구매 빈도와 연관성 정도를 고려해서 추출하는 기법입니다.
(넷스루, 와이즈마이너 - WiseMiner)

지금은 기법 자체 보다는 해당 기법을 보다 쉽게 사용하고, 실질적으로 웹 사이트에서 실현 가능한 추천 방법과 시나리오를 편리하게 구성할 수 있는 종합적인 개인화 추천 솔루션을 구성하는 데에 주력하고 있습니다.

널리 알려진 기법이지만 실제 서비스에서 적용하기 위해서는 비용과 노력이 만만찮고 실제 서비스 적용 단계에서는 연관성 추출 기법 보다는 서비스 시나리오를 구현하고 관리하는 노력이 너무 많이 들기 때문에 몇몇 대형 서비스에서만 제한적으로 활용하고 있는 실정이기 때문입니다.