로그 분석을 통해 검색을 더 똑똑하게 만들 수 있는 방법 (스터디 자료 소개)

2011. 10. 7. 15:38사는게 뭐길래/Data & Intelligence


SIGIR 2011(Beijing)에서 발표된 튜토리얼 중에 검색 로그 분석을 통해 검색을 더 똑똑하게 만드는 방법들에 대한 좋은 내용이 있네요.

 "Enhancing Web Search by Mining Search and Browse Logs"
- by Daxin Jiang, Jian Pei, Hang Li
- SIGIR 2011(Beijing, July 2011)
(PDF version)


링크된 PDF  문서는 파워포인트 발표자료인데, 비교적 설명이 잘 돼 있습니다.
(원본 강의를 들을 수 있으면 더 좋겠는데... 쩝!)
그리고, 주요 인용 기술에 대해서는 슬라이드에 참고문헌을 잘 명시해 놓았기 때문에 좀 더 자세하게 공부하는데도 도움이 될 듯 합니다.

....

전반적인 내용은 사용자들의 검색 기록(Log)를 분석하여 검색 성능을 높이는 방법들을 다루고 있습니다.
즉, 검색어와 문서간의 매칭 정확도 향상이나 검색속도 향상을 위한 기술이 아니라
사용자들이 실제 사용한 검색 내역과 클릭 결과를 분석하여 검색 정확도를 향상시키는 방법입니다.

개인화 추천에서 널리 쓰이는 Collaborative Approach 및 User Profiling 방법과 유사한 부분이 많기 때문에, 개인화 추천 기술에 관심이 있는 분들께도 좋은 자료가 될 것 같습니다.

웹로그 분석, 데이터 마이닝, 개인화 추천 기술 등을 통해 검색을 더 똑똑하게 만들기 위한 연구는 상당히 오래전부터 진행되어 왔기 때문에 연구 내용이 비교적 풍부한 편이고 실제로 적용할만한 수준의 기술들이 어느정도 완성되었다고 생각되네요.

연구 분야를 크게 분류하면 1) 검색어를 추천하는 방법과 2) 검색 결과를 추천하는 방법입니다.
검색어 추천은 네이버나 다음에서 보여주는 관련검색어/연관검색어와 같은 것이고
검색 결과를 추천한다는 말은 특정 검색어로 검색했을 때, 그 결과 목록의 순서(Ranking)을 조정하거나 검색어-문서 매칭 결과 외에 다른 방법으로 검색 결과를 제공하는 것을 말합니다.
그리고, 이러한 기능을  제공함에 있어서 검색어-문서 사이의 매칭정도가 아니라 사용자들의 실제 검색 내역을 분석한다는 것이 이 분야 연구의 골자입니다.

....

작심하고 공부하실분들은 아래의 Survey 논문을 참고하시는 것도 좋을 듯 합니다.

 "Mining Query Logs: Turning Search Usage Data into Knowledge"
- by Fabrizio Silvestri
- Foundations and Trends in Information Retrieval 4(1-2): 1-174 (2010)
(PDF Version)

열공합시다!