개인화 추천 관련기술 (Technology Map)

2011. 2. 14. 19:36사는게 뭐길래/Data & Intelligence

Anand Rajaraman과 Jeffrey Ullman이 스탠포드 대학에서 "Web Mining"이라는 과목의 수업교재로 사용하는 "Mining of Massive Datasets"라는 교재의 제9장(Chapter 9) "Recommendation Systems"에 소개된 개인화 추천 시스템과 관련된 기술들의 관계입니다.


개인화 추천 기술 분류
  • Content-Based Recommendation
    • Item Profiling
      • Discovering Features
        • TF.IDF (Term Frequency - Inverse Document Frequency)
      • Distance/Similarity (Chap. 3, "Finding Similar Items" 참조)
        • Measures
          • Jaccard, Cosine, ... 
        • Algorithms for Massive Datasets
          • Minhashing, LSH 
    • User Profiling
    • Classification & Decision Tree
  • Collaborative Filtering
    • Distance/Similarity (위와 같음)
    • Clustering Users and Items (Chap. 7, "Clustering" 참조)
  • Dimensionality Reduction 
    • SVD (Singular-Value Decomposition)
      • UV-Decomposition

해당 교재는 아직 오프라인 인쇄본으로는 판매되지 않고 있으나, 온라인에서 무료로 다운로드 받을 수 있습니다.
(다운로드 받는 곳은 여기클릭) 개인화 추천 외에 이와 관련된 데이터 마이닝 및 머신 러닝, 대용량 데이터 처리, 기타 관련된 분야의 기술과 사례들이 소개되어 있습니다.
개인화 추천 시스템 관련 분야의 일을 하시는 분들께 도움이 됨은 물론이고, 이쪽에 새롭게 관심을 가지고 계신 분들께는 좋은 입문서가 아닐까 싶습니다.

참고로, 해당 교재에 포함된 내용은 다음과 같습니다.

Chapter 1 Data Mining
Chapter 2 Large-Scale File Systems and Map-Reduce
Chapter 3 Finding Similar Items
Chapter 4 Mining Data Streams
Chapter 5 Link Analysis
Chapter 6 Frequent Itemsets
Chapter 7 Clustering
Chapter 8 Advertising on the Web
Chapter 9 Recommendation Systems

PS) 대학에서 공부할 때에도 Ullman 선상님 책으로 공부한 과목이 꽤 있는데, 그로부터 20년이 지난 지금도 그 분이 쓴 책을 공부하게 될 줄이야...
그 때도 값싼 해적판 원서를 이용했는데... 이제는 아예 무료로 사용하는군요. 그저 죄송하고... 고마울 따름...^^