DL, ML/Recommender System

[Recommender System: the textbook] 4. Content-based Recommender Systems

4.1 introduction

item의 descriptive sets of attributes을 활용. cold-start item, ratings가 거의 없는 item을 추천할때 useful하다.

CB는 타겟 사용자가 과거에 좋아했던 item과 비슷한 item을 매칭시켜주는 알고리즘. 이 유사도는 attributes기반이다.
focus on 1. 타겟유저의 own ratings 2. 해당 유저가  좋아하는 아이템의 attributes. 즉, CB 방법은 다른 소스의 데이터를 활용함.(파생)

CB가 의존하는 data sources 
1. 다양한 아이템에 대한 설명. 주로 판매자가 제공하는 text로 이루어진 설명 글.
2. user profile. 사용자가 여러 item들에 매긴 feedbacks(ratings 정보). explicit 혹은 implicit ratings.
user profile은 사용자의 다양한 아이템에 대한 관심사의 속성정보와 연관됨. 중요한 시사점: 다른 사용자의 ratings정보는 타켓 사용자에게 전 혀 영향을 미치지않음.<cold-start item scenarios>  충분한 정보가 쌓이기 전까지는 CB를 사용. CB가 cold-start 문제를 어느정도 완화시킴. item에 대한 rating정보가 하나도 없기때문에 CF로 추천 불가. new item에서 attributes를 추출해서 예측에 활용.

<-> colde start user에는 적용불가. why???

(-) 추천의 다양성, novelty 감소.

CB는 상품설명글의 keywords를 추출해서 item 속성정보로 활용한다. 따라서 text가 많고, unstructed  domain에 적용이 잘 됨.


4.2 basic Components of Content-Based Systems