추천시스템에의 고민 최근 추천시스템을 공부하면서, 나름 관심을 가졌던 부분이 바로 '타이밍'이었다. 추천에의 타이밍. 내가 검색을 한다거나, 쇼핑을 할 때, 굳이 굳이 10년전의 정보나 아이템을 보고싶진않을테니.. 특히나 내가 공부하면서, 다뤄봤던 데이터가 카카오 아레나의 브런치 데이터였기때문에, user가 좋아할 만한 item이라고 판단한다 해도, 이미 시간이 지나서 잘 보지않는, 이미 old-fashion의 것이 되어버린 것들을 추천하는 것이 과연 올바른 일일까? 라는 고민을 계속 했었다. 특히 cold-start, long-tailed item 해결, 즉 unbiasing문제에 관심을 갖고 바라보았던 터라, 가장 손쉽게 접근할 수 있는 content-based recommender system을 활용했다. 당연히 생길..
[Recommender System: the textbook] 5. Knowledge-Based Recommender Systems 5.1 introduction Collaborative systems: 많은 데이터가 필요 --> 그렇지않으면 cold-start 문제 발생. Content-based: 조금 낫지만, new user에 대한 cold-start 문제는 여전히 남아있음. 또한, 매우 customized한 아이템에 잘 맞지않는 추천기법이다. 부동산, 자동차, 관광, financial services, 럭셔리 제품들은 판매량이 많지않고, 충분한 ratings가 이루어지지않음. 그리고 이런 상품들에 대한 도메인 영역은 매우 복잡하다. 집을 사고자할 때, 우리는 옷을 사듯이 고르는 것이 아니고, 평수, 방 개수, 베란다 유무 뭐 이런 것들을 명확하게 원하기때문.. 부동산 아이템과 같은 것들은 아이템을 설명하는데에 있어서 복잡성이 ..
[Recommender System: the textbook] 4. Content-based Recommender Systems 4.1 introductionitem의 descriptive sets of attributes을 활용. cold-start item, ratings가 거의 없는 item을 추천할때 useful하다.CB는 타겟 사용자가 과거에 좋아했던 item과 비슷한 item을 매칭시켜주는 알고리즘. 이 유사도는 attributes기반이다. focus on 1. 타겟유저의 own ratings 2. 해당 유저가 좋아하는 아이템의 attributes. 즉, CB 방법은 다른 소스의 데이터를 활용함.(파생)CB가 의존하는 data sources 1. 다양한 아이템에 대한 설명. 주로 판매자가 제공하는 text로 이루어진 설명 글. 2. user profile. 사용자가 여러 item들에 매긴 feedbacks(ratings..
[Recommender System: the textbook] 2. Neighborhood-based Collaborative Filtering 2.2 Key Properties of Ratings Matrices 한 줄 요약: sparsity and the long tail. R은 m명의 user와 n개의 item의 interaction을 표현한, m*n매트릭스.(r_uj: user u가 item j 를 평가한 점수를 의미) 이때, specified entries는 트레이닝데이터, unspecified enries는 테스트데이터라고 본다. 즉, 평가가 되어있는 정보들을 기반으로, 평가가 아직 되지 않은 것들을 유추하고자 하는 것이다. 문제는 평가된 데이터의 비율이 매우 적다는 것. 현실적으로 item이 너무 많기때문........ Ratings: item을 평가하는 방법 1. Continuous ratings : item에 대한 감정(좋고 싫음..
[Recommender System: the textbook] 추천시스템 알고리즘 입문 여름 방학을 연구로 불태우고 있다. 추천 시스템 자체가 매우 새로운 domain이라서, 추천시스템 알고리즘 적용시부터 허우적거리고있었고... 책을 잡고 기초적인 공부를 해야함을 느끼게 되었다. 낯선 사람들과의 낯선 공부를 진행하게 되었고, 내 인생 첫 스터디..! 두둥...! 스터디로 공부하게 될 책은 'Recommender System: the textbook'이다. 이 책이 추천시스템 책으로는 많이 추천되는 것 같고, 사실 추천시스템은 자료가 많이 없는 것 같다..(한국어 자료는 더욱..)많은 사람들이 블로그에 chapter별로 읽은 내용을 정리해둔 내용으로 얻어갈 수 있었으면! 그리고 스터디원들과 깃에 슬라이드 및 서머리노트를 정리하고있으니, 정리가 되는 대로 공유하겠다. ( https://gith..