[Recommender System: the textbook] 4. Content-based Recommender Systems 4.1 introductionitem의 descriptive sets of attributes을 활용. cold-start item, ratings가 거의 없는 item을 추천할때 useful하다.CB는 타겟 사용자가 과거에 좋아했던 item과 비슷한 item을 매칭시켜주는 알고리즘. 이 유사도는 attributes기반이다. focus on 1. 타겟유저의 own ratings 2. 해당 유저가 좋아하는 아이템의 attributes. 즉, CB 방법은 다른 소스의 데이터를 활용함.(파생)CB가 의존하는 data sources 1. 다양한 아이템에 대한 설명. 주로 판매자가 제공하는 text로 이루어진 설명 글. 2. user profile. 사용자가 여러 item들에 매긴 feedbacks(ratings..
[Recommender System: the textbook] 2. Neighborhood-based Collaborative Filtering 2.2 Key Properties of Ratings Matrices 한 줄 요약: sparsity and the long tail. R은 m명의 user와 n개의 item의 interaction을 표현한, m*n매트릭스.(r_uj: user u가 item j 를 평가한 점수를 의미) 이때, specified entries는 트레이닝데이터, unspecified enries는 테스트데이터라고 본다. 즉, 평가가 되어있는 정보들을 기반으로, 평가가 아직 되지 않은 것들을 유추하고자 하는 것이다. 문제는 평가된 데이터의 비율이 매우 적다는 것. 현실적으로 item이 너무 많기때문........ Ratings: item을 평가하는 방법 1. Continuous ratings : item에 대한 감정(좋고 싫음..
[Recommender System: the textbook] 추천시스템 알고리즘 입문 여름 방학을 연구로 불태우고 있다. 추천 시스템 자체가 매우 새로운 domain이라서, 추천시스템 알고리즘 적용시부터 허우적거리고있었고... 책을 잡고 기초적인 공부를 해야함을 느끼게 되었다. 낯선 사람들과의 낯선 공부를 진행하게 되었고, 내 인생 첫 스터디..! 두둥...! 스터디로 공부하게 될 책은 'Recommender System: the textbook'이다. 이 책이 추천시스템 책으로는 많이 추천되는 것 같고, 사실 추천시스템은 자료가 많이 없는 것 같다..(한국어 자료는 더욱..)많은 사람들이 블로그에 chapter별로 읽은 내용을 정리해둔 내용으로 얻어갈 수 있었으면! 그리고 스터디원들과 깃에 슬라이드 및 서머리노트를 정리하고있으니, 정리가 되는 대로 공유하겠다. ( https://gith..
ML: Image data Machine Learning project / 이미지 데이터셋 머신러닝 프로젝트 #2 데이터 소개 및 로딩 Hello, WORLD! 지난 학기 지지고 볶았던 나의 첫 번째 자식....에 대해 종강까지 하고나서야, 글을 쓰려고 앉았다. - 이번 글의 주제 요약: 데이터는 fabric 데이터. 이미지 데이터를 어떻게 로딩할 것인가? 주제는 1. 적은 양의 데이터로 어떻게 좋은 성능을 낼 것인지 2. 정상만으로 결함을 감지할 수 있을지. - 지난 글에서 소개했듯, 우리 팀이 다룰 데이터셋은 fabric 데이터다. 굳이 따지면, 제조업 데이터. (처음부터 제조업 데이터에 관심을 갖고 찾은 데이터는 아니고, defect detection을 주제로 잡고 탐색했다.) 이미지 데이터의 출처는 AITEX사다. 아마도... 스페인의 섬유회사로 추정된다. 회사에 대해 자세히 알아보지는 않았기에.. 중요한 건 데이터지!!! 데이터..
ML: Image data Machine Learning project / 이미지 데이터셋 머신러닝 프로젝트 #1 데이터 및 주제 선정 HI ! 더보기 너무나 블로그에 글을 쓰고 싶었다.... 너무 바빴던 3-5월. 이 기세로 아마 올해 내내 바쁘지 않을까 싶다. 내가 grafana를 활용해서 대시보드를 만들 때는 한국어 자료가 많이 없었어서 내가 다시 보려고 작성해 둔 글에, 최근 구글 유입이 많아졌다. 가끔 내게 질문하시는 분들도 계셨고, 부족하지만 내가 해드릴 수 있는 답변을 드리면서 또 뿌듯하기도 하고! 그리고 이번 학기 '통계적 기계학습(Statistical Machine Learning)'을 수강하면서 프로젝트 진행 중에 파이토치에 관련 궁금한 것을 Pytorch forum에 올려보기도했는데, NVidia DL Software engineer 라는 분이 답을 주셨다. 막 연예인한테 답글받은 성덕이 된 기분이었고(ㅎㅎ), 그 분..
SAS 분석 챔피언십: 입선 ​HELLO 나는 혜스니. 사실 이 상을 받은 지 꽤 오래되었지만, 갑자기 생각나서 이 글을 쓴다. 나의 SAS분챔 파트너 소연씨의 생일은 초여름인 6월. 그 때 나는 시험기간이었고, 소연이는 휴학라이프 막바지를 즐기고있었다(현재는 반대 ~!~^^~!~! 소여니 시험 화이팅!!!!). 생일 축하 메세지를 보내고 서로의 일상을 공유하다가, 소연이가 SAS분챔을 함께 해보겠냐고 제안했고 나는 당연히 YES!였다. 울 똑똑이 소연씨와 함께라면, 배워갈 것이 정말 많았을 것 같았기에. (결론적으로도 배운 것이 정말 많았다. 정말 열심히 사는 소연.. 최고... 당신은 뭘해도 잘될거야.) 하여튼 그렇게 맺게된 파트너 인연. 종강 후, 7월 8일 롯데홈쇼핑 본사에서 분챔 OT가 진행되었다. 가서 데이터에 대한 간략..