200930 요즘 나를 괴롭히던 일들이 마무리되었다. 교수님 답장도 받았고, 졸작 제출도 완료. (수정이 유튜브에 올라갔닼ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ창피..) - 이제 새로운 일들이 다시 시작된다. 이혜승 일벌리기 대마왕. 연정과 희원이는 내 건강 지킴이들이라서, 극구 반대했지만... 수정이는 극한에 부딪히면 언니는 또 해낼 수 있다고... 결론은 해보고 후회하자!
추천시스템에의 고민 최근 추천시스템을 공부하면서, 나름 관심을 가졌던 부분이 바로 '타이밍'이었다. 추천에의 타이밍. 내가 검색을 한다거나, 쇼핑을 할 때, 굳이 굳이 10년전의 정보나 아이템을 보고싶진않을테니.. 특히나 내가 공부하면서, 다뤄봤던 데이터가 카카오 아레나의 브런치 데이터였기때문에, user가 좋아할 만한 item이라고 판단한다 해도, 이미 시간이 지나서 잘 보지않는, 이미 old-fashion의 것이 되어버린 것들을 추천하는 것이 과연 올바른 일일까? 라는 고민을 계속 했었다. 특히 cold-start, long-tailed item 해결, 즉 unbiasing문제에 관심을 갖고 바라보았던 터라, 가장 손쉽게 접근할 수 있는 content-based recommender system을 활용했다. 당연히 생길..
200911 정말 좋아하는 미드, 에이전트 카터. 원래도 좋아했던 대사였는데, 최근에 다시 보다가 눈물 줄줄 흘려버린 부분이다. 내 자신의 가치를 믿는 건 나 하나로 충분하니까💪🏻
200907 대충 살자! 대충 살자, 75%인척하는 60%처럼! (무려 통계학과 게시판이면서. . .) 사실 세상에서 제일 대충 못사는 나🧐 피곤해도 알차게 살아야 직성이 풀려버리기.. 오늘도 (솟아오르는 승모근을 풀어주며..) 강의를 듣고 스터디 준비를 한다 읏샤!
[Recommender System: the textbook] 5. Knowledge-Based Recommender Systems 5.1 introduction Collaborative systems: 많은 데이터가 필요 --> 그렇지않으면 cold-start 문제 발생. Content-based: 조금 낫지만, new user에 대한 cold-start 문제는 여전히 남아있음. 또한, 매우 customized한 아이템에 잘 맞지않는 추천기법이다. 부동산, 자동차, 관광, financial services, 럭셔리 제품들은 판매량이 많지않고, 충분한 ratings가 이루어지지않음. 그리고 이런 상품들에 대한 도메인 영역은 매우 복잡하다. 집을 사고자할 때, 우리는 옷을 사듯이 고르는 것이 아니고, 평수, 방 개수, 베란다 유무 뭐 이런 것들을 명확하게 원하기때문.. 부동산 아이템과 같은 것들은 아이템을 설명하는데에 있어서 복잡성이 ..
200903 오늘의 tmi 강의 듣다가 너무 재밌어서 낙서해서 가져왔다ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ I will no write any more bad code를 써보라하면 안되니까 10번 정도 읽어보라곸ㅋㅋㅋㅋㅋㅋ하셨음 - 약간 너무 공감하며 듣는 수업. . . 컴과의 빛 교수님과 함께하는 클린코드 ㅠ0ㅠ 빡세다곤 하지만, 너무 기대된다 홍홍홍
[Recommender System: the textbook] 4. Content-based Recommender Systems 4.1 introductionitem의 descriptive sets of attributes을 활용. cold-start item, ratings가 거의 없는 item을 추천할때 useful하다.CB는 타겟 사용자가 과거에 좋아했던 item과 비슷한 item을 매칭시켜주는 알고리즘. 이 유사도는 attributes기반이다. focus on 1. 타겟유저의 own ratings 2. 해당 유저가 좋아하는 아이템의 attributes. 즉, CB 방법은 다른 소스의 데이터를 활용함.(파생)CB가 의존하는 data sources 1. 다양한 아이템에 대한 설명. 주로 판매자가 제공하는 text로 이루어진 설명 글. 2. user profile. 사용자가 여러 item들에 매긴 feedbacks(ratings..
[Recommender System: the textbook] 2. Neighborhood-based Collaborative Filtering 2.2 Key Properties of Ratings Matrices 한 줄 요약: sparsity and the long tail. R은 m명의 user와 n개의 item의 interaction을 표현한, m*n매트릭스.(r_uj: user u가 item j 를 평가한 점수를 의미) 이때, specified entries는 트레이닝데이터, unspecified enries는 테스트데이터라고 본다. 즉, 평가가 되어있는 정보들을 기반으로, 평가가 아직 되지 않은 것들을 유추하고자 하는 것이다. 문제는 평가된 데이터의 비율이 매우 적다는 것. 현실적으로 item이 너무 많기때문........ Ratings: item을 평가하는 방법 1. Continuous ratings : item에 대한 감정(좋고 싫음..
200815 카페일지 성수동, 할아버지 공장. 할아버지도 힙할 수 있다. - 송리단길, 카페마달. 따뜻한 사람과 따뜻한 카페에서 차가운 라떼 (굳). - 성수, 어반소스. 넓은 공간, 적당한 포토존, 괜찮은 커피맛. - 성수, 카페 쎈느. 도시적인 느낌. 구경할 거리가 있고, 맛있지만, 공간 자체가 소음을 머금어 더 확장시킨다. 정신 없다. - 위례, 위클리커피. 으아니 위례에 이런 곳이? 크림라떼였나 이름이 뭐드라 하튼 저거 드쇼. - 삼성, 스템커피. 포토매틱 찍으러 옴. 라떼 그냥 데얼스데어맛. - 이상 나의 여름 카페 일지 마무리.