추천시스템

    [추천시스템] 이웃 기반 협업필터링 (1) - 사용자 기반

    이웃기반 협업 필터링은 메모리 기반 알고리즘으로 불리기도 하며 협업필터링의 가장 초기 알고리즘 입니다. 이웃기반 협업 필터링의 개념은 다음과 같습니다. "유사한 사용자들은 평점을 주는 방식에서 유사한 패턴을 보이고, 유사한 아이템에는 유사한 평점을 준다." 이웃기반 협업필터링에는 크게 두가지의 방식이 있습니다. - 사용자 기반 협업 필터링 - 아이템 기반 협업 필터링 먼저 사용자 기반 협업 필터링입니다. 사용자 기반 협업 필터링 사용자A 에게 추천을 하기 위하여 사용자A와 유사한 사용자들의 평점을 이용 다음의 표가 있다고 가정해보겠습니다. - 행 : 사용자의 ID - 열 : 아이템ID - 물음표(?) : 빈값(Null) 사용자 기반 협업 필터링에서는 사용자A와 유사한 사용자들의 평점을 이용합니다. 그리고..

    [추천시스템] 평점의 종류

    평점은 아이템이 좋고 싫음을 정량적으로 평가할 수 있는 척도로 활용됩니다. 주로 평점은 순서가 정렬된 서로 다른 숫자의 인터벌 형태로 좋고 싫음이 이를 정량화합니다. 예를들어 {-2, -1, 0, 1, 2} 에서 5포인트의 평가 체계를 나타낸다면 -2는 매우 싫음 ~ 2는 매우좋음을 의미합니다. 이것은 인터벌 기반 평점(interval-based ratings)라고 합니다. 이러한 평점의 표현 방식은 시스템에 따라 다를 수 있습니다. 위의 예시에서는 5포인트지만 7포인트, 10포인트로도 표현할 수 있습니다. 제공사에 따라 다른 표현방식을 가질 수 있습니다. 스탠퍼드대학교의 강의 평가 양식으로는 {강한 비동의, 비동의, 중립, 동의, 강한 동의}와 같이 순서형의 범주형 값을 이용하기도 합니다. 이것을 서수..

    [추천시스템] 기본 협업 필터링 모델

    기본적으로 협업 필터링 모델(Collaborative filtering)은 여러 사용자의 평점을 협업하여 추천합니다. 아래와 같이 영화에 대한 사용자-아이템 평점의 테이블이 있다고 가정하겠습니다. 다크나이트 인터스텔라 프로메테우스 반지의제왕 ... 사용자A 5 4 5 ... 사용자B 5 5 4 4 ... 사용자C 3 4 3 5 ... ... ... ... .. ... ... 대부분의 사용자는 전세계의 영화 중 극히 일부분만 봤을 것이고 대부분의 평점들이 비어있을것 입니다. - 이 개념은 영화뿐만 아니라 쇼핑과 같은 다른 데이터에도 적용이 가능합니다. 협업필터링의 기본적인 구조는 사용자와 아이템간에 매우 높은 상관관계를 가지고 있어 비어있는 평점을 예측하게 됩니다.. 위와 같이 사용자A와 사용자B가 내린 ..

    [추천시스템] 목표

    추천 시스템의 목표 추천 시스템의 목표를 이야기하기 전에 먼저 추천 시스템에는 크게 2가지 기본 모델이 있습니다. 1. 예측 모델 사용자-아이템 조합에 대해서 평가 값을 예측하는 것입니다. 다크나이트 인터스텔라 프로메테우스 반지의제왕 사용자1 5 4 4 사용자2 5 3 5 사용자3 4 3 3 위의 행렬처럼 m명의 사용자와 n개의 아이템(영화)가 있을 때 비어있는 값들을 확인할 수 있습니다. 비어있는 값은 위의 행렬로 학습된 훈련 모델을 통하여 예측할 수 있습니다. 불완전하게 만들어진 행렬을 가지며 나머지 값은 학습 알고리즘에 의해 예측되기 때문에 이 문제는 행렬 완성(matrix completion) 문제라고도 합니다. 2. 랭킹 모델 현실에서는 사용자에게 어떤 아이템을 추천하기 위하여 특정 아이템에 대..

    [추천시스템] 소개 및 개요

    최근에 진행한 프로젝트를 모두 추천시스템과 관련된 프로젝트를 진행하다보니 자연스럽게 추천시스템에 관심이 생겼습니다. - 저의 프로젝트가 궁금하시면 아래의 깃허브 주소를 방문하시면 확인할 수 있습니다. HwangHanJae - Overview HwangHanJae has 31 repositories available. Follow their code on GitHub. github.com 프로젝트를 진행하며 추천시스템을 학습하는 방법에 대하여 제가 참여한 부트캠프의 담당 코치분께 질문하였더니 아래의 책을 추천해주셨습니다. 책은 크게 13챕터로 구성되어 있으며 약 600페이지 정도의 분량을 가지고 있습니다. 이 책을 통하여 스스로 학습한 내용을 정리하며 글을 포스팅해보려고 합니다. 개요 웹의 발전으로 자연스..