일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 나의23살
- 이차전지
- cost function
- gradient descent
- 오스트리아
- 유럽
- m1 anaconda 설치
- set add
- 유럽 교환학생
- 특별 메소드
- special method
- 2022년
- anaconda 가상환경
- 미래에셋해외교환
- 최대공약수
- 교환학생
- fluent python
- 최소제곱법
- Andrew ng
- Deeplearning
- 미래에셋 장학생
- Linear Regression
- 최소공배수
- 청춘 화이팅
- 양극재
- 딥러닝
- Python
- 선형회귀
- set method
- Machine learning
- Today
- Total
Done is Better Than Perfect
추천 시스템이란 본문
추천 시스템 이란?
사용자의 선호 정보나 취향을 분석하여 사용자에게 적합한 아이템을 추천하는 알고리즘
필요성
인터넷의 발달로 사용자의 아이템 구매 데이터, 선호 데이터, 평점 데이터를 쉽게 얻을 수 있습니다.
추천시스템은 사용자 개인화에 초점을 맞춤으로써 사용자들이 더 쉽게 원하는 상품에 접근할 수 있도록 돕고, 기업의 입장에서는 소비를 유도할 수 있습니다.
+ 추천 시스템은 youtube 동영상 추천, SNS 친구추천, netflix 영화추천 와 같은 다양한 분야의 서비스에서 사용자의 취향을 분석하여 제공한다.
추천 알고리즘 종류
- Content-based Recommender Systems: 컨텐츠 기반 추천시스템
- Collaborative Filtering: 협업필터링
- Knowldege-based systems: 지식 기반 추천시스템
- Deep Learning-based Recommendation : 딥러닝 기반 추천시스템
Content-based Recommender Systems
사용자가 특정 아이템을 선호하는 경우, 그 아이템과 비슷한 특성(feature)을 가진 다른 아이템을 추천해주는 방식입니다.
아이템간의 유사도는 다른 짝지어진 아이템들과 관련된 특징들을 통하여 계산되고 사용자들의 선호 이력에 맞게 적용됩니다.
Collaborative Filtering
사용자의 선호도를 바탕으로 비슷한 취향을 가진 사용자들에게 서로 아직 구매하지 않은 상품들을 교차 추천하거나 분류된 고객의 취향이나 생활 형태에 따라 관련 상품을 추천해주는 방식입니다.
+ 예를 들어, A 와 B가 유사한 그룹으로 묶인다면, B가 선호하는 아이템을 A가 좋아할 것으로 예측합니다. 따라서 A가 구매한 아이템을 제외하고 B가 선호하는 아이템을 A에게 추천합니다.
Knowledge-based systems
사용자들의 구매 이력이 적은 경우에 사용하는 추천 방식입니다.
아이템을 추천하기 전에 아이템의 특징과 명시적인 질문을 통해 획득한 사용자 선호도와 추천 범위 등 아이템들에 대한 정보를 고려하여 추천해줍니다.
Hybrid System
위에서 언급한 다양한 추천 시스템을 결합하여 만듭니다.
추천 시스템의 목적
- Prediction version of Problem: Matrix Completion problem이라고도 하며, 학습 데이터를 통해 유저의 선호도를 정확하게 예측하는 것이 목적
- Ranking version of Problem: 정확히 수치를 예측하는 것이 아닌, 랭킹을 고려해 top-k 의 아이템을 선정하는 것이 목적
일반적으로 Prediction version of Problem을 푸는 것이 목적이 되는데 이를 해결해야 Ranking 문제도 해결할 수 있기 때문입니다. 그러나 현실을 고려하면 더욱 자연스러운 Problem은 Ranking 문제입니다. 보통 우리가 A, B 중 상품을 고를 때 A와 B를 비교해 상대적으로 더 좋은 것을 사지, A와 B의 점수를 각각 구해서 비교하는 것은 비효율적이기 때문입니다.
데이터 종류
Implicit data : 사용자의 간접적인 선호를 표현한 데이터
사용자의 구매 여부(0또는 1)만 알 수 있고, 그에 따른 피드백(평점)은 모르는 경우
example] 시청 기록, 다운로드 기록, 웹 사이트 방문 시간
Explicit data : 사용자의 명확한 선호를 표현한 data
example] 평점(1점 ~ 5점), 좋아요, 싫어요
추천 시스템 한계점
1. cold start
새로운 유저에 대한 충분한 정보가 수집된 상태가 아니라서 해당 유저들에게 적절한 제품을 추천해주지 못하는 문제를 의미합니다.
2. sparse data
전체 공간에 비해 데이터가 있는 공간이 매우 희소한 데이터를 의미합니다.
유저 - 아이템 사이의 rating이 없는 경우를 의미합니다.
참고 도서
'공부 > MachineLearning' 카테고리의 다른 글
04. Logistic Regression (0) | 2022.03.23 |
---|---|
03. Linear Regression with Multiple Variable (0) | 2022.02.10 |
02. Linear regression with one variable (0) | 2022.02.04 |
01. introduction (0) | 2022.01.20 |
Machine Learning 정리 (0) | 2022.01.20 |