Done is Better Than Perfect

μΆ”μ²œ μ‹œμŠ€ν…œμ΄λž€ λ³Έλ¬Έ

πŸ€– AI/Machine Learning

μΆ”μ²œ μ‹œμŠ€ν…œμ΄λž€

jimingee 2022. 1. 5. 17:58

μΆ”μ²œ μ‹œμŠ€ν…œ  μ΄λž€?

μ‚¬μš©μžμ˜ μ„ ν˜Έ μ •λ³΄λ‚˜ μ·¨ν–₯을 λΆ„μ„ν•˜μ—¬ μ‚¬μš©μžμ—κ²Œ μ ν•©ν•œ μ•„μ΄ν…œμ„ μΆ”μ²œν•˜λŠ” μ•Œκ³ λ¦¬μ¦˜

 

ν•„μš”μ„±

μΈν„°λ„·μ˜ λ°œλ‹¬λ‘œ μ‚¬μš©μžμ˜ μ•„μ΄ν…œ ꡬ맀 데이터, μ„ ν˜Έ 데이터, 평점 데이터λ₯Ό μ‰½κ²Œ 얻을 수 μžˆμŠ΅λ‹ˆλ‹€. 

μΆ”μ²œμ‹œμŠ€ν…œμ€ μ‚¬μš©μž κ°œμΈν™”μ— μ΄ˆμ μ„ 맞좀으둜써 μ‚¬μš©μžλ“€μ΄ 더 μ‰½κ²Œ μ›ν•˜λŠ” μƒν’ˆμ— μ ‘κ·Όν•  수 μžˆλ„λ‘ 돕고, κΈ°μ—…μ˜ μž…μž₯μ—μ„œλŠ” μ†ŒλΉ„λ₯Ό μœ λ„ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

+ μΆ”μ²œ μ‹œμŠ€ν…œμ€ youtube λ™μ˜μƒ μΆ”μ²œ, SNS μΉœκ΅¬μΆ”μ²œ,  netflix μ˜ν™”μΆ”μ²œ 와 같은 λ‹€μ–‘ν•œ λΆ„μ•Όμ˜ μ„œλΉ„μŠ€μ—μ„œ μ‚¬μš©μžμ˜ μ·¨ν–₯을 λΆ„μ„ν•˜μ—¬ μ œκ³΅ν•œλ‹€.

 

 

 

μΆ”μ²œ μ•Œκ³ λ¦¬μ¦˜ μ’…λ₯˜

  • Content-based Recommender Systems: 컨텐츠 기반 μΆ”μ²œμ‹œμŠ€ν…œ
  • Collaborative Filtering: ν˜‘μ—…ν•„ν„°λ§
  • Knowldege-based systems: 지식 기반 μΆ”μ²œμ‹œμŠ€ν…œ
  • Deep Learning-based Recommendation : λ”₯λŸ¬λ‹ 기반 μΆ”μ²œμ‹œμŠ€ν…œ

 

Content-based Recommender Systems

μ‚¬μš©μžκ°€ νŠΉμ • μ•„μ΄ν…œμ„ μ„ ν˜Έν•˜λŠ” 경우, κ·Έ μ•„μ΄ν…œκ³Ό λΉ„μŠ·ν•œ νŠΉμ„±(feature)을 가진 λ‹€λ₯Έ μ•„μ΄ν…œμ„ μΆ”μ²œν•΄μ£ΌλŠ” λ°©μ‹μž…λ‹ˆλ‹€. 
μ•„μ΄ν…œκ°„μ˜ μœ μ‚¬λ„λŠ” λ‹€λ₯Έ 짝지어진 μ•„μ΄ν…œλ“€κ³Ό κ΄€λ ¨λœ νŠΉμ§•λ“€μ„ ν†΅ν•˜μ—¬ κ³„μ‚°λ˜κ³  μ‚¬μš©μžλ“€μ˜ μ„ ν˜Έ 이λ ₯에 맞게 μ μš©λ©λ‹ˆλ‹€.

 

 

Collaborative Filtering

μ‚¬μš©μžμ˜ μ„ ν˜Έλ„λ₯Ό λ°”νƒ•μœΌλ‘œ λΉ„μŠ·ν•œ μ·¨ν–₯을 가진 μ‚¬μš©μžλ“€μ—κ²Œ μ„œλ‘œ 아직 κ΅¬λ§€ν•˜μ§€ μ•Šμ€ μƒν’ˆλ“€μ„ ꡐ차 μΆ”μ²œν•˜κ±°λ‚˜ λΆ„λ₯˜λœ 고객의 μ·¨ν–₯μ΄λ‚˜ μƒν™œ ν˜•νƒœμ— 따라 κ΄€λ ¨ μƒν’ˆμ„ μΆ”μ²œν•΄μ£ΌλŠ” λ°©μ‹μž…λ‹ˆλ‹€.

 

+ 예λ₯Ό λ“€μ–΄, A 와 Bκ°€ μœ μ‚¬ν•œ 그룹으둜 묢인닀면, Bκ°€ μ„ ν˜Έν•˜λŠ” μ•„μ΄ν…œμ„ Aκ°€ μ’‹μ•„ν•  κ²ƒμœΌλ‘œ μ˜ˆμΈ‘ν•©λ‹ˆλ‹€. λ”°λΌμ„œ Aκ°€ κ΅¬λ§€ν•œ μ•„μ΄ν…œμ„ μ œμ™Έν•˜κ³  Bκ°€ μ„ ν˜Έν•˜λŠ” μ•„μ΄ν…œμ„ Aμ—κ²Œ μΆ”μ²œν•©λ‹ˆλ‹€.

 

 

Knowledge-based systems

μ‚¬μš©μžλ“€μ˜ ꡬ맀 이λ ₯이 적은 κ²½μš°μ— μ‚¬μš©ν•˜λŠ” μΆ”μ²œ λ°©μ‹μž…λ‹ˆλ‹€.
μ•„μ΄ν…œμ„ μΆ”μ²œν•˜κΈ° 전에 μ•„μ΄ν…œμ˜ νŠΉμ§•κ³Ό λͺ…μ‹œμ μΈ μ§ˆλ¬Έμ„ 톡해 νšλ“ν•œ μ‚¬μš©μž μ„ ν˜Έλ„μ™€ μΆ”μ²œ λ²”μœ„ λ“± μ•„μ΄ν…œλ“€μ— λŒ€ν•œ 정보λ₯Ό κ³ λ €ν•˜μ—¬ μΆ”μ²œν•΄μ€λ‹ˆλ‹€. 

 

 

Hybrid System

μœ„μ—μ„œ μ–ΈκΈ‰ν•œ λ‹€μ–‘ν•œ μΆ”μ²œ μ‹œμŠ€ν…œμ„ κ²°ν•©ν•˜μ—¬ λ§Œλ“­λ‹ˆλ‹€.

 


μΆ”μ²œ μ‹œμŠ€ν…œμ˜ λͺ©μ 

  • Prediction version of Problem: Matrix Completion problem이라고도 ν•˜λ©°, ν•™μŠ΅ 데이터λ₯Ό 톡해 μœ μ €μ˜ μ„ ν˜Έλ„λ₯Ό μ •ν™•ν•˜κ²Œ μ˜ˆμΈ‘ν•˜λŠ” 것이 λͺ©μ 
  • Ranking version of Problem: μ •ν™•νžˆ 수치λ₯Ό μ˜ˆμΈ‘ν•˜λŠ” 것이 μ•„λ‹Œ, λž­ν‚Ήμ„ κ³ λ €ν•΄ top-k 의 μ•„μ΄ν…œμ„ μ„ μ •ν•˜λŠ” 것이 λͺ©μ 

 

일반적으둜 Prediction version of Problem을 ν‘ΈλŠ” 것이 λͺ©μ μ΄ λ˜λŠ”λ° 이λ₯Ό ν•΄κ²°ν•΄μ•Ό Ranking λ¬Έμ œλ„ ν•΄κ²°ν•  수 있기 λ•Œλ¬Έμž…λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ ν˜„μ‹€μ„ κ³ λ €ν•˜λ©΄ λ”μš± μžμ—°μŠ€λŸ¬μš΄ Problem은 Ranking λ¬Έμ œμž…λ‹ˆλ‹€. 보톡 μš°λ¦¬κ°€ A, B 쀑 μƒν’ˆμ„ κ³ λ₯Ό λ•Œ A와 Bλ₯Ό 비ꡐ해 μƒλŒ€μ μœΌλ‘œ 더 쒋은 것을 사지, A와 B의 점수λ₯Ό 각각 κ΅¬ν•΄μ„œ λΉ„κ΅ν•˜λŠ” 것은 λΉ„νš¨μœ¨μ μ΄κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

 


데이터 μ’…λ₯˜

Implicit data : μ‚¬μš©μžμ˜ 간접적인 μ„ ν˜Έλ₯Ό ν‘œν˜„ν•œ 데이터

μ‚¬μš©μžμ˜ ꡬ맀 μ—¬λΆ€(0λ˜λŠ” 1)만 μ•Œ 수 있고, 그에 λ”°λ₯Έ ν”Όλ“œλ°±(평점)은 λͺ¨λ₯΄λŠ” 경우

example] μ‹œμ²­ 기둝, λ‹€μš΄λ‘œλ“œ 기둝, μ›Ή μ‚¬μ΄νŠΈ λ°©λ¬Έ μ‹œκ°„

 

Explicit data : μ‚¬μš©μžμ˜ λͺ…ν™•ν•œ μ„ ν˜Έλ₯Ό ν‘œν˜„ν•œ data

example] 평점(1점 ~ 5점), μ’‹μ•„μš”, μ‹«μ–΄μš”

 


μΆ”μ²œ μ‹œμŠ€ν…œ ν•œκ³„μ 

 

1. cold start

μƒˆλ‘œμš΄ μœ μ €μ— λŒ€ν•œ μΆ©λΆ„ν•œ 정보가 μˆ˜μ§‘λœ μƒνƒœκ°€ μ•„λ‹ˆλΌμ„œ ν•΄λ‹Ή μœ μ €λ“€μ—κ²Œ μ μ ˆν•œ μ œν’ˆμ„ μΆ”μ²œν•΄μ£Όμ§€ λͺ»ν•˜λŠ” 문제λ₯Ό μ˜λ―Έν•©λ‹ˆλ‹€.

 

2. sparse data

전체 곡간에 λΉ„ν•΄ 데이터가 μžˆλŠ” 곡간이 맀우 ν¬μ†Œν•œ 데이터λ₯Ό μ˜λ―Έν•©λ‹ˆλ‹€.

μœ μ € - μ•„μ΄ν…œ μ‚¬μ΄μ˜ rating이 μ—†λŠ” 경우λ₯Ό μ˜λ―Έν•©λ‹ˆλ‹€.

 

 

 

μ°Έκ³  λ„μ„œ

https://wikidocs.net/48798

 

01. An Introduction to Recommender Systems

μΈν„°λ„·μ˜ λ°œμ „μœΌλ‘œ μœ μ €μ˜ μ•„μ΄ν…œ μ„ ν˜Έμ— λŒ€ν•œ 직간접적 ν”Όλ“œλ°±μ„ μ–»κΈ° μ‰¬μ›Œμ‘Œλ‹€. μ΄λŸ¬ν•œ 과거의 μœ μ €-μ•„μ΄ν…œ κ°„ μƒν˜Έμž‘μš© 기둝을 ν™œμš©ν•΄ μœ μ €μ˜ μ·¨ν–₯을 κ³ λ €ν•œ μ•„μ΄ν…œμ„ μΆ”μ²œν•˜λŠ” ...

wikidocs.net

 

'πŸ€– AI > Machine Learning' μΉ΄ν…Œκ³ λ¦¬μ˜ λ‹€λ₯Έ κΈ€

04. Logistic Regression  (1) 2022.03.23
03. Linear Regression with Multiple Variable  (1) 2022.02.10
02. Linear regression with one variable  (1) 2022.02.04
01. introduction  (0) 2022.01.20
Machine Learning 정리  (0) 2022.01.20
Comments