AI/๋…ผ๋ฌธ

[๋…ผ๋ฌธ ๋ฆฌ๋ทฐ] AutoRec: Autoencoders Meet Collaborative Filtering

egahyun 2025. 10. 17. 20:58

 

๋…ผ๋ฌธ ๋งํฌ

https://share.google/23LvUEkOosef6zq68

 

01. ๊ธฐ์กด์˜ ํ˜‘์—… ํ•„ํ„ฐ๋ง ๊ธฐ๋ฐ˜ ๋ชจ๋ธ

  a. ๋ชฉํ‘œ : ๊ฐœ์ธํ™”๋œ ์ถ”์ฒœ ์ œ๊ณต์„ ๋ชฉ์ ์œผ๋กœ ์‚ฌ์šฉ์ž ์„ ํ˜ธ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•˜์ž

  b. ๋ฐฉ๋ฒ• 

     - matrix factorization (ํ–‰๋ ฌ ๋ถ„ํ•ด) ๋ฐฉ๋ฒ•

     - neighbourhood models

     - Rating-based Collaborative Filtering

        - ์‚ฌ์šฉ์ž ๋ฒกํ„ฐ : r(u)=(Ru1โ€‹,Ru2โ€‹,…,Runโ€‹)∈Rn  ( u∈U={1,…,m} )

        - ์•„์ดํ…œ : r(i)=(R1iโ€‹,R2iโ€‹,…,Rmiโ€‹)∈Rm  ( i∈I={1,…,n}i \in I = \{1, \dots, n\}

 

02. Autoencoder

: ์ž…๋ ฅ์„ ์žฌ๊ตฌ์„ฑํ•œ h๋ฅผ ํ†ตํ•ด ์ตœ์ ํ™”๋ฅผ ์ง„ํ–‰ํ•˜๋Š” ๋‹จ์ผ ์€๋‹‰์ธต์„ ๊ฐ€์ง„ auto-associative ์‹ ๊ฒฝ๋ง ๊ตฌ์กฐ

- ์ž…๋ ฅ ์ง‘ํ•ฉ : $$ S⊆Rd$$

- ์ฐจ์› : $$ k∈N+k \in \mathbb{N}^+

- parameter ํ•™์Šต : ์—ญ์ „ํŒŒ๋กœ ํ•™์Šต๋จ

 

 

03. AutoRec model

: autoencoder ๊ตฌ์กฐ๋ฅผ ์ด์šฉํ•œ ์ƒˆ๋กœ์šด CF ๋ชจ๋ธ

  a. ๊ฐœ์š” : ์‹œ๊ฐ, ์Œ์„ฑ ์ž‘์—…์—์„œ์˜ deep neural network ๋ชจ๋ธ์˜ ์„ฑ๊ณต์—์„œ ๋น„๋กฏ๋จ

 

  b. ๊ณผ์ •

      : item-based or user-based autoencoder ์„ค๊ณ„

         → r(i) or r(u)๋ฅผ ์ž…๋ ฅ์œผ๋กœ, ์ €์ฐจ์› latent splace ํˆฌ์‚ฌ

         → ๋ˆ„๋ฝ๋œ ํ‰์  ์˜ˆ์ธก์„ ์œ„ํ•ด, ์ถœ๋ ฅ ๊ณต๊ฐ„์—์„œ ํˆฌ์‚ฌํ•œ ๊ฒƒ ์žฌ๊ตฌ์„ฑ

 

  c. item-based AutoRec model

     : ๋ชจ๋ธ์ด ๊ฐ item ๋ฒกํ„ฐ์— autoencoder๋ฅผ ์ ์šฉํ•œ ๋ฐฉ๋ฒ•

     - ํŠน์ง•

        - ์ž…๋ ฅ ์ผ๋ถ€๋งŒ ๊ด€์ธก๋˜๋ฏ€๋กœ, ์—ญ์ „ํŒŒ ์‹œ ๊ด€์ธก ํ•ญ๋ชฉ์— ๋Œ€์‘ํ•˜๋Š” ๊ฐ€์ค‘์น˜๋งŒ ์—…๋ฐ์ดํŠธ

        - ๊ณผ์ ํ•ฉ ๋ฐฉ์ง€๋ฅผ ์œ„ํ•ด ํŒŒ๋ผ๋ฏธํ„ฐ์— ์ •๊ทœํ™” ์ ์šฉ

     - ๋ชฉํ‘œ ํ•จ์ˆ˜ : 

        $$L=i=1∑nโ€‹โˆฅO(r(i)−h(r(i);θ))โˆฅ2+λโˆฅθโˆฅ2$$

        - ๊ฐ€์ • : ์ •๊ทœํ™” ๊ฐ•๋„($$\lambda$$) > 0 

        - ํŒŒ๋ผ๋ฏธํ„ฐ ๊ฐœ์ˆ˜ : 2mk + m + k ๊ฐœ

        - ์˜ˆ์ธก ํ•˜๋Š” ๊ฐ’ : ํ•™์Šต๋œ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ๋ถ€ํ„ฐ ์‚ฌ์šฉ์ž๊ฐ€ ์•„์ดํ…œ์—๊ฒŒ ์ค„ ํ‰์  

 

  d. user-based AutoRec model

     : ๋ชจ๋ธ์ด ๊ฐ user ๋ฒกํ„ฐ์— autoencoder๋ฅผ ์ ์šฉํ•œ ๋ฐฉ๋ฒ•

      <๋ชฉํ‘œํ•จ์ˆ˜๋Š” item-based์™€ r(i) → r(u) ๋กœ ๋ฐ”๊พธ๋ฉด ๋™์ผํ•˜๊ฒŒ ์ •์˜๋จ>

 

  e. ์žฅ์ 

     - ๊ธฐ์กด CF์˜ ์‹ ๊ฒฝ๋ง ์ ‘๊ทผ ๋ฐฉ์‹ ๋ณด๋‹ค ํ‘œํ˜„, ๊ณ„์‚ฐ ์ธก๋ฉด์—์„œ ์ด์ ์ด ์กด์žฌ

 

 

04. RBM-CF model vs AutoRec model

  RBM-CF model AutoRec model
ํ•™์Šต ํŒจ๋Ÿฌ๋‹ค์ž„ ์ƒ์„ฑ์  ํ™•๋ฅ  ๋ชจ๋ธ ํŒ๋ณ„์  ๋ชจ๋ธ
ํ•™์Šต ์ดˆ์  log likelihood ์ตœ๋Œ€ํ™” RMSE ์ตœ์†Œํ™”
ํ•™์Šต ๋ฐฉ์‹ ๋Œ€์กฐ ๋ฐœ์‚ฐ ๋‹จ์ˆœํ•œ ๊ฒฝ์‚ฌํ•˜๊ฐ• ๊ธฐ๋ฐ˜ ์—ญ์ „ํŒŒ
ํŠน์ง• - ์ด์‚ฐ ํ‰์ ์—๋งŒ ์ ์šฉ๋˜์–ด,
  ํ‰์  ๋งˆ๋‹ค ๋ณ„๋„์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํ•™์Šต
- ํ‰์  ์Šค์ผ€์ผ์— ๋…๋ฆฝ์ 
- ์ ์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ
- overfitting ์œ„ํ—˜ ↓
- ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋ฅผ ํ†ตํ•œ ๋น„์„ ํ˜• ํ‘œํ˜„ ํ•™์Šต๊ฐ€๋Šฅ

 

 

05. Matrix Factorization (MF)  vs AutoRec model

  RBM-CF model AutoRec model
user embedding shared latent space์— ๋งคํ•‘ X
item embedding shared latent space์— ๋งคํ•‘ latent space์— ์ž„๋ฒ ๋”ฉ
linear ํ‘œํ˜„ ํ•™์Šต ์—ฌ๋ถ€ O X
non-linear ํ‘œํ˜„ ํ•™์Šต ์—ฌ๋ถ€ O O (ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด, ํ•™์Šต ๊ฐ€๋Šฅ)

 

 

06. ์‹คํ—˜

   a. dataset : MovieLens 1M, 10M, ๋„ทํ”Œ๋ฆญ์Šค

   b. ๋น„๊ต ๋Œ€์ƒ ๋ชจ๋ธ : RBM-CF, MF, LLORMA

 

   c. ์‹คํ—˜ ์„ธํŒ…

       - train, test split : 90%(10%๋Š” hyper parameter tuning์— ์‚ฌ์šฉ) 10%

       - epoch : 5

       - ํ‰๊ฐ€ ๊ธฐ์ค€ : average RMSE

       - 95% ์‹ ๋ขฐ ๊ตฌ๊ฐ„ : ±0.003 ์ดํ•˜

       - ํŠœ๋‹ ๋Œ€์ƒ : λ(์ •๊ทœํ™” ๊ฐ•๋„), k(์ž ์žฌ ์ฐจ์›) ∈{10,20,40,80,100,200,300,400,500}

       - ํ•™์Šต ์•ˆ์ •ํ™” : RProp ์‚ฌ์šฉ

 

   d. ๊ฒฐ๊ณผ

       - ์„ฑ๋Šฅ ๋น„๊ต

           : item ๊ธฐ๋ฐ˜ ๋ชจ๋ธ > user ๊ธฐ๋ฐ˜ ๋ชจ๋ธ

           - ์ด์œ  : item ๋‹น ํ‰์ ์˜ ๊ฐœ์ˆ˜ > user ๋‹น ํ‰์ ์˜ ๊ฐœ์ˆ˜ 

 

       - ์„ ํ˜• ๋ฐ ๋น„์„ ํ˜• ํ™œ์„ฑํ™” ํ•จ์ˆ˜ ์‚ฌ์šฉ ์‹œ, ์„ฑ๋Šฅ ๋น„๊ต

           - hidden layer์— ๋น„์„ ํ˜• ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋ฅผ ์ ์šฉ ์‹œ, ์„ฑ๋Šฅ ํ–ฅ์ƒ์— ๊ฒฐ์ •์  → MF๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ๋น„์„ ํ˜• ํ‘œํ˜„๋ ฅ์„ ๊ฐ€์ง์„ ์˜๋ฏธํ•จ

           - ํ™œ์„ฑํ™”ํ•จ์ˆ˜๋กœ sigmoid ๋Œ€์‹  ReLU ์‚ฌ์šฉ ์‹œ, ์„ฑ๋Šฅ์ด ๋‚ฎ์•„์ง (→ ์ดํ›„, ๋ชจ๋“  ์‹คํ—˜์—์„œ sigmoid ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉ)

 

       - hidden unit ์ˆ˜์— ๋”ฐ๋ฅธ ์„ฑ๋Šฅ ๋น„๊ต

RMSEofI-AutoReconMovielens1Masthenum berofhiddenunitskvaries.

           : ์ฆ๊ฐ€ํ•  ์ˆ˜๋ก ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋˜์—ˆ์ง€๋งŒ, ์ ์ฐจ ๊ทธ ํšจ๊ณผ๊ฐ€ ๊ฐ์†Œํ•จ

 

       - ๊ธฐ์กด ๋ชจ๋ธ๊ณผ์˜ ์„ฑ๋Šฅ ๋น„๊ต

Comparison of I-AutoRec with base lines on Movie Lens and Netflix datasets.

           - ๋Œ€๋ถ€๋ถ„ ์šฐ์ˆ˜ํ•œ RMSE๋ฅผ ๋ณด์ž„

           - LLORMA ์™€์˜ ๋น„๊ต : ์„ฑ๋Šฅ์€ ๋น„์Šทํ•˜๋‚˜, AutoRec์€ ๋‹จ์ผ autoencoder ๊ธฐ๋ฐ˜์ด๋ผ๋Š” ์ ์—์„œ ์ค‘์š”ํ•จ

 

       - ๊นŠ๊ฒŒ ํ™•์žฅ์‹œ, ํšจ๊ณผ

           - ๊ตฌ์„ฑ : 3๊ฐœ์˜ ์€๋‹‰์ธต (500, 250, 500 ์œ ๋‹›)์œผ๋กœ ๊ตฌ์„ฑ + sigmoid ํ™œ์„ฑํ™” ํ•จ์ˆ˜

           - dataset : MovieLens 1M

           -  ํ•™์Šต : ์‚ฌ์ „ํ•™์Šต ํ›„, fine tuning ์ง„ํ–‰

           - ๊ฒฐ๊ณผ : 0.831 -> 0.827๋กœ ๊ฐ์†Œ