26 March 2026
Language Model Personalization via Reward Factorization
COLM'25
๐ก์ฌ๋ฌ ์ฌ์ฉ์์ ์ ํธ๋ฅผ ๊ณตํต๋ ์ ํธ ์ถ(e.g., ์น์ , ๊ฐ๊ฒฐ, ๊ฒฉ์)์ผ๋ก ๋ถํดํด ํ์ตํ ๋ค, ์๋ก์ด ์ฌ์ฉ์๊ฐ ๋ค์ด์ค๋ฉด ์ถ๋ง๋ค ๋ค๋ฅธ ๊ฐ์ค์น๋ฅผ ์ฃผ์ด ์ฌ์ฉ์์ personalized๋ ์ ํธ๋ฅผ ๋น ๋ฅด๊ฒ ์ถ์ ํ์!