FRESH IN MEMORY: TRAINING-ORDER RECENCY IS LIN-EARLY ENCODED IN LANGUAGE MODEL ACTIVATIONS
Review
| ๋๋ค์ | Strength & Weakness & Sugguestions | ๋ณ์ (0/5) |
|---|---|---|
| ๋๋ฌผ | โข ๊ฐ์ : LLM์ ๋ํด ํต์์ ์ผ๋ก "๋ฌด์"์ ์๊ณ ์๋์ง๋ฅผ ๋์ด "์ธ์ " ์๊ฒ๋์๋์ง์ ๋ํด ๊ฒ์ฆํ๋ ์ฐ๊ตฌ. Training Order๊ณผ ๊ด๋ จ์์ ๋ฒํ ๋ชจ๋ "๊ฐ๋จํ" ์์ธ๋ค์ ํต์ ํด ์คํ์ ํ์ง๋ง, Training Order๋ ๊ฐ๋จํ๊ฒ ๋ฐ์ํ ๊ตฌ์กฐ๊ฐ ์๋, ๋ชจ๋ธ ๋ด๋ถ์ ๋ณต์กํ ๊ตฌ์กฐ์์ ์์ํจ. โข ์ฝ์ : Training Order๊ณผ ๊ด๋ จ๋ ํต์ ์คํ์ ๋ง์ด ํ์ง๋ง, ๊ฒฐ๋ก ์ ์ผ๋ก ์ค์ ๋ฐ์ํ๋ ์์ธ์ ๋ฐํ๋ด์ง ๋ชปํจ. ๋ํ Sequence data์ ํ์ ์ ์ด๋ค ๋ณด๋, ์์ฉํ๋ ค๋ฉด fine-tuning์ ์์กด์ ์ผ ๊ฒ์ผ๋ก ๋ณด์. โข ๋ณด์์ : ์๋ง ์ด์ฉํ๋ค๋ฉด, ์๊ฐ์ ๋ฐ๋ผ ๋ณ๋์ฑ์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃฐ ๋ ํจ์จ์ ์ผ ๊ฒ ๊ฐ๋ค. ๊ทธ๋ฆฌ๊ณ , ๋ ๋ณต์กํ๊ณ ๋ค์ํ ๋ชจ๋ธ์ ํต์ ์คํ์ ์งํํด ๋ถ์ํ๋ค๋ฉด ์ผ๋ฐ์ฑ์ ๋์ผ ์ ์์ ๋ฏ. | 3.1 |
| ํผ๋ | โข ๊ฐ์ : LLM์ ํด์๊ฐ๋ฅ์์ ๋ํด์ ๋ถ์ํ ์ ์๋ ์๋ก์ด ์ถ์ ์ ์ํจ โข ์ฝ์ & ๋ณด์์ : ์ธ์ ๋ฐฐ์ ๋์ง๋ฅผ ์ ์์์ผ ๋๋์ง motivation์ด ๋ถ์กฑํจ, ์ธ์ ๋ฐฐ์ ๋์ง๊ฐ ์ ์ค์ํ์ง์ ๋ํด ์ข ๋ ๋งํ๊ณ ์ด์ ๋ํ ์ค์ ์คํ์ด ์์์ผ๋ฉด ๋ ์ข์์๋ฏ. e.g., ์ ๋ณด ์ ๋ฐ์ดํธ, Unlearning ๋ฑ๋ฑ What's In My Human Feedback? Learning Interpretable Descriptions of Preference Data ๋ ผ๋ฌธ์ Section 5์ฒ๋ผ | 3.8 |
| thumps-up | โข ์ฅ: training-order๊ฐ ๋ชจ๋ธ ๋ด์ ๋ช
ํํ๊ฒ ์ธ์ฝ๋ฉ๋๋ค๋๊ฒ ์ง์ง ์ ๊ธฐํจ. ํ๊ธด ๊ทธ๋ฌ๋๊น incremental learning์ด ์ ํจํ๊ฑฐ๊ฒ ์ง? ๋ค์ํ family๋ model size์ ๋ํด์๋ ์ถฉ์คํ๊ฒ ์คํํ ๋ถ๋ถ๋ ์ข์ โข ๋จ&: ๊ทผ๋ฐ ์ธ์ ๋ฐฐ์ ๋์ง๋ ์ ์์์ผ ํ์ง? ๊ทธ ์์ ์ ํ์ตํ ๋ถ๋ถ๋ง ์ฝ ์ง์ด์ model editingํ ๋ ์ฐ์ด๋? rationale์ด ๋ถ์กฑํด์ ์์ฌ์ | 3.5 |
| ์์ผ๋ฉด์ ๋ณด์ | ์ฅ: ์ ์ ํ ๊ด์ . ์์๋ฅผ ์๋ ๊ฒ ๋ฟ๋ง ์๋๋ผ, ๊ทธ๊ฑธ ํ์ฉํ ์๋ ์์ ๊ฒ์ด๋ผ๋ ๋ฐฉํฅ์ด ๋ณด์ด๊ธด ํจ. ๋จ์ : ์ ํด์ผํ ๊น? ์ฝ๋ ์ฌ๋์ด ์๊ฐํ๊ฒ ํ๋ค. ๊ฐ์ธ์ ์ผ๋ก๋ ๋์ค์ ์ธ๋ชจ ์๋ค๊ณ ์๊ฐํจ. ๊ฒฐ๊ตญ ์ต์ ์ง์์ ๊ณ์ ํ์ตํ๊ฒ ๋ ํ ๋ฐ, ๊ฐ์ฅ ๋ง์ง๋ง์ ๋ฐฐ์ด ์ง์์ด ๋ญ์ผ? ๋ผ๊ณ ๋ฌผ์ด๋ต์ ๋ ๋ตํ๋ ๊ฒ. ํ์ํ ์ด์ ๋ ๊ฒฐ๊ตญ LLM์ด ์ธ๊ฐ๋ณด๋ค ๋๋ํด์ง๋ฉด ์๊ฐ ํ์ต์ ํ ๊ฒ ๊ฐ๊ณ , ๊ทธ๋ผ ์ต์ ๊ธฐ์ ๋ llm๋ง ์๊ฒ ๊ฐ์๋ฐ, ๊ทธ๋๋? ๋ณด์์ : ๊ฐ์ง ๋ฐ์ดํฐ ๋ฑ์ ๋ ๋ง๋ค๊ณ ์คํํด๋ณด๋ฉด์ ์ถฉ๋ ์ฌ๋ถ๋ ๊ณ ๋ คํ์ผ๋ฉด.. | 3.7 |
| ๋ ์๋ฆฌ์คํ์ | โข ๊ฐ์ : ์ธ์ ๋ฐฐ์ ๋์ง(recency)๊น์ง activation์ ์ธ์ฝ๋ฉ ๋๋ค๋ ์ ์ ์ ์ ์ํจ. training-order๊ฐ ์ ํ ๋ฐฉํฅ์ผ๋ก encoding ๋๋๊ฒ๋ ์๋ก์ด ์ฌ์ค์ โข ์ฝ์ : ๊ทธ๋์ ์ด ํ์์ด ๋ชจ๋ธ์ ์ค์ ์์ธก์ ์ด๋ค ์ํฅ์ ์ฃผ๋์ง์ ๋ํ ๋ถ์์ ๋ถ์กฑํจ โข ๋ณด์/์ ์: ํฅํ ๋ชจ๋ธ ํ๋ จ ์์ ๋ฐ์ดํฐ์ ์ ์ด๋ฌํ ์์ผ๋ก ๊ตฌ์ฑํด ํ์ต์ํค๊ณ ๋์ค์ ๊ด๋ จ๋ entity๊ฐ conflict๊ฐ ๋ฐ์ํ์ ๋ ์ด๋ฌํ recency signal์ ํ์ฉํด ์ฝ๊ฒ ํด๊ฒฐํ ์ ์์๊ฒ ๊ฐ์ | 4.2 |
| ์์ง | โข ๊ฐ์ :๋ชจ๋ธ์ด "์ธ์ ๋ฐฐ์ ๋์ง"์ ๋ํ ์ ๋ณด๋ ์๋ก ๋ค๋ฅธ ์์ ์ ์ ๋ณด๊ฐ ์ถฉ๋ํ๋ ์ํฉ์ด๋, knowledge edting ์ ์ค์ํ๊ฒ ์์ฉํ ๊ฒ์ผ๋ก ์์๋จ โข ์ฝ์ : ๋๋ฌด ์ธ์์ ์ธ ๋ฐ์ดํฐ์ ๋๋..? ๋ฐ์ดํฐ๊ฐ ์์ ํ ๋ ๋ฆฝ์ด๋ผ๋ ์ ๊ณผ ์ค์ ์ฌ์ ํ์ต ๋ฐ์ดํฐ์๋ ๋ ธ์ด์ฆ / ์์๊ฐ ์์ฌ์์ํ ๋ฐ... real-world corpus์๋ ์ด๊ฒ ์ ์ง๋ ์ง ์๋ฌธ์ด ๋ฆ. โข ๋ณด์์ : ๋ณด๋ค ํ์ค์ ์ธ ๋ฐ์ดํฐ (๋ ธ์ด์ฆ or ์ค๋ณต ๋ฐ์)๋ฅผ ํ์ฉํ ์คํ | 3.5 |
| ํ์ฝ | โข ์ฅ์ : ํ์ต ์์๋ฅผ LLM์ด ์ธ์ํ๋ค๋ ์๋ก์ด ๋ฐ๊ฒฌ โข ๋จ์ : ๊ฐ์ค์ ๊ทผ๊ฑฐ๊ฐ ์ฝํด์์ธ์ง ์คํ๊ฒฐ๊ณผ๋ฅผ ๋ด๋ ๋ฉ๋์ด ์ ์๊ฐ๋๋ฐ, ์คํ ์ค์ ์ด ๋ ๋ค์ํ๋ฉด ์ข๋ ์ค๋๋์ ๋ฏํจ โข ๋ณด์์ : ๋ชจ๋ธ์ด ํ์ต ์์๋ฅผ ์ ์ธ์ฝ๋ฉํ๊ณ ์์๊น? ๊ทธ ์ ๋ณด๋ฅผ ์ด๋ป๊ฒ ํ์ฉํ ์ ์์๊น? โ ๊ด๋ จ ํด์ | 3.5 |
| ์ด์ฝ๋ฆฟ | โข ์ฅ์ : ๋ชจ๋ธ์ด ์ธ์ ๋ฐฐ์ ๋๊ฐ๋ผ๋ ์ง๋ฌธ ์์ฒด๊ฐ ์ ์ ํ์. training order๊ฐ activation ๊ณต๊ฐ์ ์ ํ์ ์ผ๋ก ์ธ์ฝ๋ฉ๋๋ค๋ ๊ฒ ์ง๊ด์ ์ผ๋ก ์ ์๋ฟ์์ โข ์ฝ์ : ์คํ์ด alias๋ก ๋ฐ๊พผ ์ธ์์ ์ธ ๋ฐ์ดํฐ์ ์์๋ง ์ด๋ฃจ์ด์ก๋๋ฐ, ์ค์ ์ฌ์ ํ์ต ๋ฐ์ดํฐ์ฒ๋ผ ๋ ธ์ด์ฆ๊ฐ ๋ง๊ณ ์์๊ฐ ๋ค์์ธ ํ๊ฒฝ์์๋ ๊ฐ์ ํ์์ด ๋ํ๋๋์ง ์ ์ ์์. โข ๋ณด์์ : ์ค์ ์ฌ์ ํ์ต ํ๊ฒฝ๊ณผ ๋น์ทํ๊ฒ ๋ ธ์ด์ฆ๋ ์ค๋ณต์ด ํฌํจ๋ ๋ฐ์ดํฐ๋ก๋ ์คํํด๋ณด๋ฉด ์ข์๊ฒ ๊ฐ์. | 3.5 |
| ํ์ด์ด | โข ์ฅ์ : ๋ชจ๋ธ์ด ์ธ์ ๋ฐฐ์ ๋์ง์ ๋ํ ์ ๋ณด๋ฅผ LLM์ด ์ธ์ํ ์ ์๋ค๋ ๋ฐ๊ฒฌ์ด ์ฅ์ ์. โข ๋จ์ : ์ธ์์ ์ผ๋ก alias์ timestamp๋ฅผ ์ฌ์ฉํ๋๋ฐ, ์ด๊ฑธ ์ผ๋ฐ์ ์ธ ํ๊ฒฝ์์๋ ์ ์ฉ์ด ๋์ด ์ ํ์ต์ด ๋ ์ง๋ ์๋ฌธ์. โข ๋ณด์: ํ์ต ์์๋ฅผ ์ธ์ฝ๋ฉํ ๋, ์ค์ ์ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ ์คํ์ด ํ์ํ ๊ฒ ๊ฐ์. | 3.7 |
| ๋ฉ์ฟ ๋ฆผ๋ณด | Training trajectory๋ฅผ ๋ด๋ถ์ ์ธ์ฝ๋ฉํ๋๊ฒ ์ ๊ธฐํจ! ๊ฒฐ๊ณผ์ ์ผ๋ก ๋ดค์ ๋ ์์์ ๋ฐ๋ผ ๋ชจ๋ธ์ด ๋ณํ๋ ๊ฒ์ ๋น์ฐํ๋ฐ, ๊ทธ๊ฑธ ์ด๋ค์์ผ๋ก ๋ด์ฌ์ ์ผ๋ก ๊ฐ์ง๊ณ ์๋์ง๋ ์ฝ๊ฒ ๊ฐ์ด ์กํ์ง๋ ์์. ์ด๋ฏธ ์ปค๋ฆฌํ๋ผ ๋ฌ๋ ๋ฑ์ผ๋ก trajectory์ ๋ํ ์ต์ ํ ์ฐ๊ตฌ๋ ๋ง์ด ๋์ด ์์ด์, ์ด ์ฐ๊ตฌ ์ด๋๋ค๊ฐ ์จ๋จน์์ง๋ ๋ชจ๋ฅด๊ฒ ์. unlearningํ ๋ training ์ด๊ธฐ์ ๋ฐฐ์ด๊ฒ๊ณผ ํ๊ธฐ์ ๋ฐฐ์ด๊ฒ ์ค ์ด๋๊ฑธ ์ ์๋์ง ๋ณผ ์ ์์ด์ ๊ฑฐ๊ธฐ์๋ค ์จ๋จน์ ์ ์์ผ๋ ค๋ | 3.7 |
TL; DR
์ธ์ด ๋ชจ๋ธ์ โ๋ฌด์โ ์ ๋ฐฐ์ ๋์ง์ โ์ธ์ โ ๋ฐฐ์ ๋์ง์ ๋ํด ์๊ณ ์๋ค.
โ ๋ค์ํ ํต์ ์คํ์ ํตํด ๊ฒ์ฆํด๋ณด์ ! !
Summary
- github : x
- ์ธ์ฉ์ : 2
Background & Motivation
- LLM์ ๋ํด์ ๋ณดํต โKnowledge์ ๋ํด ์๋๊ฐ?โ ์ ์ง์คํ์ง๋ง, โknowledge๋ฅผ ์ธ์ ๋ฐฐ์ ๋๊ฐ?โ ์ ๋ํด์๋ ํ๊ตฌํ์ง ์์๋ค.
โ ๋ฐ๋ผ์, โ๋ฌด์์ ์๋์งโ์ ๋ํด, ๋ชจ๋ธ์ด ํ์ตํ๋ ๋ชจ๋ ๋ฐ์ดํฐ์ ๋ํด ์๋ฌต์ ์ผ๋ก timestamp๋ฅผ ์ฐ์ ์ ์๋ค๋ฉด ์ด๋ป๊ฒ ๋ ๊น??
LLM์ด ๋จ์ํ โ๋ฌด์โ์ ์๋์ง๋ฅผ ๋์ด์,
โ์ธ์ โ ๋ฐฐ์ ๋์ง์ ๋ํ ์ ๋ณด๊น์ง LLM ๋ด๋ถ์ ์ผ๋ก ๊ตฌ๋ถํ๊ณ ์์ ๊ฐ๋ฅ์ฑ์ ํ๊ตฌํด๋ณด์.
Contributions (What theyโve revealed)
- Training-order(ํ๋ จ ์์ ์ ๋ณด)๊ฐ LLM์ activation(hidden vector)์ Linearํ๊ฒ ์ธ์ฝ๋ฉ๋๋ ๊ฒ์ ์ฒ์์ผ๋ก ๋ณด์ฌ์ฃผ์๋ค.
- ์ด๋ฌํ ์ธ์ฝ๋ฉ ์ ๋ณด๋ โ์ต์ ์ฑ(recency)โ์ ๋ํ๋ธ๋ค.
- โ์ต์ ์ฑ(recency)โ ์ ๋ณด๋ ๋จ์ํ artifact๊ฐ ์๋๋ผ, ์ค์ representation ์ ๋ณด์ด๋ค.
โ ๋จ์ํ๊ฒ ๋์จ ์ ๋ณด๊ฐ ์๋๋ค!
- โ์ต์ ์ฑ(recency)โ ์ ๋ณด๋ ๋ชจ๋ธ์ด ์ง์ ํ์ฉํ ์ ์๋ค!
Experimental Setup
๋ชจ๋ธ์ด ์ธ์ ๋ฐฐ์ ๋์ง, ๊ธฐ์ตํ๋์ง ํ์ธํ๊ธฐ ์ํด training order๋ฅผ ํต์ ํด์ผ ํ๋ค.
- ๋ฐ์ดํฐ์
: ์ ๋ช
์ธ entity ๊ธฐ๋ฐ์ QA ๋ฐ์ดํฐ์
โ entity๋ ์ด 16000๊ฐ๊ฐ ์กด์ฌํ๊ณ , ๊ฐ entity๋ณ 6๊ฐ์ ๊ณ ์ QA ์ง๋ฌธ์ด ์กด์ฌํจ.
(์ธ์ , ์ด๋์ ํ์ด๋๊ณ ์ฌ๋งํ๋์ง, ๋ฌด์์ ํ๋์ง..๋ฑ๋ฑ)
- QA ๋ฐ์ดํฐ์
์ ์กด์ฌํ๋ ๋ชจ๋ entity๋ฅผ alias๋ก ๋ฐ๊ฟ โ Synthetic
e.g,.) Einstein โ sjdfef(๋๋ค ํ ํฐ)
โ Pretrained model์ knowledge ์ํฅ์ ์ ๊ฑฐํ๊ธฐ ์ํจ.
(Pretrained model์ด Einstein์ ๋ํ ์ง์์ ๊ฐ์ง๊ณ ์์ ์ ์๊ธฐ ๋๋ฌธ์, ์๋ก์ด ํ ํฐ์ผ๋ก ๋ฐ๊ฟ)
๊ทธ๋ฆฌ๊ณ ๊ณ ์ ๋ ์ง๋ฌธ templete์ธ์๋ Natural ํ ๋ฒ์ ์ ์ง๋ฌธ๋ ์ถ๊ฐํจ.
- Test sample ์์ฑ
=Test sample์ training์ ์ผ๋ QA ํ ํ๋ฆฟ์์ alias๋ ๊ณ ์ ํ๊ณ , ํ ํ๋ฆฟ๋ง ๋ฐ๊ฟ์ ๋ง๋ ๋ค.
(์ฆ, fine-tuning์ ์ฌ์ฉํ๋ entity=alias๋ฅผ ๊ฐ์ง๊ณ , โ๋ค๋ฅธ ํํ์ ์ง๋ฌธโ์ผ๋ก ๋ค์ ๋ฌผ์ด๋ณด๋ sample)
โญ sample์ ๋ง๋ค ๋๋ ํ ํฐ ๊ธธ์ด, ์์น, ๊ฐ์ ์ง๋ฌธ ํ ํ๋ฆฟ์ ์ฌ์ฉํด์ผ ํ๋ค.
(์กฐ๊ฑด์ ๋ง์ถฐ์ฃผ๊ธฐ ์ํด์!)
- ์ ์ฒด entity๋ฅผ ๊ทธ๋ฃน์ผ๋ก ๋๋.
<E>์ ์ฒด entity๋ฅผ ๏ปฟ ๊ทธ๋ฃน(์งํฉ)์ผ๋ก ๋๋๋ค. ๊ฐ ์งํฉ์ ๋ ๋ฆฝ์!
(์ฌ๊ธฐ์ m์ 2 ๋๋ 6์ ์ฌ์ฉํ๋ค๊ณ ํจ)
- ์ ์ฒด entity์ ๋ํด QA ๋ฐ์ดํฐ์
์์ฑ
<D>๏ปฟ ์ ๋ฑ์ฅํ๋ ๋ชจ๋ entity(alias)๋ฅผ ํฌํจํ๊ณ ์๋ QA ์ง๋ฌธ์ QA ๋ฐ์ดํฐ์ ์์ ๊ฐ์ ธ์ค๊ณ ,
๏ปฟ QA ๋ฐ์ดํฐ ๋ถ๋ถ์งํฉ์ ๋ง๋ ๋ค!
- ๏ปฟ QA ๋ฐ์ดํฐ์
์ ํตํด ๋ชจ๋ธ Fine-tuning.
๏ปฟ ์์๋๋ก Llama ๋ชจ๋ธ์ ๋ฐ์ดํฐ์ ๋ณ๋ก 5 epoch์ฉ ํ์ต์ ์ํด.
(D1 = 5 epoch / D2 = 5 epoch / โฆ. / Dm = 5 epoch)
์์๋๋ก!!
- ํ์ต๋ ๋ชจ๋ธ์ Test_sample์ ๋ฃ์
๏ปฟ ๊ณผ ๋ค๋ฅธ ํํ์ ์ง๋ฌธ์ alias๋ ๊ทธ๋๋ก ์กด์ฌํ๋ QA test sample์ ๋ฃ๋๋ค.
- ๊ฐ ์
๋ ฅ์ ๋ํ activation์ ๋ฝ๋๋ค.
์ ๋ ฅ๋ง๋ค Layer๋ณ๋ก ํ ํฐ๋ณ hidden vector๋ฅผ ๋ฝ๋๋ค.
(N-layers x N_tokens)๊ฐ ๋ฒกํฐ
- ๋ฐ์ดํฐ์ ๋ณ๋ก ๋์จ activation๋ค์ ํ๊ท ์ ๋ด์ centroid๋ฅผ ๊ตฌํ๊ณ , ์ง์ ์์ ๋ํ๋ธ๋ค.
- ๋ง์ปค์ ์๋ฏธ : Test_sample์ ์ฌ์ฉ๋ ์ง๋ฌธ ํ ํ๋ฆฟ์ ๋ค๋ฅด๊ฒ ์ค์ ํ ๊ฒ
- x์ถ : c1โc6์ผ๋ก ๊ฐ๋ ๋ฐฉํฅ๋ฒกํฐ์ ๋ชจ๋ centroid๋ฅผ ์ ์ฌ์์์ผ์ ์ถ๋ณํ ์ํจ ๊ฒ.
- y์ถ : x์ถ์ผ๋ก ์ค๋ช
๋์ง ์๋ ๋ถ๋ถ์ ๋ํด์ PCA๋ฅผ ์ ์ฉํจ. (ํฐ ์๋ฏธx)
โญ c1~c6 ๋ฐฉํฅ์ ๊ธฐ์ค์ผ๋ก ๋ณผ ๋, ๋ชจ๋ centroid๊ฐ ์์๋๋ก ๋์ด๋ฉด, activation ๊ณต๊ฐ์ ์๊ฐ ์์์ ๋ํ ์ถ์ด ์กด์ฌํ๋ค.
- ์ ์ฒด activation(hidden vector)์ ๊ฐ์ง๊ณ , 8:2 ๋น์จ๋ก train/test๋ก ๋๋์ด์ ์ ํ ๋ถ๋ฅ๊ธฐ์ธ probe๋ฅผ ํ์ตํ๊ณ , test๋ฅผ ํ๊ฐํ๋ค. (์ด ๋๋ ๋ฐ์ดํฐ์
2๊ฐ์ฉ๋ง ๋๊ณ ์ด์ง๋ถ๋ฅ ํ๊ฐ)
e.g.,) Probe model = ๐บ
Train(5-epochs)
train activation1 โ ๐บ โ D1์ entity
train activation2 โ ๐บ โ D2์ entity
Test
test activation1 โ ๐บ โ D2์ ์๋ entity !
test activation2 โ ๐บ โ D2์ ์๋ entity !
Result
Experimental Setup์ ์คํ๊ฒฐ๊ณผ์ ๋ํด์ ํด์ํด๋ณด์ !
[1] ํ๋ จ ์์(training-order)๋ activation ๊ณต๊ฐ์์ Linearํ๊ฒ ์ธ์ฝ๋ฉ๋๋ค.
training-order๊ฐ activation ๊ณต๊ฐ์์ ํ๋์ ๋ฐฉํฅ์ผ๋ก ํํ๋๋ค. (์์๋๋ก!)
- (a) ํ์ต๋ ์ ํ Probe๋ test entity์ ๋ํด stage ๊ตฌ๋ถ์ ์ํ๋ค! (์ด๋ค stage์ entity์ธ์ง ์ ๋ง์ถค). ๊ทธ๋ฆฌ๊ณ , stage ์ฐจ์ด๊ฐ ํด์๋ก ๋ ๊ตฌ๋ถ์ ์ํ๋ค.
- (b) sample(QA๋ฌธ์ฅ)์ ๋ํ activation์ ๋ณด์์ ๋, alias entity๋ฅผ ์ธ์ํ๊ณ ๋ถํฐ ๋ฒกํฐ๊ฐ์ด ์ปค์ง๋ค. ๋, layer๊ฐ ๊น์ด์ง์๋ก ์ปค์ง๋ค.
[2] ํ๋ จ ์์(๋ฐฉํฅ)์ด๋ผ๋๊ฒ ๋ญ ์๋ฏธ?
[1]์์ ๋ฑ์ฅํ ์ ํ์ ์ธ ์์/๋ฐฉํฅ์ด๋ผ๋๊ฒ ๋ฌด์์ธ์ง ํด์ํด๋ณด์.
๐ก๋ง์ฝ, ํ๋ จ ์์๋ฅผ ๋ชจ๋ธ์ด ์๊ณ ์๋ค๋ฉด, ๊ฐ์ฅ ์ต๊ทผ์ ํ๋ จ์ํจ ๋ฐ์ดํฐ๋ ์ง์ ์ ๊ฐ์ฅ ์ฐ์ธก์ ์์ ๊ฒ์ด๋ค.
โ D1 ~ D6 ๋ก fine-tuningํ ๋ชจ๋ธ์ ์ถ๊ฐ์ ์ผ๋ก, D1 ~ D6๋ฅผ ๋๋คํ๊ฒ ํ๋์ฉ ๋ Fine tuning ํ๊ณ , ์ง์ ์์ ํํํด๋ณด์.
(a) ์ถ๊ฐ๋ก ํ๋ จ์ํจ ๋ฐ์ดํฐ์ ์ activation์ด ๊ฐ์ฅ ์ฐ์ธก์ ์๋ ๊ฒ์ ๋ณผ ์ ์์
(b) ์ํญ์์ ๋ฐ๋ผ ์ด์ ๋จ๊ณ์ centroid์์ ๋ ๋ฉ์ด์ง๋ ๊ฒ์ ํ์ธํ ์ถ๊ฐ ์คํ์.
โ ๋จ์ํ๊ฒ, ์ต๊ทผ์ ํ๋ จ์ํค๋ฉด recency์ธ๊ฑฐ ์๋๊ฐ?
โ D1 ~ D6 ์ ์์ด์(mixing data) โ์์ ์ ๋ณด ์์ดโ ์ถ๊ฐํ์ต์ ํ๋ค๋ฉด?
์๋ training-order๊ฐ ์ฌ๋ผ์ง์ง ์์๊น?
mixing data๋ก ํ์ต ํ, activation์ ๋ณด๋ฉด, training-order๊ฐ ์ฌ์ ํ ์ ์ง๋๋ค.
โ ์ฆ, training-order๋ ๋จ์ํ๊ฒ ์ต์ ์ ๋ณด(recency)๊ฐ ์๋, ๋ชจ๋ธ ๋ด๋ถ์ training-order๋ฅผ ๋ ๊น๊ฒ ์ ์ฅํ๊ณ ์์.
๐กtraining order๋ ๋จ์ recency ์ ๋ณด๊ฐ ์๋,recency ์ ๋ณด + ๋ชจ๋ธ ๋ด๋ถ์ ๋ณต์กํ history ์ ๋ณด๋ฅผ ์๋ฏธํ๋ค.
[3] ํ๋ จ ์์๋ ์ฐ์ฐํ ๋ฐ์ํ๋๊ฒ ์๋๋ค.
๊ธฐ์กด ์คํ์์๋ Llama-3.2-1B ๋ชจ๋ธ์ ์ฌ์ฉํ์ง๋ง,
- Qwen2.5-0.5B / 1.5B / 3B ๋ชจ๋ธ๋ณ๋ก ๋ฐ๊ฟ์ ์คํ์ ์งํํด๋ณด๊ณ ,
- Full Fine Tuning์ด ์๋๋ผ, LoRA๋ฅผ ์ฌ์ฉํด๋ณด๊ณ ,
- epoch์๋ฅผ ์ค์ด๊ณ , ๋ฐ์ดํฐ ์๋ฅผ ๋๋ ค์ ์คํํด๋ด๋
โ training-order๋ ๋ฐ์ํ๋ค.
(ํ๋ผ๋ฏธํฐ๊ฐ ์ค์ํ๊ฒ ์๋, ํ์ต ๋ฐ์ดํฐ์ ์์๊ฐ ์ค์ํด ๋ณด์ธ๋ค)
ํ์ต ๋ฐ์ดํฐ ์์๋ฅผ ์์ ๊ณ ํ๋ จ์ ํด๋ณด์.
- D1~D6์ ์์์์ด ๋ฌด์์๋ก ํ์ตํด๋ณด๊ณ ,
- Fine-Tuning์ ํ์ง ์๊ณ ํ์ตํด๋ณด๊ณ ,
- Probe ํ์ต์ label์ ๋๋ค์ผ๋ก ์๊ณ ํ๊ฐ๋ฅผ ํ์ ๋๋
โ training-order๊ฐ ๋ฐ์ํ์ง ์์๋ค.
๐กtraining order๋ ์์ฐจ์ ์ผ๋ก ํ์ต์ด ์์ ๋๋ง ์๊ธด๋ค.
[4] ํ๋ จ ์์๋ entity-level์์ ๊ฐํ๊ฒ encoding๋๋ค.
- ๊ธฐ์กด ๋ชจ๋ธ ํ์ต๋ฐฉ๋ฒ : D1 ~ D6 ๋ฐ์ดํฐ์
๋ณ๋ก Entity๋ง ๋ค๋ฅด๊ณ , ์ง๋ฌธ ํ
ํ๋ฆฟ์ ๋์ผํ์.
โ Entity-level์์ training-order๊ฐ ์ ๋๋ฌ๋ฌ๋ค!
- ์๋ก์ด ์คํ ๋ฐฉ๋ฒ : D1 ~ D6 ๋ฐ์ดํฐ์
๋ณ๋ก Entity๋ฅผ ํต์ผ, ์ง๋ฌธ ํ
ํ๋ฆฟ์ ๋ค๋ฅด๊ฒ ์ค์ .
โ Sample-level(์ง๋ฌธ)์์๋ trainig-order๊ฐ ์ ๋๋ฌ๋ ๊น?
Prob Acuuracy / Level Entity-level Sample-level Accuracy 90% 60% Accuracy(Mixing) 63% 50% ๐กSample-level์์์ Training-Order๋ ์ฝํ๊ฒ ๋๋ฌ๋๋ค.
- ๊ธฐ์กด ๋ชจ๋ธ ํ์ต๋ฐฉ๋ฒ : D1 ~ D6 ๋ฐ์ดํฐ์
๋ณ๋ก Entity๋ง ๋ค๋ฅด๊ณ , ์ง๋ฌธ ํ
ํ๋ฆฟ์ ๋์ผํ์.
[5] ๋ชจ๋ธ์ ์ง์ ๋ด๋ถ์ ์ผ๋ก Training-Order๋ฅผ ์ฌ์ฉํ ์ ์๋ค.
ํ์ต๋ ๋ชจ๋ธ์ ๊ฐ์ง๊ณ , ์ด๋ฏธ Training-Order๋ฅผ ๊ฐ์ง๊ณ ์๋ ์ํ์์
Q : <Which training stage is this <alias> from?>A : D1์ด๋ผ๋ Task๋ฅผ ๋ง๋ค์ด ํ์ต์ ์ํจ๋ค.
์ดํ, ๋ชจ๋ธ์๊ฒ ์ง์ ํ๊ฐ๋ฅผ ์์ผฐ๊ณ , 80%์ ์ ํ๋๋ฅผ ๋ฌ์ฑํจ.
๐กRecency ์ ๋ณด๋ ์ธ๋ถ์ ์ผ๋ก Probe๋ฅผ ๋ฐ๋ก ์ค์ ํ์ง ์๊ณ , ๋ชจ๋ธ๋ ์ง์ ์ฌ์ฉํ ์ ์๋ค.
Simple Explanations cannot fully account for The Effect
์ด๋ฐ Training-order์ ํจ๊ณผ๋ ๋จ์ํ๊ฒ ์ค๋ช ๋๋ ํจ๊ณผ๊ฐ ์๋๋ค!
โ Training order๊ฐ ๋จ์ํ ํต๊ณ์ ์ธ ํน์ง ๋๋ฌธ์ ๋์จ ๊ฒ์ผ์๋ ์์ง ์๋๊ฐ? ํ๋ ํด์์๋๊ฐ?
์ค์ ๋ด๋ถ์ ๊ตฌ์กฐ์ ์ธ ์ ๋ณด๋ก Training order๊ฐ ๋ฐ์ํ ๊ฒ์ธ์ง,
๋จ์ํ๊ฒ ์ฐ์ฐํ ์ธ์์ ์ผ๋ก ๋ง๋ค์ด์ง ๊ฒฐ๊ณผ(=Artifact)์ธ์ง ๊ฒ์ฆํ์.
๋จ์ํ ์ ๋ณด์์ training order๊ฐ ๋์จ ๊ฑด ์๋๋ค.
- Activation์ ํฌ๊ธฐ ๋ถํฌ
D1๊ณผ D2์ ํฌ๊ธฐ๋ถํฌ๊ฐ ๋์ผํ ์ํ์์๋, ์์์ probe์ ๊ฒฐ๊ณผ๋ ์ข์๋ค.
โ ํฌ๊ธฐ๋ถํฌ๋ก Training order๋ฅผ ์ค๋ช ๋ถ๊ฐ.
- PCA(์ฃผ์ฑ๋ถ ๋ถ์)
D1๊ณผ D2์ activation์ ๋ํด ์ฃผ์ฑ๋ถ์ ๋ณด๋ฉด, ๊ตฌ๋ถ์ด ๋์ง ์์
์ฆ, ๋จ์ํ ํน์ง์ด์๋ค๋ฉด, PCA์์ ๊ตฌ๋ถ์ด ๋์์ด์ผ ํ์ง๋ง, ๊ตฌ๋ถ์ด ๋์ง ์์ผ๋ฏ๋ก,
๊ฐ๋จํ ํต๊ณ์ ํน์ง์ด๋ ์ฐ๊ด์ด ์๋ค!
- Cosine similarity
๏ปฟ : D1 ๋ด๋ถ activation๋ค๋ผ๋ฆฌ ์ผ๋ง๋ ๋น์ทํ๊ฐ
๏ปฟ : D2 ๋ด๋ถ activation๋ค๋ผ๋ฆฌ ์ผ๋ง๋ ๋น์ทํ๊ฐ
๏ปฟ : D1๊ณผ D2๊ฐ ์ผ๋ง๋ ๋น์ทํ๊ฐ
cosine similiarity๋ก training order๊ฐ ์ค๋ช ๋๋ ค๋ฉด, ๏ปฟ์ ๊ฐ์ด ํฌ๊ฒ ๋์ค๋ฉด ์๋๋ค.
ํ์ง๋ง, ํฌ๊ฒ ๋์๊ธฐ ๋๋ฌธ์ training order๋ cosine similarity๋ก ํํํ ์ ์๋ค.
- Activation์ ํฌ๊ธฐ ๋ถํฌ
D1,D2๋ฅผ ๋ชจ๋ activation ํต๊ณ์ ์กฐ๊ฑด์ ๋๊ฐ์ด ๋ง์ถ ์ํ์์๋ probe๊ฐ ์๋๋ฉด training order๋ ๋ด๋ถ์ ๋ณต์กํ ๊ตฌ์กฐ ์ ๋ณด๋ก ์ด๋ฃจ์ด์ ธ์๋ค.
training order์ ์ํฅ์ ์ฃผ๋ ์กฐ๊ฑด์ด ์์ง ์์๊น? ์ฌ๋ฌ ์คํ์ ํตํด ํ์ธํด๋ณด๋ ๋จ๊ณ
- Activation(6๊ฐ)
- max value
- L2norm
- mean
- std
- skewness
- kurtosis
- logit(7๊ฐ)
- entropy
- max logit
- logsumexp
- mean
- std
- skewness
- Kurtosis
D1, D2์ ๋ํด ์ ํต๊ณ๋ ํน์ฑ๋ค์ ๋ชจ๋ ๋ง์ถ ์ํ์์ Probe๋ฅผ ํ์ตํ๊ณ ํ๊ฐ.
โ Probe์ ์ฑ๋ฅ์ด ์ข์ผ๋ฉด Training-Order๊ฐ ์๋ ๊ฒ!
์ฆ, ํต๊ณ๋๊น์ง ๋ชจ๋ ์กฐ๊ฑด์ด ๋ง๋ ์ํ์ธ๋ฐ๋, training order๊ฐ ์๋ค๋ฉด, ํต๊ณ๋ ์์ฑ๋ค๊ณผ๋ ์ผ์ ์ฐ๊ด์ด ์๋ค.
- ํต๊ณ๋ ํน์ฑ์ ๋ง์ถ๋ฉด ํ์ต ๋ฐ์ดํฐ์ ๋ถํฌ๊ฐ ๋น์ทํด์ง๋ค. (Activation ํต๊ณ๋์ ๋ํ ์์)
์ด๋ ๊ฒ ํต๊ณ ์์ฑ์ ๋ง์ถ ๋ฐ์ดํฐ๋ฅผ Balancing Data๋ผ๊ณ ํจ์ด๋ป๊ฒ ๋ฐ์ดํฐ๋ค์ ํต๊ณ ์์ฑ์ ๋ง์ถ๊น?
D1, D2 Dataset์ QA Dataset์ ๋ชจ๋ธ์ ๋ฃ์์ ๋ ๋ฐ์ํ Hidden vector๋ค์.
์ด๋ ๊ฒ ์กฐ๊ฑด์ ๋ง์ถ ํ ๋ถ์ ์งํ(๊ฐ์ ํต๊ณ์ ๋ถํฌ๋ฅผ ๋ ๋๋ Training-Order๊ฐ ์๊ธธ๊น?)
- ์์์ ๋ง๋ Balancing data๋ก probe๋ฅผ 4:1 = train / test๋ก ๋๋ ค๋ณด์.
- ๋ํ, ์ถ๊ฐ ์คํ์ผ๋ก Balancing data ์ํ๋ง ์์ ๋ฐ์ดํฐ๋ฅผ ๋ง์ด ๋ฒ๋ ธ๋๋ฐ,
โ๋ฐ์ดํฐ๋ฅผ ๋ง์ด ๋ฒ๋ฆฐ๊ฒ ๋ ์ํฅ์ ์ฃผ์ง ์์๊น?โ ์ ๋ํ ์คํ๋ ํด๋ณด์.
(Random Downsampling)
- ์ 2๊ฐ ๊ฒฐ๊ณผ์ ์๋ ๊ฒฐ๊ณผ๋ฅผ ๋น๊ตํด๋ณด์.
๋ฐ์ดํฐ ๊ท ํ์ ๋ง์ถ balancing data์ ๊ท ํ์ ๋ง์ถ์ง ์๊ณ ๋ฐ์ดํฐ ์๋ง ๋ง์ถ random downsampling ๋ชจ๋ probe์ ์ฑ๋ฅ์ด ์ ์ง๊ฐ ๋์์.
๐ก๊ฒฐ๋ก ์ activation, logit์ ํต๊ณ์ ์ฐจ์ด์ ์ํด training order๊ฐ ์ข์ฐ๋์ง ์๋๋ค!
- Activation(6๊ฐ)
Discussion
๋ง์ ๊ฐ๋ฅํ ๋ณ์๋ค์ ๋ํด์ ํต์ ์คํ์ ํ์์๋, Training-Order๊ฐ ๋จ์์๋ ๊ฒ์ ํ์ธํ๊ณ ,
๋ฐ๋ผ์, Training-Order๋ ๋ชจ๋ธ ๋ด๋ถ์ ์ผ๋ก ๊ตฌ์กฐ์ ์ธ ํน์ง์ ๊ฐ์ง๊ณ ์์.
- Limitation
- 8B ๋ชจ๋ธ์ ์์ ๋ชจ๋ธ๊ณผ ๋จ์ํ ๋ฐ์ดํฐ์ ์ผ๋ก๋ง ์คํ์ ํจ.
- ๋ํ ์ธ์ด ๋ชจ๋ธ์ ๋ํด์๋ง ์คํ์ ํด ์ผ๋ฐ์ฑ์ด ๋ถ์กฑํจ.
- Alias๋ก entity๋ฅผ ๋ฐ๊พธ๊ณ , Fine-tuning์ ํ์ฌ Training-order๋ฅผ ๊ด์ฐฐํ๋๋ฐ,
Pre-Training์์๋ Training-Order๊ฐ ์๋์ง์ ๋ํด ํ์ธํ์ง ์์์.
- Training-Order๋ผ๋ ํ์๋ง ๋ฐ๊ฒฌํ์ง, ์ด ํ์์ด ๋ฐ์ํ ์ ํํ ์๋ฆฌ๋ ํ์ ๋ชปํจ.
- Positive Effect
- Training Data๊ฐ ์๊ฐ์ ์ ๋ณด๋ฅผ ๊ฐ์ง๊ณ ์์ ๋, Training-order๊ฐ Training์ ๋์์ด ๋ ์ ์๊ณ , ๋ ์ข์ ์์ธก์ ํ ์ ์์.
- Future Works
- Pretrainig์์๋ Training-order๊ฐ ์กด์ฌํ๋์ง์ ๋ํ ์คํ ๊ฐ๋ฅ
- ๋ชจ์๋๊ฑฐ๋ ์์ถฉ๋๋ ์ ๋ณด๋ค์ ๋ํด์ Training-Order๊ฐ ์ด๋ป๊ฒ ๋ณํ ์ง ํ์ธ
- ๋ชจ๋ธ์ด ์ค์ ๋ก Training-Order๋ฅผ ์๊ณ , ์ค์ค๋ก ์ ๋ฐ์ดํธ๋ฅผ ์กฐ์ ํ ์ ์์์ง?
- ๋ชจ๋ธ์ด ์์ ์ ๋ต๋ณ ์ํ์ ๋ํ ์ค๋ช ์ ํ ์ ์์์ง?
- Conclusion
์ธ์ด ๋ชจ๋ธ์ โ๋ฌด์โ์ ์๊ณ ์๋์ง์ ๋ํด์ โ์ธ์ โ ๋ฐฐ์ ๋์ง์ ๋ํด์๋ ์ ์ฅ์ ํ๋ค.
์ฌ๋ฌ ํต์ ์คํ์๋ ๋ถ๊ตฌํ๊ณ ์ธ์ด ๋ชจ๋ธ์ Training-Order๋ฅผ ๊ฐ์ง๊ณ ์๋ค.
๐กLLM์ representation์ ๋จ์ํ ์ง์์ ์ ์ฅํ๋ ๊ฒ์ด ์๋,
ํ์ต ๊ณผ์ ์ ์๊ฐ์ ์ธ ์ ๋ณด(=Training Order)๊น์ง ๋ด๊ณ ์๋ ๊ณต๊ฐ์.












