How Do Large Language Monkeys Get Their Power (Laws)?
Review
| ๋๋ค์ | ํ์คํ | ๋ณ์ (0/5) |
|---|---|---|
| ๋ง์คํนํ ์ดํ | ์ด์ ๋ ผ๋ฌธ์ ์ ๋ชจ๋ฅด๋ฉด ์ ์ด ๋ ผ๋ฌธ์ด ๋ฑ์ฅํ๋์ง ์ดํดํ๊ธฐ ์ด๋ ค์ด ๋ ผ๋ฌธ์ด๋ผ๊ณ ์๊ฐํจ. ์ธ์ฌ์ดํธ๊ฐ ํฐ ๋ ผ๋ฌธ์ด๋ผ๋ ์๊ฐ๋ ๋ค์ง ์๊ณ , ๋ ผ๋ฌธ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ํ์ด๊ฐ๋ ๋ฐฉ์์ ์ข์ง๋ง, ๋ ผ๋ฌธ์ ๊ฒฐ๊ณผ๊ฐ ํฐ ๊นจ๋ฌ์์ ์ฃผ์ง ๋ชปํ๋ค๊ณ ์๊ฐํจ. ๋ค๋ง, ์ฐ๋ฆฌ๊ฐ ํ๊ฐํ๋ ๋ง์ ํ๊ฐ์งํ๊ฐ ์ค์ ๋ก ์ํ๋ ์งํ๋ก ๋์ํ๋์ง ํ์ธํด์ผํ๋ค๋ ํ์์ฑ์ ๋ค์ ์๊ฐํ๊ฒ ํ ๋ ผ๋ฌธ. | 3.5 |
| ๋๊น์ค | ์ํ๋ง์ ๋๋ฆด์๋ก ์ฑ๋ฅ์ด power law๋ก ๊ฐ์ ๋๋ ํ์์ ํ์คํฌ ๋์ด๋์ hard tail ๋ถํฌ๋ก ์ค๋ช ํ๋๋ฐ ํต๊ณ์ ์ธ ๊ด์ ์์ ์ ๊ทผํ๋๊ฒ ์ ๊ธฐํ์ง๋ง ์ด๋ ค์ด ๋ ผ๋ฌธ.. | 3.5 |
| ๊ทค | power law๋ฅผ ํตํด์ ํน์ ๋ฐ์ดํฐ์ ๋์ด๋ ๋ถํฌ์ hard tail์ด ์์์ ์์ํ๋ ์ ํธ๋ก ํด์ํ ์ ์๊ฒ ๋ค. ์ ๋ชฉ๋ง ๋ด์๋ LLM์ ๋นํํ๋ ค๋ ์๋์ธ๊ฐ?? ํ๋๋ฐ ๊ทธ๊ฑด ์๋๊ตฌ๋ | 3.8 |
| ์๋ฉด์ฅ์ | ์ ๊ฐ ์ง์ ๊น๋ดค๋ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ๋ค์ ์๊ฐํด๋ณด๋ฉด, ์ค์ ๋ก ๋
ผ๋ฌธ์์ ์ฆ๋ช
ํ ๋ด์ฉ์ด ๊ฒฝํ์ ์ผ๋ก ๋ฏฟ์ด์ ธ์. ๊ทผ๋ฐ ๋ฐ๋๋ก ๊ทธ๋ฐ ๊ฒฝํ์ด ์๋ค๋ฉด ๋
ผ๋ฌธ์ ์ดํดํ๊ธฐ๊ฐ ์ด๋ ค์ธ ๊ฒ ๊ฐ์. ํ์ํ ๋
ผ๋ฌธ์ด๊ธฐ๋ ํ๋ so what?์ด ๋ถ์กฑํจ + ์ ๋ชฉ๊ณผ ๋ด์ฉ์ด ํฌ๊ฒ ๋งค์นญ๋์ง ์๋ค๊ณ ๋๊ปด์ง! | 3.5 |
| ์ด์ดํฐ | ์ ์๋ ค์ง ํ์์ด ๊ทธ๋์ ํด์๊ณผ๋ ๋ค๋ฅธ ์์ธ๊ณผ ๊ด๋ จ๋์์ ๋ฐํ ๋ ผ๋ฌธ. ํ๊ฐ ์งํ ์ฑ๋ฅ๋ค ํ์ธํ ๋ ์ฐธ๊ณ ํ ์ ์์ผ๋ ค๋? | 3.7 |
| 7์ผ | LLM ํฌ๊ธฐ๊ฐ ์ปค์ง์๋ก ์ด๋์ ๋ long-tail ๋ฌธ์ ๋ ํด๊ฒฐํ ์ ์์ง๋ง, ์ฌ์ ํ ๋ ผ๋ฆฌ์ ์ธ ์ถ๋ก ์ ์ฝํ๋ค๋ ์๊ฐ์ด ๋ฆโฆ ์ด๋์ KG, ontology๊ฐ ํ์ํ๊ฐ? | 3.8 |
TL; DR
๐ก
LLM์ ๋ฐ๋ณต ์ํ๋ง ์ฑ๋ฅ์ด power law์ฒ๋ผ ๋ณด์ด๋ ์ด์ ๋ ๋ชจ๋ธ์ ์ถ๋ก ๋ฅ๋ ฅ ๋๋ฌธ์ด ์๋๋ค.
๊ฐ ๋ฌธ์ ๋ ์ด๋ฏธ ์ง์์ ์ผ๋ก(exponentially) ํด๊ฒฐ๋๊ณ ์์ผ๋ฉฐ, ์์์ ๊ทน๋๋ก ์ด๋ ค์ด ๋ฌธ์ ๋ค์ด ๋๊น์ง ๋จ์ ์๊ธฐ ๋๋ฌธ์ ์ ์ฒด ํ๊ท ์ฑ๋ฅ์ด power law์ฒ๋ผ ๋ณด์ผ ๋ฟ์ด๋ค.
โ power law๋ ๋ชจ๋ธ์ ๋ฒ์น์ด ์๋๋ผ, ๋ฌธ์ ๋์ด๋ ๋ถํฌ์ ๊ฒฐ๊ณผ๋ค.
Summary
Background
- Power law: A์ B๊ฐ ๊ฑฐ๋ญ์ ๊ณฑ์ผ๋ก ํํ๋๋ ํจ์์ ๊ด๊ณ
- ์) ํ๋ ํ ๋ฒ์น
- ์์์ ์์ธ์ด ๋๋ค์์ ๊ฒฐ๊ณผ๋ฅผ ๋ณ๋ ๊ฒฝ์ฐ (์ ํํ๋, 20% vs 80%)
- ์๋ฅผ ๋ค์ด, 20%์ ๊ณ ๊ฐ์ด 80%์ ๋งค์ถ์ ๋ฐ์์ํค๋ ๊ฒฝ์ฐ
- ์์์ ์์ธ์ด ๋๋ค์์ ๊ฒฐ๊ณผ๋ฅผ ๋ณ๋ ๊ฒฝ์ฐ (์ ํํ๋, 20% vs 80%)
- ์) ํ๋ ํ ๋ฒ์น
ํท๊ฐ๋ฆฌ๋ ๊ฒ ์กฐ์ฌ! (๋ ผ๋ฌธ๊ณผ ํฐ ๊ด๋ จ ์์ง๋ง, ํท๊ฐ๋ฆด ๊ฐ๋ )
- ํธ์์ก ๋ถํฌ (์ด์ฐ)
- ๊ธฐ์ค ์๊ฐ ๋์ ๋ฐ์ํ๋ ์ฌ๊ฑด ํ์์ ๋ถํฌ
- ์ง์ ๋ถํฌ (์ฐ์) (ํธ์์ก ๋ถํฌ๋ก๋ถํฐ ์ ๋ ๊ฐ๋ฅ) โ ๋ณธ ๋
ผ๋ฌธ๊ณผ ๋ฐ์ ํ ๊ด๋ จ์ ์์
- ๊ธฐ์ค ์๊ฐ ๋์ ์ฒซ ์ฌ๊ฑด์ด ์ผ์ด๋ ๋๊น์ง ๋๊ธฐ์๊ฐ์ ๋ถํฌ
- ๊ฐ๋ ์ ๋น์ทํจ! ๋ณธ ๋ ผ๋ฌธ์ ์ํ ํ์๋ก ๋ฐ์ง๋ฟ
- ๊ธฐ์ค ์๊ฐ ๋์ ์ฒซ ์ฌ๊ฑด์ด ์ผ์ด๋ ๋๊น์ง ๋๊ธฐ์๊ฐ์ ๋ถํฌ
- ๊ธฐํ ๋ถํฌ (์ด์ฐ)
- ๋ณธ ๋
ผ๋ฌธ๊ณผ ๋น์ทํ ๊ฐ๋
!
- ๋์ผํ ์ฑ๊ณต ํ๋ฅ ์ ๊ฐ์ง ๋ฒ ๋ฅด๋์ด ์ํ์์, ์ฒ์์ผ๋ก ์ฑ๊ณตํ๊ธฐ๊น์ง ํ์ํ ์๋ ํ์
- ๋ณธ ๋
ผ๋ฌธ๊ณผ ๋น์ทํ ๊ฐ๋
!
- ํธ์์ก ๋ถํฌ (์ด์ฐ)
Motivation
- ์ต๊ทผ ์ฐ๊ตฌ๋ค์์ ๋ฐํ์ง ์ฌ์ค
- n๋ฒ ์๋ํด์ ํ๋๋ผ๋ ์ฑ๊ณตํ๋ฉด ์ฑ๊ณตํ๋ ์ค์ ์์๋, ํ๊ท ์ฑ๊ณต๋ฅ ์์ ๋ก๊ทธ๊ฐ power law๋ฅผ ๋ฐ๋ฆ
- ๋ฌด์จ ๋ง์ด์ง?
- ์ฌ๋ฌ ๋ฒ ์๋ํ๊ฒ ํ๋ฉด ์ฑ๋ฅ์ด ์ค๋ฅด๊ธด ์ค๋ฆ.
- ๊ทธ๋ฐ๋ฐ, ์ด ์๋๊ฐ ์ฒ์์ ๋น ๋ฅด๋ค๊ฐ ๋์ค์ ์ฒ์ฒํ ์ฌ๋ผ๊ฐ
- n์ ๋๋ฆด์๋ก, ์ฑ๋ฅ ํฅ์์ด (์ข: ์์ ๋ก๊ทธ scale vs ์ฐ: exponential)
- Large Language Monkey?
- Large Language Monkeys: Scaling Inference Compute with Repeated Sampling
- https://ko.wikipedia.org/wiki/๋ฌดํ_์์ญ์ด_์ ๋ฆฌ
โ ์์ญ์ด๊ฐ ํ์๊ธฐ๋ฅผ ๋ฌดํํ ๋๋๋ฆฌ๋ฉด, ํ๋ฅ ์ ์ผ๋ก ์ ฐ์ต์คํผ์ด ํฌ๊ณก ํํธ์ ์ฐ์ง ์์๊น?
- https://ko.wikipedia.org/wiki/๋ฌดํ_์์ญ์ด_์ ๋ฆฌ
- ๋ฌด์จ ๋ง์ด์ง?
- n๋ฒ ์๋ํด์ ํ๋๋ผ๋ ์ฑ๊ณตํ๋ฉด ์ฑ๊ณตํ๋ ์ค์ ์์๋, ํ๊ท ์ฑ๊ณต๋ฅ ์์ ๋ก๊ทธ๊ฐ power law๋ฅผ ๋ฐ๋ฆ
- ๊ทธ๋ฐ๋ฐ, ์ ์ด๋ฌ์ง?
- ์ง๊ด์ ์ผ๋ก ์๊ฐ
- ์ด๋ค ๋ฌธ์ ๋ฅผ A ๋ชจ๋ธ์ด ํ ํ๋ฅ ์ ์๊ฐํด๋ณด๋ฉด, 30%, 1%, 0.1%
- ๋ฌธ์ ํ๋ํ๋๋ ์ฌ๋ฌ๋ฒ ์๋ํ๋ฉด, ์ง์์ ์ผ๋ก ํด๊ฒฐ๋ ๊ฒ์
์ง์์ ์ด๋ค?
- ๋ ๋ฆฝ ์ํ ๋ด ํ๋ฅ ๋ฌธ์ !
- 10%์ง๋ฆฌ ์ฑ๊ณตํ๋ฅ ์ ๊ฐ์ง๋ ์ด๋ค task A๋ฅผ 100๋ฒ ์ํํ๋ฉด, ๊ฐ์ฅ ๋์ ์ฑ๊ณต ํ์๋ฅผ ๊ฐ์ง๋ ์ํํ์๋ ์ธ์ ์ผ๊น? โ ๊ธฐํ๋ถํฌ
- ์ฆ, ์ด๋ ๊ตฌ๊ฐ์์ ๊ฐ์ฅ ๋ง์ด ์ฑ๊ณตํ ๊น?
- ๋์ถฉ ์๊ฐํ๋ฉด 10๋ฒ? but, ์ค์ ๋ 1๋ฒ์.
- ์?
- ์ฒซ๋ฒ์งธ ์ฑ๊ณตํ ํ๋ฅ โ 0.1
- ๋๋ฒ์งธ์ ์ฑ๊ณตํ ํ๋ฅ โ 0.9 * 0.1
- ์ธ๋ฒ์งธ์ ์ฑ๊ณตํ ํ๋ฅ โ 0.9*0.9*0.1
- ์ฆ, ์คํจํ ํ๋ฅ ์ด ๋งค๋ฒ ๋๊ฐ์ด ์ง์์ ์ผ๋ก ๊ณฑํด์ง๋ค. โ exponential
- ๋ฌธ์ ํ๋ํ๋๋ ์ฌ๋ฌ๋ฒ ์๋ํ๋ฉด, ์ง์์ ์ผ๋ก ํด๊ฒฐ๋ ๊ฒ์
- ๊ทธ๋ฐ๋ฐ, ์ ํ๊ท ์ ๋ด๋ฉด ๋๋ ค๋ณด์ด์ง?
- ์ด๋ ค์ด ๋ฌธ์ ๊ฐ ๋ง์์ ๊ทธ๋ฐ ๊ฑด ์๋๊น?
- ์ฌ์ด ๋ฌธ์ 80%, ์ด๋ ค์ด ๋ฌธ์ 19%, ์์ฒญ ์ด๋ ค์ด ๋ฌธ์ 1% ๋ผ๋ฉด?
- ์ฌ์ด ๋ฌธ์ ๋ค์ ์ด๋ฐ์ ๋น ๋ฅด๊ฒ ํด๊ฒฐ, ๋จ์ ์๋ ๋ฌธ์ ๋ ๋งค์ฐ ์ด๋ ค์ด ๋ฌธ์
- ๊ทธ ์ ๋๊ฐ ๋งค์ฐ ์ฌํด์ power law๊ฐ ๋๋ ๊ฒ
- ์ด๋ค ๋ฌธ์ ๋ฅผ A ๋ชจ๋ธ์ด ํ ํ๋ฅ ์ ์๊ฐํด๋ณด๋ฉด, 30%, 1%, 0.1%
- ์ง๊ด์ ์ผ๋ก ์๊ฐ
- ๊ฒฐ๊ตญ, ์ค์ ๋ฌธ์ ๋ ์์ฒญ ์ด๋ ค์ด ๋ฌธ์ ์์๊ฐ ํ๊ท ์ฑ๋ฅ ๋ถํฌ์์์ power law๋ฅผ ๊ฐ์ ํ๋ค.
- LLM์ด ๋ชปํด์ ๋๋ ค์ง๋๊ฒ ์๋๋ค. ๋๊ฐ์ด ํด๊ฒฐํ๊ณ ์๋๋ฐ, ๊ทธ๋ฅ ๋ฌธ์ ๊ฐ ๋๋ฌด ์ด๋ ค์ธ ๋ฟ์ด๋ค.
โ ๊ธฐ์กด ์ฐ๊ตฌ์์ ํ์ธํ ๊ฑด ๋ชจ๋ธ ์ฑ๋ฅ ์งํ๊ฐ ์๋๋ค. ๋ฌธ์ ๋์ด๋ ๋ถํฌ๋ค.
Idea
- ๊ทธ๋ฌ๋ฉด, ๊ฐ ๋ฌธ์ ๊ฐ ์ง์์ ์ผ๋ก ํด๊ฒฐ๋๋์ง ํ์ธํ๊ณ ,
- ์ ์ฒด๋ ์๋ ๊ฒ์ ๋ณด๋ฉด ๋๊ฒ ๋ค?
Method
- ์ ์ฒด ๋ฌธ์ ์ ๋ํ์ฌ, ๊ฐ ๋ฌธ์ ๊ฐ ์ง์์ ์ธ์ง ํ์ธ (exponential)
- MATH, JailBreak
- GPT, Gemini, Claude
โ ๋ชจ๋ ๋ฌธ์ ์์ ํ์ ๋์ผํ๊ฒ ๊ด์ฐฐ
- ํ๊ท ์ฑ๊ณต๋ฅ ์ด power-law๊ฐ ๋๋ ค๋ฉด, ๋จ์ผ ์๋ ์ฑ๊ณต ํ๋ฅ ์ด 0 ๊ทผ์ฒ์์ power-law๋ก ๋ชฐ๋ ค์ผ ํจ
- ์ฆ, hard tail์ด ์์ด์ผ ํจ. ์๋ค๋ฉด? power law X
Results
Insights
- ๊ทธ๋ฐ๋ฐ, ์ด๊ฒ ์ฑ๋ฅ๊ณผ ๋ฌด๊ดํ๋ค๊ณ ํ ์ ์๋?








