AI as Humanityโs Salieri: Quantifying Linguistic Creativity of Language Models via Systematic Attribution of Machine Text against Web Text
Review
| ๋๋ค์ | ํ์คํ | ๋ณ์ (0/5) |
|---|---|---|
| ๋๊น์ค | LLM์ ํ์ต ๊ณผ์ ์์ ์์ฒญ ๋ง์ ์ธ๊ฐ ํ ์คํธ๋ฅผ ํ์ตํ๊ธฐ ๋๋ฌธ์ ์๋ฏธ ๊ณต๊ฐ์์ ์ธ๊ฐ ์ธ์ด ๋ถํฌ์ ์ค์ฌ์ ๊ฐ๊น์ด ์ถ๋ ฅ์ ๋ด๋ ๊ฒฝํฅ์ด ์๋ค๊ณ ์๊ณ ์๋๋ฐ ์ด๋ฌํ LLM์ ์ํคํ ์ฒ์ ์ธ ๋ฌธ์ ์์ ์ด๋ป๊ฒ ์ฐฝ์์ ์ธ ๋ต๋ณ์ ๋ด๋์ ์ ์์๊น๋ผ๋ ๊ถ๊ธ์ ์ด ์๊น. + ๋ค์ํ ๋ถ์ผ์ ์ง์์ ์๋ฉด ๋ ผ๋ฌธ์ ์ธ ๋ ๋ ์ ์ ์๊ฒ ๋ค๋ผ๋ ์๊ฐ์ด ๋ฆ | 3.8 |
| ๋ง์คํนํ ์ดํ | ์ฐฝ์์ฑ์ ํ๊ฐํ๋ ๋ฐฉ์์ ์ ๋ชจ๋ฅด๊ฒ ๋ค. ๊ณ ์ ์๊ฐ๊ฐ ์ ๋์จ ๊ฑด ๊ทธ๋ฅ ๊ณ ์ ๋ฌธํ ์คํ์ผ์ ํ ์คํธ๊ฐ ํ์ต ๋ฐ์ดํฐ์ ์ ๊ฒ ๋ถํฌํ๊ณ ์์ด์ ๊ทธ๋ฐ ๊ฑด ์๋๊น? ๋ผ๋ ์๊ฐ๋ ๋ค์์. ์๋ฅผ ๋ค์ด ํํ์ง๋ฉด ๋ ์ฐฝ์์ ์ธ๊ฑด๊ฐ? ์์ด๋์ด๋ ํฅ๋ฏธ๋กญ์ง๋ง, ์์ง์ ๋ถ์กฑํ ์ฐ๊ตฌ๋ผ๋ ์๊ฐ์ด ๋ค์์. (๋ ผ๋ฌธ์ ์ ์จ์ ์ปค๋ฒํ๋ ์ถ๊ธฐ๋ ํจ) | 3.5 |
| ๊ทค | '์ฐฝ์์ฑ์ ์ธก์ ํ๋ค'๋ผ๋๊ฒ ์์ฒด๊ฐ ์ ๋ง ์ ๋งคํ๋ค๊ณ ์๊ฐ์ ํด์์๋๋ฐ, ๊ธฐ์กด์ ์ผ๋ง๋ ์์๋๋~ ๊ด์ ์ผ๋ก ๋ฐ๋ผ๋ณด๋ฉด ๋๊ฒ ๊ตฌ๋. ๊ทผ๋ฐ ์ด๋ค reference corpus๋ฅผ ๊ธฐ์ค์ผ๋ก ์ผ๋๋์ ๋ฐ๋ผ ํ๊ฐ๊ฐ ๋ฌ๋ผ์ง ์ ์๋ค๋ ์๊ฐ์ด ๋ ๋ค. ๋ ํํธ์ผ๋ก๋ ๋ชจ๋ธ์ ๊ณ ์ ๋ ํ ํฐ ์งํฉ๊ณผ ๊ทธ ์กฐํฉ์ ํตํด ๋ฌธ์ฅ์ ์์ฑํ๋๋ฐ, ์ด๊ฒ๋ค์ ์ผ๋ง๋ ์๋กญ๊ฒ ์กฐํฉํ๋๋์ ๋ฌธ์ ๋ก ๋ณผ ์ ์์ง ์์๊น? | 4 |
| ์๋ฉด์ฅ์ | reference corpus์์ ์ฐจ์ด์ ์ผ๋ก ํ๋จํ๋๊ฒ ์ต์ ์ผ๊น? ๊ทธ ์์์ factuality๊ฐ ์์๋ ์ ์์ง ์์๊น? ๋ฌผ๋ก unrealisticํ ์์ฑ์ ํด๋ด๋ ๊ฒ์ด ์ฐฝ์์ฑ์ ์ฒ๋์ธ ๊ฑด ๋ง์ง๋ง, ๋จ์ํ fact๋ง ๋ค์ง์ด๋ ์ฐฝ์์ฑ์ด ๋์์ง ์ ์์๊น? (e.g. ์ด๊ฒฝํธ ๊ต์๋์ ์ฐ๋์์ ํ์๋ฐ์ ํ์ จ๋ค โ ์ด๊ฒฝํธ ๊ต์๋์ ๊ฒฝํฌ๋์์ ํ์ฌ๋ฅผ, ๊ณ ๋์์ ์์ฌ๋ฅผ, MIT์์ ๋ฐ์ฌ๋ฅผ ํ์ จ๋ค) | 3 |
| ์ด์ดํฐ | ์ฐฝ์์ฑ ํ๊ฐ ๋ฐฉ๋ฒ์ ์น ํ ์คํธ ๋ ํผ๋ฐ์ค ๊ธฐ์ค์ผ๋ก ๊ตฌํํ๋ค๋ ๊ฒ, ๋ฉ๋ ๊ฐ๋ฉด์๋ ๋๊ฒ ์ ๋ฐํ ์๊ฐ๊ฐ๋ค. LLM์ด ์ค์ ๋ก ๋ฌ๊ธ์์ด ์น ์ฝํผ์ค ๋ฐ๋ผ ๋งํ๋ ๊ฒฝ์ฐ๋ ๋ง์ผ๋๊น ์ด๋ฐ ์ค๋ฅ ๊ณ ์น๋ ๊ฑฐ๋๋ ๊ด๋ จ์ง์ด ๋ณผ ์ ์์ ๊ฒ ๊ฐ๊ณ , ์ฐฝ์์ฑ ์งํ๋ฅผ ๋ ๋ณด์ํ ์ฌ์ง๊ฐ ๋ง์ ๋ณด์ด์ง๋ง ์ ๋ฐํ ์ ์์ธ ๋ฏํ๋ค | 4 |
| 7์ผ | ์ฐฝ์์ฑ ์งํ๋ hallucination score๋ ๋ฐ์์ ์ผ๋ก ๋น์ทํ ๋๋์ด ๋ค์๋ค. ๋ ํผ๋ฐ์ค๋ ๋์ผํ ์๋ก ์ ํ๋ ๊ด์ ์์๋ ์คํ๋ ค ์ข์๋ฐโฆ ์ด๊ฑธ ํจ๊ป ๊ณ ๋ คํ์ผ๋ฉด ํ๋ ์์ฌ์์ด ์กด์ฌํจ. | 3.5 |
| ์ฌ๊ณผ | ์ฐฝ์์ฑ ํ๊ฐ ๋ฐฉ๋ฒ์ Reference Corpus๋ฅผ ๊ธฐ์ค์ผ๋ก ์ผ๋ ๊ฒ์ ์กฐ๊ธ ์๋ฌธ์ด ๋ค๊ธฐ๋ ํจ. ์ ํ๋์ Hallucination ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ฉด์ ์ฐฝ์์ฑ์ ๋์ด๋ ๋ฐฉ๋ฒ๋ ์๋์ง.. | 4 |
TL; DR
LLM์ ์ฐฝ์์ฑ์ผ๋ก ์ฌ๋์ ๋ฐ๋ผ์ก์ ์ ์์๊น? โ ใดใด์์ง
์ฐฝ์์ฑ์ ๊ธฐ๋ฐ์ผ๋ก LLM๊ณผ ์ฌ๋์ ๊ตฌ๋ถํ ์ ์์๊น? โ ์
๊ฐ๋ฅ
Summary
- github: x
- ์ธ์ฉ์: 14
Main Idea
โLLM์ ์ฐฝ์์ฑโ์ ์ด๋ป๊ฒ ์ ๋ํํ ๊ฒ์ธ๊ฐ?
๋จ์ํ ์ฌ๋์ด ํ๊ฐํ๊ธฐ์๋ ๋ชจํธํ๊ณ ํ์ฅ์ฑ์ด ๋จ์ด์ง๋๊น ์งํ๋ฅผ ๋ง๋ค๊ณ , ์ ํ์ฉํด๋ณด์
Background & Motivation
- LLM์ด ์ฐฝ์๋ ฅ์ ์ํ๋ ๋ง์ ์ง์
์ ๋์ฒดํ๋ ์ฌ๋ก๊ฐ ๋ฐ์ํจ
- e.g. ์นํฐ, ์์, ์๊ฐ ๋ฑ๋ฑ
- ์ค์ ๋ก ํ ๋ฆฌ์ฐ๋ ์ฃผ์ ์คํ๋์ค๋ค์ด ์๋๋ฆฌ์ค ์์ฑ ๋ฑ์ ์ ์๊ณผ์ ์ LLM์ ๋์ ํจ
โ LLM์ ๊ทธ ์ด๋ค ์ฌ๋๋ณด๋ค ๋ง์ ์ํ์ ์ ํด์๊ธฐ์(ํ์ตํ๊ธฐ์), ์๋ก์ด ์ฐจ์์ ์ฐฝ์์ฑ์ ๋ฌ์ฑํ ์ ์์ง ์์๊น?
โ ๊ณผ์ฐ LLM์ด ์ฌ๋์ ์ฐฝ์์ฑ์ ๋์ ์ ์์๊น?
- ์ฐฝ์์ฑ์ ์ ๋ํ ๋ฐ ๋น๊ต๊ฐ ์ด๋ ค์
- ๊ทธ๋์ ๋ค์ํ ์๋๊ฐ ์์์ผ๋ (e.g. Torrance Test of Creative Thinking) ๋ชจ๋ human annotator์ ์์กดํจ
โ ์ฃผ๊ด์ ์ด๊ณ , cost๊ฐ ๋๋ฌด ํผ
- ๊ทธ๋์ ๋ค์ํ ์๋๊ฐ ์์์ผ๋ (e.g. Torrance Test of Creative Thinking) ๋ชจ๋ human annotator์ ์์กดํจ
Contributions (What theyโve revealed)
์ฌ๋๊ณผ ๊ธฐ๊ณ์ ์ฐฝ์์ฑ์ ๊ดํ ์ธ์ฌ์ดํธ๋ฅผ ์ ๊ณตํ๊ธฐ ์ํด, ์ฐฝ์์ฑ์ ์ธก์ ํ๋ ์งํ์ธ
CREATIVITY INDEX์ ์CREATIVITY INDEX๋?- โweb์ ์กด์ฌํ๋ human-written text๋ฅผ ์ผ๋ง๋ ์ฝ๊ฒ ์ฌ๊ตฌ์ฑํ ์ ์๋๊ฐโ
- ์ด๋ค LLM์ด ์์ฑํ ํ
์คํธ๊ฐ, ๋ฌธ๋งฅ์ด ๊ธด๋ฐ(n-gram์ n์ด ์ปค์ง) web์ ๊ฑฐ์ ๊ทธ๋๋ก ์กด์ฌํ๋ ํ
์คํธ๋ผ๋ฉด, ๊ทธ LLM์ ๋ ์ฐฝ์์ ์
- ๋ง์ฝ ํ
์คํธ๊ฐ reference corpus์ ๊ทธ๋๋ก ์กด์ฌํ๋ค๋ฉด,
CREATIVITY INDEX=0
- ๋ง์ฝ ํ
์คํธ๊ฐ reference corpus์ ๊ทธ๋๋ก ์กด์ฌํ๋ค๋ฉด,
- ๋ฐ๋๋ก, ๋ฌธ๋งฅ์ด ๊ธธ์ด์ก๋๋ฐ, web์์ ์ฐพ์ ์ ์๋ ๊ตฌ๊ฐ์ด ๋ง์ ํ ์คํธ๋ฅผ ์์ฑํ๋ค๋ฉด, ๊ทธ LLM์ ๋ ์ฐฝ์์ ์ด๋ค
** ์ธก์ ํ ๋, reference corpus๋ก RedPajama๋ฅผ ์ฌ์ฉํจ
- why? ๋ค์ํ domain์ ํฌํจํ๋ large-scale web text corpus๋ผ์
- ์ด๋ค LLM์ด ์์ฑํ ํ
์คํธ๊ฐ, ๋ฌธ๋งฅ์ด ๊ธด๋ฐ(n-gram์ n์ด ์ปค์ง) web์ ๊ฑฐ์ ๊ทธ๋๋ก ์กด์ฌํ๋ ํ
์คํธ๋ผ๋ฉด, ๊ทธ LLM์ ๋ ์ฐฝ์์ ์
- ๋จ์ํ score๊ฐ ์๋๋ผ, ๋ค์ํ n์ ๊ธธ์ด์ ๋ํด ์ธก์ ํจ
- ํ ์คํธ๊ธธ์ด/์คํ์ผ์ ์ํฅ์ ๋ ๋ฐ๋๋ก ํ๊ธฐ์ํจ
- โweb์ ์กด์ฌํ๋ human-written text๋ฅผ ์ผ๋ง๋ ์ฝ๊ฒ ์ฌ๊ตฌ์ฑํ ์ ์๋๊ฐโ
- professional writers ๋ฑ ์ฌ๋์ด LLM๋ณด๋ค ํ๊ท ์ ์ผ๋ก 66.2% ๋์ ์ฐฝ์์ฑ์ ๊ฐ์ง์ ๋ฐํ๋
verbatim ์์ค๊ณผ semantic ์์ค ๋ชจ๋์์
- verbatim: ์์ ํ ๋์ผํ n-gram์ด ํฌํจ๋๋์ง
- semantic: ์๋ฏธ์ ์ผ๋ก ๋งค์ฐ ๊ฐ๊น์ด n-gram์ด ํฌํจ๋๋์ง
- Word Moverโs Distance๊ฐ threshold ์ดํ์ด๋ฉด semantic match๋ก ํ์
- verbatim ์์ค๋ง์ ๋์์ผ๋ก ํ์ ๋(+52.2%) ๋ณด๋ค, semantic ์์ค๊น์ง ํจ๊ป ๊ณ ๋ คํ์๋ (+102.5%) ์ธ๊ฐ์ ์ฐฝ์์ฑ์ด LLM๋ณด๋ค ๋์์
- RLHF๊ฐ LLM์ CREATIVITY INDEX๋ฅผ ํ๊ท 30.1% ๊ฐ์์ํด
- RLHF์์ฒด๊ฐ, LLM์ด ์ธ๊ฐ์ ์ ํธ๋๋ก align๋์์ ํ ๋๊น,,,
- ๋ค์ํ ์ธ๊ฐ ์ง๋จ๊ฐ์ CREATIVITY INDEX ๋น๊ต
ํ๋ฐ์จ์ด, ๋ํจ์ค ๊ฐ์ ๊ณ ์ ๋ฌธํ์๊ฐ๋ ๊ฐ์ฅ ๋์ ์์ค์ ์ฐฝ์์ฑ ๋ณด์
- Details
- Books published in 2023: BookMIA dataset
- Classic Literature: ์ ๋ช ์๊ฐ์ ๊ณ ์ ๋ฌธํ
- Popular Teen Fiction: Goodreadsโ book list๋ก๋ถํฐ ๊ฐ์ ธ์จ ์ถ์ถํ ์ธ๊ธฐ ์ฒญ์๋ ์์ค๋ค
- Insights
- ์ฐฝ์์ฑ ๋ฟ ์๋๋ผ ์๊ฐ์ ๋ฌธ์ฒด, ์งํ์๊ธฐ ๋ฑ์ ์์ธ์ ๋ฐ์ ์๋ ์๊ธด ํจ
- ๊ฐ category ๋ด์์๋ ์ฐฝ์์ฑ ์ง์ ํธ์ฐจ๊ฐ ํผ
- e.g. Popular Teen Fiction ์ค 'ํ๊ฑฐ ๊ฒ์'์ ์ฐฝ์์ฑ ์ง์๋ 'ํธ์์ผ๋ผ์'๋ณด๋ค 35.4% ๋ ๋์
- Details
- ๋น๊ณต๊ฐ ๋ฐ์ดํฐ๋ก ํ์ต๋ GPT4์ ๊ฒฝ์ฐ,
CREATIVITY INDEX๋ฅผ ์ฐํ์ ์ผ๋ก ์ธก์ ํ์ฌ ๋ถ์- ๋ค๋ฅธ LLM๊ณผ ๋ฌ๋ฆฌ, GPT4๋ Redpajama๋ณด๋ค ์ต์ /๋น๊ณต๊ฐ ๋ฐ์ดํฐ๋ก ํ์ต๋์๊ธฐ ๋๋ฌธ
- GPT-4์ ์ ์ฌํ knowledge update ์๊ธฐ์ธ ๊ณต๊ฐ๋ชจ๋ธ(Gemma-7B, Llama3-8B, Mixtral-7B)์ด ์์ฑํ, โmodel-generated reference corpusโ๋ฅผ ์ฌ์ฉํ์ฌ ํ๊ฐ
(1) RedPajama ์ฝํผ์ค์์ 15๋ง ๊ฐ์ ๋ฌธ์ฅ์ ๋ฌด์์๋ก ์ถ์ถ
(2) ๊ณต๊ฐ๋ชจ๋ธ๋ค์๊ฒ, ๊ฐ ๋ฌธ์ฅ ๋ค์ ์ด์ด์ง ๊ธ์ ๋ฌธ์ ์์ค์ผ๋ก ์์ฑํ๋๋ก ํจ
Please generate a continuation for the following sentence: [PROMPT SENTENCE](3) ์ด ํ ์คํธ๋ฅผ reference corpus๋ก ๋๊ณ CREATIVITY INDEX ์ธก์
- ์ธ๊ฐ์ ํ๊ท ์ฐฝ์์ฑ ์ง์๋ GPT-4๋ณด๋ค 30.3% ๋ ๋์
LLM ๋ฒ์ ์ ๋ฐ์ดํธ์ ํ์ฉํ๋, ์น์์ ๊ธฐ์กด text snippets์ ์ฌ์ฉ ๋ด์ญ์ ์ถ์ ํ๋ ์๊ณ ๋ฆฌ์ฆ์ธ
DJ SEARCH์ ์CREATIVITY INDEX๋ฅผ ์ํด reference corpus๋ฅผ ์ฐพ์ ๋, brute force๋ก ํ๋ฉด ๋๋ฌด ๋น์ธ์ ํจ์จ์ ์ผ๋ก ์ฐพ์ผ๋ ค๊ณ !๋ ํผ๋ฐ์ค corpus๋ฅผ ์ฐพ๋๊ฒ DJ๊ฐ ๋ฆฌ๋ฏน์ค ํ ๋ original composer์ creditํ๋ ๊ฒ๊ณผ ์ ์ฌํ๋ค๊ณ ์๊ฐํด์ ์ด๋ ๊ฒ ์ง์๋ค๋ค์
- ๋ชจ๋ (start position i, end position j) ์์ ๋น๊ตํ๊ธฐ๋ณด๋ค, ๊ฐ i์ ๋ํด longest span์ ์ฐพ์!
- ์ด ๊ณผ์ ์์ ์ด๋ฏธ ๊ณ์ฐํ ์ ๋ณด๋ฅผ ์ฌ์ฌ์ฉํ์
โ ํฌ์ธํฐ๋ฅผ ์์ง์ด๋ฉฐ โ์ด์ ๋ณด๋ค ๋ ๋ค์์ ์์ํ๊ฑฐ๋/๋๋๋ n-gram๋งโ ๊ฒ์ฌํ๋๋ก ์ ํ
- verbatim matching์ฌ๋ถ๋ฅผ ๋จผ์ ํ๋จํ๊ณ , ์ด๊ฒ ์์ผ๋ฉด semantic matching ์ฌ๋ถ๋ฅผ ํ๋จํจ
- semantic matching ํ ๋, BM25๋ก x์ ๊ฐ์ฅ ์ ์ฌํ ํ ์คํธ๋ค์ ๋จผ์ ๊ณจ๋ผ ๊ทธ subset์์๋ง WMD๋ฅผ ๊ณ์ฐํด ๋น์ฉ์ ์ค์
- minimum n-gram length(k) = 5
- WMD threshold = 0.95












