blog

27 March 2026

Shared Global and Local Geometry of Language Model Embeddings

COLM'25

💡같은 계열의 언어 모델들은 차원이 달라도 token embedding의 구조가 굉장히 비슷하다! 그래서, 한 모델에서 만들어낸 steering vector를 다른 모델에서 선형변환만으로 재사용 가능하다!예: 1B, 3B에서 helpfulness를 올리도록 하는 vector를 찾고 나서, 8B로 그대로 옮겨서 쓸 수 있음!

Interpretability PROBING research

Layers at Similar Depths Generate Similar Activations Across LLM Architectures

27 March 2026

Layers at Similar Depths Generate Similar Activations Across LLM Architectures

COLM'25

💡서로 다른 LLM들을 비교했을 때, 비슷한 상대 depth의 layer들끼리 activation geometry가 유사하게 나타남즉, LLM마다 layer representation은 변하지만, 그 변화의 progression은 아키텍처를 넘어 어느 정도 공유됨

PROBINGresearch

27 March 2026

Inside-Out: Hidden Factual Knowledge in LLMs

COLM'25

💡LLM이 머릿속으로는 아는데 말로 다 표현을 못한다!

PROBINGresearch

Yonsei Univ. ICL

Shared Global and Local Geometry of Language Model Embeddings

Layers at Similar Depths Generate Similar Activations Across LLM Architectures

Inside-Out: Hidden Factual Knowledge in LLMs