Home Blog About

Yonsei Univ. ICL

pretraining dataset

Deep Ignorance: Filtering Pretraining Data Builds Tamper-Resistant Safeguards into Open-Weight LLMs

26 March 2026

Deep Ignorance: Filtering Pretraining Data Builds Tamper-Resistant Safeguards into Open-Weight LLMs

ICLR'26 Poster

SAFETY pretraining dataset research

Free Jekyll theme by Zerostatic Themes