<ul data-eligibleForWebStory="false"><li>Monitoring Large Language Model (LLM) outputs is important to prevent misuse and misalignment.</li><li>LLMs could use steganography to hide information in seemingly innocent text.</li><li>Research found that current LLMs struggle to hide short messages but can do so with specific conditions like an unmonitored scratchpad.</li><li>Despite limited steganographic capabilities, there are early indications that LLMs can perform basic encoded reasoning.</li></ul>

Early Signs of Steganographic Capabilities in Frontier LLMs

Discover more