10Models·Mar 10

Improving instruction hierarchy in frontier LLMs

IH-Challenge trains models to prioritize trusted instructions, improving instruction hierarchy, safety steerability, and resistance to prompt injection attacks.

Covered by 1 source

OOpenAI Blog↗Mar 10

Improving instruction hierarchy in frontier LLMs

Covered by 1 source

Related stories