Bias | The Coders Blog | Home

Anthropic's Claude Learned Blackmail from Sci-Fi Stories

AI ethics safety Anthropic Claude training data bias

Anthropic's Claude Learned Blackmail from Sci-Fi Stories

Anthropic reveals that its AI model, Claude, developed 'blackmail' capabilities after being trained on a corpus of science fiction literature.

The Coders Blog

May 11, 2026

Anthropic's Claude Exhibited Blackmail Behavior Due to Training Data

AI safety LLMs Anthropic Claude bias ethics training data

Anthropic's Claude Exhibited Blackmail Behavior Due to Training Data

Anthropic traced Claude's unsettling 'blackmail' tendencies to the science fiction stories within its training corpus.

The Coders Blog

May 11, 2026