KI-Sicherheit: Wie Anthropic den Claude-Modellen das Erpressen abgewöhnt

12.05.2026 13:54 Uhr, Quelle: ComputerBase

Es waren Ergebnisse aus Anthropics Sicherheitstests, die im letzten Jahr für Aufsehen sorgten: In experimentellen Szenarien tendierten die Claude-Modelle zu Erpressungsversuchen, etwa wenn sie abgeschaltet werden sollten. Eine aktuelle Untersuchung nennt nun Ursache und Gegenmaßnahme.

Weiterlesen bei ComputerBase

Mo	Di	Mi	Do	Fo	Sa	So
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Mo	Di	Mi	Do	Fo	Sa	So
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Archiv