12.05.2026 13:54 Uhr, Quelle: ComputerBase

KI-Sicherheit: Wie Anthropic den Claude-Modellen das Erpressen abgewöhnt

Es waren Ergebnisse aus Anthropics Sicherheitstests, die im letzten Jahr für Aufsehen sorgten: In experimentellen Szenarien tendierten die Claude-Modelle zu Erpressungsversuchen, etwa wenn sie abgeschaltet werden sollten. Eine aktuelle Untersuchung nennt nun Ursache und Gegenmaßnahme.

Weiterlesen bei ComputerBase

Digg del.icio.us Facebook email MySpace Technorati Twitter

JustMac.info © Thomas Lohner - Impressum - Datenschutz