20.04.2023 19:27 Uhr, Quelle: Heise

Blick in die Blackbox: KI-Trainingsdatensatz C4 schöpft auch aus trüben Quellen

Colossal Clean Crawled Corpus (C4) dient Sprachmodellen als Trainingsgrundlage. Die Washington Post hat den Datensatz untersucht – er enthält Ungereimtheiten.

Weiterlesen bei Heise

Digg del.icio.us Facebook email MySpace Technorati Twitter

JustMac.info © Thomas Lohner - Impressum - Datenschutz