Immer neue KI-Modelle und AI-Forschungsprojekte schrauben die Anforderungen für realistische und lebensechte Videos stetig weiter nach unten. Bei Microsofts VASA-1 genügt jetzt ein einziges Bild plus Ton, um daraus ein lebensechtes Avatar als Video zu kreieren. Im Gegensatz zur Sora lässt sich VASA-1 sogar in Echtzeit ausführen.