Ein neues System soll in der Lage sein, Fragen zu Bildern in natürlicher Sprache zu beantworten. Dafür erfasst es mithilfe von Deep Learning die Elemente des Bilds und den Inhalt der Frage. Ein Anwendungsbeispiel ist laut Microsoft ein Warnsystem für Fahrradfahrer.