LLaVA: Multimodales offenes KI-Modell auf LLaMA-Basis liest Bilder und Sprache

22.04.2023 12:18 Uhr, Quelle: Heise

Die Forschungsdemo des Large Language and Vision Assistant erlaubt Usern das Hochladen eigener Bilder zum Testen multimodaler Fähigkeiten und sammelt Feedback.

Weiterlesen bei Heise

Mo	Di	Mi	Do	Fo	Sa	So
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Mo	Di	Mi	Do	Fo	Sa	So
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Archiv