základní pojmy 1 min čtení

Multimodální (Multimodal)

Multimodal

AI schopná zpracovávat a kombinovat různé typy dat (text, obraz, zvuk)

Vysvětlení

Multimodální AI modely dokáží pracovat s různými typy vstupů současně - nejen s textem, ale také s obrázky, zvukem nebo videem. Mohou například popsat obsah fotografie, odpovědět na otázky o obrázku nebo generovat obrázky na základě textového popisu.

Příklady

["GPT-4 dokáže analyzovat obrázky a odpovídat na otázky o nich","DALL-E generuje obrázky z textových popisů"]

Více o Multimodální (Multimodal)

Najděte nástroje, články a prompty související s tímto pojmem pro praktické využití.

Prozkoumejte AI slovník

Objevte další základní pojmy pojmy a rozšiřte své znalosti umělé inteligence.