多模态

共 2 篇文章

排序

当前，多模态大模型，MLLM，在多项视觉任务上展现出了强大的认知理解能力，然而大部分多模态大模型局限于单向的图像理解，难以将理解的内容映射回图像上，比如，模型能轻易说出图中有哪些物体，但无法将物体在图...

2年前

0200

GPT-4的发布给ChatGPT带来了又一次飞跃，ChatGPT不仅支持文字输入，还能看得懂图片、甚至是漫画、梗图，以GPT-4为代表的多模态大模型非常强大。多模态大模型就是指模型可以处理多种结构/类...

3年前

440

添加应用