阿里巴巴推出可以“理解”图像并进行有意义对话的 AI 模型

其他资讯
10月02日

DADONG站长

在中国科技巨头阿里巴巴最新的举措中，他们推出了两款卓越的语言模型，分别是 Qwen-VL 和 Qwen-VL-Chat。

这两款语言模型展示了先进的图像解释和自然语言对话的能力，使阿里巴巴在人工智能领域迈出了重要的一步。此时推出这些语言模型正好满足了对先进人工智能算法的不断增长需求。

https://qianwen.aliyun.com/

与其他类似开源语言模型不同，阿里巴巴所提出的语言模型并不局限于文本数据的理解。Qwen-VL 能够感知和理解图像，并能够针对不同图像相关的查询生成准确响应。而 Qwen-VL-Chat 则专为更为复杂的交互而设计，它能够比较多个图像，回答一系列问题，并根据用户提供的图像编写故事。例如，用户可以根据医院标志的图片询问医院位置，并获得高准确度的答案。

这些语言模型的一个显著优点在于其出色的工作准确度。阿里巴巴宣称，Qwen-VL 在多个英语语言评估标准上表现明显优于现有的类似开源语言模型。另外，该算法还引入了一项名为“多图像通信”的新功能，用户可以提供多张图像，并在此基础上提出相关问题。

阿里巴巴推出可以“理解”图像并进行有意义对话的 AI 模型

阿里巴巴对这两款语言模型进行了标准基准测试，评估了它们在生成图像评论、回答上传图像相关问题等任务上的能力。同时，阿里巴巴还借鉴了 OpenAI 最先进的语言模型 GPT-4 的评估标准，以确定这些模型与人类感知之间的对应关系。结果显示，Qwen-VL 和 Qwen-VL-Chat 在各个类别中表现出最佳成绩。

作为中国最早推出人工智能系统的企业之一，阿里巴巴的推出标志着中国在人工智能研究领域的快速进步。阿里巴巴将这些模型开源，确保全球的研究人员和公司都能够利用它们来开发自己的应用程序，无需从零开始训练语言模型，节省了宝贵的时间和成本。这一战略举措反映了更为广泛的人工智能协作和资源共享趋势。

此次项目的推出正值科技巨头间竞争激烈的”人工智能竞赛”时刻。阿里巴巴以这一举措展示了其不仅是一家零售业巨头，更是科技领域强大参与者的实力。他们的目标是引领科技发展，奠定 AI 在全球范围内的领导地位，并将 AI 技术的应用推向新的高峰。

随着这些语言模型的开源，阿里巴巴促进了更广泛的合作和资源共享，为人工智能技术的发展带来了新的可能性。让我们一起深入了解这个令人兴奋的时刻，探索阿里巴巴在AI领域所展现出的雄心壮志和突破性成果。

{{userData.name}}已认证

阿里巴巴推出可以“理解”图像并进行有意义对话的 AI 模型

隐私政策

用户协议

站点公告

新手帮助

在线工单

关于我们