8月25日,据《科创板日报》讯,阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识別、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。
财华网所刊载内容之知识产权为财华网及相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。
如有意愿转载,请发邮件至content@finet.com.hk,获得书面确认及授权后,方可转载。
更多精彩内容,请登陆
财华香港网(//m.iteamtexas.com/)
财华智库网(https://www.finet.com.cn)
现代电视(http://www.fintv.hk)