太快了, 又一个国产开源大模型杀出来了, 在各大主流榜单全面超越DeepSeek V3和o1-mini, 着名的AI教母李飞飞, 甚至基於这一基础模型, 50美元成本就做了一个DeepSeek。 它就是国产开源模型的老大哥, 阿里通义千问。 在今年春节前夕, 最新版本Qwen 2.5-Max发布, 又给全球AI圈狠狠加了一把火。 首先给大家辟个谣, 我开头说的李飞飞团队的研究, 号称26分钟,50美元就训练出了媲美DeepSeek R1的模型, 这个看着低得吓人的成本, 应该只是外界预估的云计算费用。 我去翻了下论文, 里面开篇就表明, 他们是在通义千问模型的基础上监督微调得来的, 并不是从零造模型。 所以说, 我们更应该关注的 是这项研究中的那个开源的基础模型。 其实在DeepSeek异军突起之前, 全球的AI开源社区, 一直是以Meta的Llama系列,以及阿里的通义千问(Qwen)系列为首的, 尤其是阿里的通义千问, 可以说是整个开源社区中衍生模型最多的标杆基础模型, 而最新的Qwen 2.5-Max, 更是在外网引发了不低的讨论度, 热度要远高於国内, 在任意一条相关新闻下, 都能看到很多外国工程师在为中国的开源模型辩护。 为什麽? 很简单, 未来的世界是AI的世界, 在这样一个时代中, “AI民主”就是人类最基本的人权, 为什麽AI的开源闭源一直争论不休? 因为闭源的AI产品本质上, 就是一种AI垄断, 每月200美元的o1,上千美元的o3, 都不是普通人能用得起的, 这个时候, 开源的通义千问和DeepSeek, 就为普通人带来了可能。 我一直在说, 科技是来源於真实世界, 并且要为真实世界去服务的, 人工智能的不平凡, 其实是为了我们每一个平凡的人, 新的一年, 让我们一起为中国AI加油。
更多精彩內容,請登陸
財華香港網 (//m.iteamtexas.com/)
現代電視 (http://www.fintv.com)