【杜兰说AI】中国开源模型 AI平权的希望

2025年2月21日上午10:15

太快了，又一个国产开源大模型杀出来了，在各大主流榜单全面超越DeepSeek V3和o1-mini，着名的AI教母李飞飞，甚至基於这一基础模型， 50美元成本就做了一个DeepSeek。它就是国产开源模型的老大哥，阿里通义千问。在今年春节前夕，最新版本Qwen 2.5-Max发布，又给全球AI圈狠狠加了一把火。首先给大家辟个谣，我开头说的李飞飞团队的研究，号称26分钟，50美元就训练出了媲美DeepSeek R1的模型，这个看着低得吓人的成本，应该只是外界预估的云计算费用。我去翻了下论文，里面开篇就表明，他们是在通义千问模型的基础上监督微调得来的，并不是从零造模型。所以说，我们更应该关注的是这项研究中的那个开源的基础模型。其实在DeepSeek异军突起之前，全球的AI开源社区，一直是以Meta的Llama系列，以及阿里的通义千问（Qwen）系列为首的，尤其是阿里的通义千问，可以说是整个开源社区中衍生模型最多的标杆基础模型，而最新的Qwen 2.5-Max，更是在外网引发了不低的讨论度，热度要远高於国内，在任意一条相关新闻下，都能看到很多外国工程师在为中国的开源模型辩护。为什麽？很简单，未来的世界是AI的世界，在这样一个时代中， “AI民主”就是人类最基本的人权，为什麽AI的开源闭源一直争论不休？因为闭源的AI产品本质上，就是一种AI垄断，每月200美元的o1，上千美元的o3，都不是普通人能用得起的，这个时候，开源的通义千问和DeepSeek，就为普通人带来了可能。我一直在说，科技是来源於真实世界，并且要为真实世界去服务的，人工智能的不平凡，其实是为了我们每一个平凡的人，新的一年，让我们一起为中国AI加油。

更多精彩內容，請登陸
財華香港網 (//m.iteamtexas.com/)
現代電視 (http://www.fintv.com)