靓丽橙
天空蓝
忧郁紫
玛瑙红
炫酷黑
深卡色
黎明
收起
下载APP
首页> 金条>

正文

大模型迭代变慢:告别规模崇拜 转向推理优化

2025-07-19 06:00:00来源:最新资讯
责任编辑:第一黄金网
摘要
通用大模型哪家强?当业界千呼万唤的OpenAI新一代模型GPT-5迟迟未能面市时,Anthropic、xAI以及国内的深

通用大模型哪家强?当业界千呼万唤的OpenAI新一代模型GPT-5迟迟未能面市时,Anthropic、xAI以及国内的深度求索(DeepSeek)、智源研究院、月之暗面等大模型厂商争相亮出了自家最新版本的大模型。其中,埃隆·马斯克旗下的xAI最新推出的Grok 4基于自建的20万张英伟达H100 GPU计算集群,号称“全球最强的AI”。近日与Grok 4在模型聚合平台OpenRouter上争夺“热门模型”桂冠的是月之暗面最新发布的Kimi K2开源模型。

从OpenRouter统计的近一年来的AI大模型市场份额来看,OpenAI、谷歌、Meta、Anthropic、DeepSeek、阿里云(Qwen千问)、Mistral AI等几家大模型“玩家”站稳前列位置。《中国经营报》记者在梳理对比了国内外主流大模型厂商的版本发布节奏后注意到,整体来看,大模型主版本的“代际”更迭速度和参数规模增长在明显放缓。

快思慢想研究院院长田丰指出,受算力和数据瓶颈制约,大模型原先“大力出奇迹”式的追求参数规模较为简单粗暴,但如今的发展已经变慢了,不过,大模型的架构创新却在加速,集中表现在通过多智能体协同等工程化的手段快速提高推理效率,这从主模型的版本更新依旧保持较快节奏可见一斑。

迭代放缓or加速

记者梳理统计了多个大模型的版本更新时间表,很容易看到OpenAI从发布基于GPT3.5的爆款产品ChatGPT,到发布GPT-4花费了约4个月,在此后的一年多时间里又陆续推出了GPT-4 Turbo、GPT-4o/4o mini、o1/o1 mini,但OpenAI的GPT-5却一再“跳票”,直到现在仍未发布。今年6月中旬,OpenAI首席执行官山姆·奥特曼(Sam Altman)公开表示下一代GPT“可能于今年夏天发布”,随后该公司首席技术官米拉·穆拉蒂(Mira Murati)在一次访谈中提及GPT模型到今年年底或明年年初在特定任务中可以达到“博士(级别)的智能”,这也引发了业界的猜测,即GPT-5的面市时间或最早在今年年底。

Anthropic公司的Claude模型已于今年5月底更新至Claude 4。此前从Claude 2到Claude 3间隔7个月,从Claude 3到Claude 3.5 Sonnet,再到Claude 4分别间隔了约3个月和11个月。Meta的开源大模型Llama从第二代发展到第三代大约间隔了9个月,而根据Meta的最新预告,Llama 4计划在2025年年内推出,不难计算从Llama 3到即将推出的Llama 4的间隔时长已超过约15个月。

国产大模型厂商阿里云分别于2023年4月、2023年10月和2024年5月分别推出了千问Qwen1.0、Qwen 2.0、Qwen 2.5模型,到今年1月底推出了Qwen 2.5-Max。由此也不难看出,Qwen大模型的代际更新也在减缓速度。

主流大模型代际升级放缓的背后,实际是从过去追求规模转向聚焦推理能力的优化。随着算力竞争趋于饱和,提升模型在复杂任务上的逻辑推理、问题解决和高效决策能力成为新方向。这种转变推动模型性能的进一步突破,也更贴合实际应用需求,代表了AI从量变到质变的进化趋势。

需要说明的是,在主流大模型厂商中,xAI的迭代节奏有所不同。该公司分别于2023年10月、2024年8月、2025年2月和2025年7月陆续更新了四代Grok大模型。从Grok3到Grok4的更新速度压缩至5个月之内,这主要得益于其自建的Colossus超级计算中心。Grok4的训练依托20万张H100集群,计算资源是前一代Grok3的两倍、Grok2的100倍。Grok4及Grok4 Heavy都属于纯推理模型,截至目前仅面向付费订阅用户提供服务,每月的订阅费用分别为30美元、300美元。

从业界反馈来看,Grok4的一大技术亮点在于其Grok4 Heavy引入了“多智能协作机制”,简单来说是由多个独立的AI智能体从哲学、伦理、数学等不同维度拆解问题,通过研讨小组整合观点,最终向用户输出深度优化后的答案。马斯克将其比作“由牛顿、伽利略、墨子、达·芬奇组成的智囊团”。

深度科技研究院院长张孝荣指出,Grok是基于大算力推出的优化算法后的新版本大模型,在不少指标上获得了新突破,表现优异,性能对标OpenAI的GPT-4.5编程优化版本。从整体来看,大模型头部厂商保持着6至12个月的迭代周期,国外大模型的版本更新速度正在加快。

两重考验:商业与数据

田丰认为,目前全球的大模型企业都面临两个考验——商业考验和数据考验,这决定了企业要有源源不断的现金流,才能购买GPU卡以提升算力,发展更好的研发团队,才能将基础大模型做到持续领先,这是非常耗费金钱的。更为重要的是,市场竞争持续升温,即使在这半年内领先,也很可能在半年之后被对手反超。“最好的大模型未来在全球范围内或类似于当下的操作系统,不会超过两三家,而这背后是长期巨大的资金、顶尖科研人才及算力与能源资源的巨额投入,而通过基础模型持续逼近AGI(通用人工智能)是世界科技强国的关键里程碑。”田丰如是说道。

科技巨头围绕大模型的军备竞赛仍未休止。就在7月14日,Meta首席执行官马克·扎克伯格表示正在投资数百亿美元用于AI研发与运营,并宣布将在美国各地建成多个数据中心,其中一个名为“普罗米修斯”(Prometheus)的超级集群数据中心预计在2026年即可上线使用。

在此之前,Meta斥资 143亿美元收购了数据标注公司Scale AI的49%无投票股份,Scale AI联合创始人、首席执行官Alexandr Wang加入Meta,出任首席AI官并领导Meta新成立的“超级智能实验室”。随后,扎克伯格及Meta不断争夺AI人才,不惜向DeepMind、OpenAI等研究员抛出巨额薪酬。

收购数据公司Scale AI无疑是Meta欲突破数据瓶颈的重要举措。田丰指出,Meta多举措押注AI,不只是为了开发AI前沿产品赚钱,也是要将基础模型做大做强,在未来作为操作系统内核的大模型竞争中占据一席之地。

事实上,xAI的Grok4与Meta兼顾商业化探索与技术性能提升的路径类似。马斯克认为,Grok4已在主要学科上超越博士水平,尽管它目前还不具备发明新理论或提出原创技术的能力,但这只是时间问题。针对训练数据,马斯克提及“让AI接入现实世界才是真正的关键”。未来Grok大模型与特斯拉及其人形机器人Optimus结合,将形成一个闭环推理系统。与此同时,对于商业场景应用,Grok将在三个主要场景发挥作用,分别是代码编程、商业决策和社交平台X的内容治理。

在张孝荣看来,与国外大模型有所差异,国内的大模型竞争焦点已经从基础参数竞争转向了场景渗透力。

据国家互联网信息办公室负责人介绍,目前国内已有433款大模型完成备案,上线提供服务,涵盖了通用大模型、行业垂直大模型及多模态模型。另据Artificial Analysis发布的《State of AI:China》(2025年Q2)报告,中国AI主要玩家分成三类,第一类是阿里巴巴、字节跳动、华为、腾讯、百度等大型科技企业;第二类是DeepSeek、月之暗面、智谱、阶跃星辰、MiniMax等AI初创企业;第三类是其他AI相关企业,如小米、美团、360等。

其中,就在Grok4发布5天后,月之暗面发布了最新的Kimi K2开源大模型,官方称Kimi K2的预训练阶段“实现了万亿参数模型的稳定高效训练,在人类高质量数据成为瓶颈的背景下,有效提高Token利用效率,找到新的Scaling(规模涌现)空间”。

记者注意到,自DeepSeek凭借低成本+高性能引爆国产大模型热潮以来,曾被业界冠以“AI六小虎”的智谱AI、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物这六家明星企业早已出现分化,零一万物、百川智能先后收缩业务,从to B级场景寻求商业突破。截至7月17日,今年内仅有智谱AI、MiniMax两家对外公布了融资消息,并开始谋求IPO。

田丰指出,国内的AI初创型企业目前面临着商业化的考验与生存难题,在有限的算力、资金条件下,他们需要尽快推出优秀的AI爆款产品,找到新的商业模式改变长期“砸钱”的状态,实现持续的现金流注入。如果融资不像之前顺畅,那就先把产品做好。

更多资讯可关注第一黄金网微信公众号
更多精彩财经资讯,点击这里下载第一黄金网APP
31 收藏


    相关阅读

    导航

    本站郑重声明:第一黄金网中的操作建议仅代表第三方观点与本平台无关,投资有风险,入市需谨慎。据此交易,风险自担。