大模型迭代变慢：告别规模崇拜转向推理优化-第一黄金网

摘要

通用大模型哪家强？当业界千呼万唤的OpenAI新一代模型GPT-5迟迟未能面市时，Anthropic、xAI以及国内的深

通用大模型哪家强？当业界千呼万唤的OpenAI新一代模型GPT-5迟迟未能面市时，Anthropic、xAI以及国内的深度求索（DeepSeek）、智源研究院、月之暗面等大模型厂商争相亮出了自家最新版本的大模型。其中，埃隆·马斯克旗下的xAI最新推出的Grok 4基于自建的20万张英伟达H100 GPU计算集群，号称“全球最强的AI”。近日与Grok 4在模型聚合平台OpenRouter上争夺“热门模型”桂冠的是月之暗面最新发布的Kimi K2开源模型。

从OpenRouter统计的近一年来的AI大模型市场份额来看，OpenAI、谷歌、Meta、Anthropic、DeepSeek、阿里云（Qwen千问）、Mistral AI等几家大模型“玩家”站稳前列位置。《中国经营报》记者在梳理对比了国内外主流大模型厂商的版本发布节奏后注意到，整体来看，大模型主版本的“代际”更迭速度和参数规模增长在明显放缓。

快思慢想研究院院长田丰指出，受算力和数据瓶颈制约，大模型原先“大力出奇迹”式的追求参数规模较为简单粗暴，但如今的发展已经变慢了，不过，大模型的架构创新却在加速，集中表现在通过多智能体协同等工程化的手段快速提高推理效率，这从主模型的版本更新依旧保持较快节奏可见一斑。

迭代放缓or加速

记者梳理统计了多个大模型的版本更新时间表，很容易看到OpenAI从发布基于GPT3.5的爆款产品ChatGPT，到发布GPT-4花费了约4个月，在此后的一年多时间里又陆续推出了GPT-4 Turbo、GPT-4o/4o mini、o1/o1 mini，但OpenAI的GPT-5却一再“跳票”，直到现在仍未发布。今年6月中旬，OpenAI首席执行官山姆·奥特曼（Sam Altman）公开表示下一代GPT“可能于今年夏天发布”，随后该公司首席技术官米拉·穆拉蒂（Mira Murati）在一次访谈中提及GPT模型到今年年底或明年年初在特定任务中可以达到“博士（级别）的智能”，这也引发了业界的猜测，即GPT-5的面市时间或最早在今年年底。

Anthropic公司的Claude模型已于今年5月底更新至Claude 4。此前从Claude 2到Claude 3间隔7个月，从Claude 3到Claude 3.5 Sonnet，再到Claude 4分别间隔了约3个月和11个月。Meta的开源大模型Llama从第二代发展到第三代大约间隔了9个月，而根据Meta的最新预告，Llama 4计划在2025年年内推出，不难计算从Llama 3到即将推出的Llama 4的间隔时长已超过约15个月。

国产大模型厂商阿里云分别于2023年4月、2023年10月和2024年5月分别推出了千问Qwen1.0、Qwen 2.0、Qwen 2.5模型，到今年1月底推出了Qwen 2.5-Max。由此也不难看出，Qwen大模型的代际更新也在减缓速度。

主流大模型代际升级放缓的背后，实际是从过去追求规模转向聚焦推理能力的优化。随着算力竞争趋于饱和，提升模型在复杂任务上的逻辑推理、问题解决和高效决策能力成为新方向。这种转变推动模型性能的进一步突破，也更贴合实际应用需求，代表了AI从量变到质变的进化趋势。

需要说明的是，在主流大模型厂商中，xAI的迭代节奏有所不同。该公司分别于2023年10月、2024年8月、2025年2月和2025年7月陆续更新了四代Grok大模型。从Grok3到Grok4的更新速度压缩至5个月之内，这主要得益于其自建的Colossus超级计算中心。Grok4的训练依托20万张H100集群，计算资源是前一代Grok3的两倍、Grok2的100倍。Grok4及Grok4 Heavy都属于纯推理模型，截至目前仅面向付费订阅用户提供服务，每月的订阅费用分别为30美元、300美元。

从业界反馈来看，Grok4的一大技术亮点在于其Grok4 Heavy引入了“多智能协作机制”，简单来说是由多个独立的AI智能体从哲学、伦理、数学等不同维度拆解问题，通过研讨小组整合观点，最终向用户输出深度优化后的答案。马斯克将其比作“由牛顿、伽利略、墨子、达·芬奇组成的智囊团”。

深度科技研究院院长张孝荣指出，Grok是基于大算力推出的优化算法后的新版本大模型，在不少指标上获得了新突破，表现优异，性能对标OpenAI的GPT-4.5编程优化版本。从整体来看，大模型头部厂商保持着6至12个月的迭代周期，国外大模型的版本更新速度正在加快。

两重考验：商业与数据

田丰认为，目前全球的大模型企业都面临两个考验——商业考验和数据考验，这决定了企业要有源源不断的现金流，才能购买GPU卡以提升算力，发展更好的研发团队，才能将基础大模型做到持续领先，这是非常耗费金钱的。更为重要的是，市场竞争持续升温，即使在这半年内领先，也很可能在半年之后被对手反超。“最好的大模型未来在全球范围内或类似于当下的操作系统，不会超过两三家，而这背后是长期巨大的资金、顶尖科研人才及算力与能源资源的巨额投入，而通过基础模型持续逼近AGI（通用人工智能）是世界科技强国的关键里程碑。”田丰如是说道。

科技巨头围绕大模型的军备竞赛仍未休止。就在7月14日，Meta首席执行官马克·扎克伯格表示正在投资数百亿美元用于AI研发与运营，并宣布将在美国各地建成多个数据中心，其中一个名为“普罗米修斯”（Prometheus）的超级集群数据中心预计在2026年即可上线使用。

在此之前，Meta斥资 143亿美元收购了数据标注公司Scale AI的49%无投票股份，Scale AI联合创始人、首席执行官Alexandr Wang加入Meta，出任首席AI官并领导Meta新成立的“超级智能实验室”。随后，扎克伯格及Meta不断争夺AI人才，不惜向DeepMind、OpenAI等研究员抛出巨额薪酬。

收购数据公司Scale AI无疑是Meta欲突破数据瓶颈的重要举措。田丰指出，Meta多举措押注AI，不只是为了开发AI前沿产品赚钱，也是要将基础模型做大做强，在未来作为操作系统内核的大模型竞争中占据一席之地。

事实上，xAI的Grok4与Meta兼顾商业化探索与技术性能提升的路径类似。马斯克认为，Grok4已在主要学科上超越博士水平，尽管它目前还不具备发明新理论或提出原创技术的能力，但这只是时间问题。针对训练数据，马斯克提及“让AI接入现实世界才是真正的关键”。未来Grok大模型与特斯拉及其人形机器人Optimus结合，将形成一个闭环推理系统。与此同时，对于商业场景应用，Grok将在三个主要场景发挥作用，分别是代码编程、商业决策和社交平台X的内容治理。

在张孝荣看来，与国外大模型有所差异，国内的大模型竞争焦点已经从基础参数竞争转向了场景渗透力。

据国家互联网信息办公室负责人介绍，目前国内已有433款大模型完成备案，上线提供服务，涵盖了通用大模型、行业垂直大模型及多模态模型。另据Artificial Analysis发布的《State of AI：China》（2025年Q2）报告，中国AI主要玩家分成三类，第一类是阿里巴巴、字节跳动、华为、腾讯、百度等大型科技企业；第二类是DeepSeek、月之暗面、智谱、阶跃星辰、MiniMax等AI初创企业；第三类是其他AI相关企业，如小米、美团、360等。

其中，就在Grok4发布5天后，月之暗面发布了最新的Kimi K2开源大模型，官方称Kimi K2的预训练阶段“实现了万亿参数模型的稳定高效训练，在人类高质量数据成为瓶颈的背景下，有效提高Token利用效率，找到新的Scaling（规模涌现）空间”。

记者注意到，自DeepSeek凭借低成本+高性能引爆国产大模型热潮以来，曾被业界冠以“AI六小虎”的智谱AI、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物这六家明星企业早已出现分化，零一万物、百川智能先后收缩业务，从to B级场景寻求商业突破。截至7月17日，今年内仅有智谱AI、MiniMax两家对外公布了融资消息，并开始谋求IPO。

田丰指出，国内的AI初创型企业目前面临着商业化的考验与生存难题，在有限的算力、资金条件下，他们需要尽快推出优秀的AI爆款产品，找到新的商业模式改变长期“砸钱”的状态，实现持续的现金流注入。如果融资不像之前顺畅，那就先把产品做好。

名称	最新价	涨跌额
伦敦金	2384.81	-0.21%
伦敦银	27.07	+0.45%
美元指数	103.2069	+0.3%
美原油	73.19	-0.01%
黄金T+D	552.82	-0.15%

大模型迭代变慢：告别规模崇拜转向推理优化

突然暴跌99%！关税重大打击！

公布“豪华”助贷机构名单外资银行寄望消费贷

【财经分析】伦敦将推出“数字黄金” 英国金融数字化战略提速

黄金又创新高！伦铜创15个月新高！市场热炒“美联储降息交易”

香港警方：黄金盗窃案已有13人被捕

韩国黄金交易所单日交易量突破1吨

热搜！香港发生黄金劫案！10多名男子抢走金条、金砖及金粉，共65公斤，价值超5000万元

最新！香港警方：失窃黄金已全数追回 11人被捕！主谋是打金工场合伙人！此前10名悍匪抢走65公斤黄金总值超5300万

香港黄金大劫案进展：警方追回约值5900万港元的黄金七人被捕

11人涉香港65公斤“黄金劫案”被警方拘捕

华神科技：目前山东凌凯项目仍在一期项目建设中，一期项目投资尚未全部完成

吴清：共同打好“组合拳”应对外部冲击投资者信心和市场预期明显改善

潘功胜：今日发布会不涉及短期政策调整！吴清：感谢广大投资者！

红宝丽：控股股东宝源投资解除质押2680万股

国家外汇局朱鹤新：我国跨境贸易和投资持续活跃

四川双马：公司参投基金涉及芯片行业投资

国家外汇局朱鹤新：人民币在跨境贸易中使用占比升至近30%

凝聚行业共识激活开放动能——人民币债券担保品跨境应用倡议重磅发布

中信证券：钙钛矿、固态电池需求催化，碘产业链迎来投资机会

剖析道生天合IPO投资价值：新材料龙头如何领航“双碳”时代

导航

大模型迭代变慢：告别规模崇拜 转向推理优化