靓丽橙
天空蓝
忧郁紫
玛瑙红
炫酷黑
深卡色
黎明
收起
下载APP
首页> 股市消息>

正文

腾讯,大动作!

2025-06-28 00:03:00来源:中国基金报
责任编辑:第一黄金网
摘要
【导读】腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解 头部互联网公司旗下大模型加速开源。 6月27

【导读】腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解

头部互联网公司旗下大模型加速开源。

6月27日,腾讯混元开源的首款混合推理MoE模型Hunyuan-A13B发布,该模型是业界首个13B级别的MoE开源混合推理模型,其效果比肩同等架构领先开源模型。

开源模型灵活性、透明度和成本优势,为人工智能产业发展带来新机遇。今年年初DeepSeek出圈后,腾讯、阿里、字节等头部互联网公司旗下大模型开源悄然加速。

腾讯混元开源首款混合推理MoE模型

腾讯混元宣布开源首个混合推理MoE模型Hunyuan-A13B,总参数80B,激活参数仅13B,效果比肩同等架构领先开源模型,但是推理速度更快,性价比更高,这意味着,开发者可以用更低门槛的方式获得更好的模型能力。

即日起,模型已经在Github和Huggingface等开源社区上线,同时模型API也在腾讯云官网正式上线,支持快速接入部署。

据了解,这是业界首个13B级别的MoE开源混合推理模型,基于先进的模型架构,Hunyuan-A13B表现出强大的通用能力,在多个业内权威数据测试集上获得好成绩,并且在Agent工具调用和长文能力上有突出表现。

*加粗为最高分,下划线表示第二名,数据来源于模型各个公开的测试数据集得分

在实际使用场景中,Hunyuan-A13B模型可以根据需要选择思考模式。快思考模式提供简洁、高效的输出;慢思考则涉及更深、更全面的推理步骤,如反思和回溯。

Hunyuan-A13B模型对个人开发者较为友好,在严格条件下,只需要1张中低端GPU卡即可部署。目前,Hunyuan-A13B已经融入开源主流推理框架生态,无损支持多种量化格式,在相同输入输出规模上,整体吞吐量是前沿开源模型的2倍以上。

Hunyuan-A13B集合了腾讯混元在模型预训练、后训练等多个环节的创新技术,这些技术共同增强了其推理性能、灵活性和推理效率。

腾讯方面相关人士表示,Hunyuan-A13B模型是腾讯内部应用和调用量最大的大语言模型之一,有400+业务用于精调或者直接调用,日均请求超1.3亿次。

本次进行升级更新并对外开源,是继混元Large后混元大语言模型推出的又一重要开源模型,其参数更小,但是性能和效果实现了大幅的提升。接下来,腾讯混元将推出更多尺寸、更多特色的模型,将更多实践技术与社区共享,促进大模型开源生态的繁荣。

开源浪潮席卷行业

2024年大模型从科技前沿走向大众视野,2025年DeepSeek火爆出圈,开源正在成为国内外众多大模型的“必选项”。

据不完全统计,仅今年3月至今,OpenAI、谷歌、Meta、英伟达、阿里、DeepSeek、智谱AI、群核科技、阶跃星辰等全球多家科技巨头已密集发布超10款开源大模型。

与此同时,开源模型性能持续突破,AI开源社区Hugging Face的模型榜单不断被刷新。无论是科技巨头,还是初创企业,都在加快步伐拥抱开源浪潮。共享最新前沿技术成果的同时,这些企业也在致力于降低算力成本。

就国内而言,字节跳动豆包、昆仑万维、百度文心、阿里通义千问等今年均推出开源模型。当前,头部互联网公司旗下大模型开源仍在加速。

5月30日凌晨,阿里巴巴开源了创新自主搜索AI Agent——WebAgent。WebAgent具备端到端的自主信息检索与多步推理能力,就像人类一样在网络环境中主动感知、决策和行动,例如,当用户想了解某个特定领域的最新研究成果时,WebAgent能够主动搜索多个学术数据库,筛选出最相关的文献,并根据用户的需求进行深入分析和总结。

字节跳动Seed团队也有新动作,发布并开源了多模态基础模型BAGEL,该模型拥有70亿个活跃参数,总参数达140亿个。BAGEL集视觉理解、文生图、图像编辑于一体,在标准多模态理解基准测试中表现出色,优于现有顶级开源视觉语言模型如Qwen2.5-VL和InternVL-2.5。

麦肯锡公司联合Mozilla基金会、Patrick J.McGovern基金会发布的《AI时代的开源技术》报告显示,全球超过50%的企业已在数据、模型及工具层面采用开源AI技术。

开源模型通过提供高质量的模型权重和训练代码,支持模型的预训练、微调和定制,助力科创企业基于现有的强大模型进行快速开发,避免了从头开始构建AI系统的高昂成本。企业可依据业务所需灵活调用模型组件、算法框架和推理引擎,实现从“重资产开发”到“轻量化集成”的转型路径,大幅降低了创新门槛和试错成本。

据了解,未来混元计划推出多尺寸混合推理模型,从0.5B到32B的Dense模型,以及多个MoE模型,适配企业与端侧不同需求,混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源。

更多资讯可关注第一黄金网微信公众号
更多精彩财经资讯,点击这里下载第一黄金网APP
31 收藏


    相关阅读

    导航

    本站郑重声明:第一黄金网中的操作建议仅代表第三方观点与本平台无关,投资有风险,入市需谨慎。据此交易,风险自担。