靓丽橙
天空蓝
忧郁紫
玛瑙红
炫酷黑
深卡色
黎明
收起
下载APP
首页> 股市消息>

正文

Seedance 1.0超越可灵2.0?豆包“双箭齐发” 字节跳动摁下Agent加速键

2025-06-12 16:06:00来源:每日经济新闻
责任编辑:第一黄金网
摘要
黑暗的场馆中,大屏幕上播放的宣传片吸引了全场人的目光。一段堪比动作大片的赛车竞逐之后,画面通过蒙太奇手法巧妙切换,观众瞬

黑暗的场馆中,大屏幕上播放的宣传片吸引了全场人的目光。一段堪比动作大片的赛车竞逐之后,画面通过蒙太奇手法巧妙切换,观众瞬间穿越到艺术世界,名画中的人物“活”了过来,花草也随之摇曳生姿——这,是字节跳动旗下火山引擎Force原动力大会的现场演示。

6月11日,“2025火山引擎春季Force原动力大会”上,豆包大模型1.6正式发布,视频生成模型Seedance 1.0 pro首次亮相。上述宣传片中的影像正是由Seedance 1.0 pro生成。

值得一提的是,在国际知名评测榜单Artificial Analysis上,Seedance在文生视频、图生视频两项任务方面均排名首位,超越Veo3、可灵2.0等模型。

Seedance 1.0 pro的性价比同样受到市场关注。《每日经济新闻》记者现场了解到,Seedance 1.0 pro的价格是0.015元/千tokens(语言生成模型在运作时的最小工作单元),相当于每生成一条5秒的1080P视频只需3.67元。据称,这个价格已经为当前行业最低。

把价格打下来的不只有视频生成模型,最新发布的豆包大模型1.6也展现了火山引擎要降低大模型使用成本的决心。

据火山引擎总裁谭待现场表示,豆包1.6首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。豆包1.6的综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。

豆包此番“双箭齐发”,字节跳动摁下Agent(智能体)加速键。

国内首个支持256K上下文的思考模型豆包1.6正式发布

今年以来,字节跳动的进化频率几乎要从“季更”演变为“月更”。

4月,豆包发布1.5深度思考模型,具备“边想边搜”和视觉版的多模态能力。5月,豆包视频生成模型 Seedance 1.0 lite发布,豆包1.5视觉深度思考模型也同时发布。6月,到了本次的大会上,豆包1.6正式登场。据介绍,豆包1.6系列当前由三个模型组成,分别是doubao-seed-1.6、doubao-seed-1.6-thinking和doubao-seed-1.6-flash。

doubao-seed-1.6是“all-in-one”的综合模型,支持深度思考、多模态理解、图形界面操作等多项能力。据谭待介绍,该模型在自适应思考下,可以根据prompt(提示词)难度自动决定是否开启thinking(思考),在提升效果的情况下,大幅减少tokens开销。

doubao-seed-1.6-thinking是1.6系列在深度思考方面的强化版本,在许多基础能力上都有进一步提升;doubao-seed-1.6-flash则是1.6系列的极速版本,有着极低的延迟。值得一提的是,doubao-seed-1.6也是国内首个支持256K上下文的思考模型,并且1.6的三个模型不论版本都支持256K上下文。

从1.5进化到1.6的豆包,同样拿出了出色的测评成绩。谭待称,在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包1.6-thinking的表现已跻身全球前列。豆包还应景地当了一回“考生”,通过高考试卷测试了一次推理能力。谭待表示,今年高考前,在针对海淀区模拟全卷的测评中,豆包1.6相对去年的表现,理科成绩显著提升了154分,文科提升了90分。

据介绍,豆包1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题。本次图形界面操作能力的升级让豆包1.6进一步具备“行动力”。

演示案例显示,豆包1.6可自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。这是豆包1.6的视觉深度思考能力和精准的视觉定位能力在发挥作用,能够让智能体与浏览器及其他软件进行交互和操作,高效执行各类任务。

除了豆包1.6之外,视频生成模型Seedance 1.0 Pro同样是本次大会的焦点。谭待在会上分享了第三方权威榜单Artificial Analysis的最新结果:“豆包视频生成模型在文生视频、图生视频两个维度都超越了业界诸多主流模型,登顶全球竞技场第一。”

Artificial Analysis文生视频榜单图片来源:豆包公众号

Seedance 1.0 Pro的特点在于无缝多镜头叙事、多动作的随心运镜,以及稳定运动与真实美感。基于这些技术突破,其已在电商内容制作、游戏资产生成及影视预演等关键商业场景展开应用探索。

价格方面,Seedance 1.0 pro是0.015元/千tokens,相当于每生成一条5秒的1080P视频只需3.67元。谭待在现场进行了直观地换算:“假如你有1万元预算,可以做多少条5秒的1080P视频?通过Seedance 1.0 pro,你可以制作超过2700条视频;而通过lite(豆包5月发布的视频生成模型Seedance 1.0 lite),你可以完成9700多条视频。”

谭待在后续采访中补充道,Seedance 1.0 Pro除了生成效果好与价格低之外,还有速度快这一特点,模型生成视频仅需几十秒。

字节跳动摁下Agent加速键

若说起AI(人工智能)领域的最大焦点,Agent是绕不开的话题。谭待在会后接受包括《每日经济新闻》记者在内的媒体群访时表示,做好Agent最重要的是底层模型一定是多模态深度思考的模型。“如果不是基于多模态深度思考模型,基本上基于Agent能做出来的事情是很有限的,而且是很初级的。”

谭待认为,技术主体经历了三个时代变化,AI时代会推动开发范式与技术架构全面升级。他说:“PC(个人计算机)时代主体是Web(网络),移动时代是App(应用程序),AI时代则是Agent。Agent能够自主感知、规划和反思,完成复杂任务,从被动工具转变为主动执行者。”

但Agent的token消耗量,相对大模型“聊天”阶段已经是直线上升。谭待举例称,最初一个人跟模型聊一个小时才消耗20多万的token,而Agent做一个任务可能就是同样的消耗。所以需要模型使用成本降下来,才能推动Agent的规模化应用。

为了把使用的价格打下来,豆包1.6首创按“输入长度”区间定价。在企业使用量最大的0K-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。

谭待在群访中表示,豆包的宗旨是在技术取得一定成果后,最大限度释放技术红利,让业界开发者和企业受益,以加速AI应用发展。他举例称,去年推出豆包1.0时,通过模型结构与工程优化将价格降低99%,带动业界众多公司跟进,推动了中国大模型的发展。

事实上,势在模型性能和价格两方面都做出突破的火山引擎已经获得了阶段性的成绩。谭待在大会上公布的最新数据显示——到今年五月底,豆包大模型日均tokens使用量超过16.4万亿,较去年5月首次发布时增长达到了137倍。并且,根据国际数据公司(IDC)报告,豆包大模型在中国公有云大模型市场份额排名第一,占比高达46.4%。

Agent发展的洪流势不可挡,豆包大模型的能力升级和价格降低,一方面进一步促进了生态繁荣,另一方面也快速地跑马圈地,试图逐渐成为产业智能化的“地基”。目前,在行业应用上,豆包大模型服务着全球TOP 10手机厂商中的9家、8成主流汽车品牌、70%的系统重要性银行及超5成985高校。

在谭待看来,目前豆包能得到的行业认可诀窍就是心诚,“要让更多人运用AI创造价值,怎么做呢?就是三件事——把模型做好,把成本做低,把应用性、落地性各种工具做好。”

知名经济学者、工信部信息通信经济专家委员会委员盘和林在接受《每日经济新闻》记者采访时表示,tokens费用的降价有利于销售,主要是吸引企业用户更多地使用豆包,嵌入豆包的API(应用程序编程接口)接口,这样会壮大豆包生态。但对于其他大模型厂商,可能会进入新一轮“价格战”。

更多资讯可关注第一黄金网微信公众号
更多精彩财经资讯,点击这里下载第一黄金网APP
31 收藏


    相关阅读

    导航

    本站郑重声明:第一黄金网中的操作建议仅代表第三方观点与本平台无关,投资有风险,入市需谨慎。据此交易,风险自担。