当前位置:首页 > 科技  > 软件

豆包 1.5・深度思考模型发布!效果好、低延迟、多模态

来源: 责编: 时间:2025-04-18 06:47:48 228观看
导读 随着 AI 技术的快速发展,AI 已从过去的感知 AI、生成式 AI,快速迈入 Agentic AI 时代。AI 正在进化出端到端的自主决策和执行能力,走向核心生产环节。火山引擎总裁谭待今天,在 FORCE LINK AI 创新巡展・杭州站,火

随着 AI 技术的快速发展,AI 已从过去的感知 AI、生成式 AI,快速迈入 Agentic AI 时代。AI 正在进化出端到端的自主决策和执行能力,走向核心生产环节。sVU28资讯网——每日最新资讯28at.com

sVU28资讯网——每日最新资讯28at.com

火山引擎总裁谭待sVU28资讯网——每日最新资讯28at.com

今天,在 FORCE LINK AI 创新巡展・杭州站,火山引擎公布了模型、Agent 工具、云基础设施的最新进展,旨在帮助企业更快、更省地构建和部署 Agent 应用:发布豆包 1.5・深度思考模型,升级豆包・文生图模型 3.0、豆包・视觉理解模型。同时,面向 Agent 服务,发布 OS Agent 解决方案、GUI Agent 大模型 —— 豆包 1.5・UI-TARS 模型;面向大规模推理,发布 AI 云原生・ServingKit 推理套件。sVU28资讯网——每日最新资讯28at.com

截至 2025 年 3 月底,豆包大模型日均 tokens 调用量已超过 12.7 万亿,是 2024 年 12 月的 3 倍,是一年前刚刚发布时的 106 倍。IDC 报告显示,2024 年中国公有云大模型调用量激增,火山引擎以 46.4% 的市场份额位居中国市场第一。sVU28资讯网——每日最新资讯28at.com

sVU28资讯网——每日最新资讯28at.com

sVU28资讯网——每日最新资讯28at.com

深度思考模型能够让 AI 模拟人类的思维过程,对复杂问题进行精准分析和逻辑推导。sVU28资讯网——每日最新资讯28at.com

全新发布的豆包 1.5・深度思考模型,在数学、代码、科学等专业领域推理任务中表现出色,已经达到或接近全球第一梯队水平;在创意写作等非推理任务中,模型也展示出优秀的泛化能力,能够胜任更广泛和复杂的使用场景。sVU28资讯网——每日最新资讯28at.com

sVU28资讯网——每日最新资讯28at.com

为了提升模型的通用能力,模型团队优化了数据处理策略,把可验证数据与创意性数据进行融合处理,满足各类任务的需求。此外,大规模强化学习是训练推理模型的关键技术,通过采用创新的双轨奖励机制,兼顾“对错分明”和“见仁见智”的任务,有效实现了算法的可靠优化。sVU28资讯网——每日最新资讯28at.com

豆包 1.5・深度思考模型采用 MoE 架构,总参数为 200B,激活参数仅 20B,具备显著的训练和推理成本优势。基于高效算法,豆包 1.5・深度思考模型在提供行业极高并发承载能力的同时,实现 20 毫秒极低延迟。sVU28资讯网——每日最新资讯28at.com

在解决生活生产中的具体问题时,大模型要能够查询互联网信息,进行多轮搜索和思考。与其他推理模型“先搜索再思考”的模式不同,豆包 App 基于豆包 1.5・深度思考模型进行了定向训练,可以“边想边搜”。sVU28资讯网——每日最新资讯28at.com

例如,让豆包 App 推荐露营装备:一对夫妻带两个孩子去露营,温度低,有雨,希望把装备买齐,预算 4,000 元以内,还要兼顾便携性和安全性。豆包 1.5・深度思考模型可以拆解每个具体需求的注意事项,规划信息,然后经过 3 轮搜索,给出了预算范围内、细致周到的推荐。sVU28资讯网——每日最新资讯28at.com

此外,豆包 1.5・深度思考模型还具备视觉理解能力,可以像人类一样,不光基于文字思考,更能基于所见画面思考,思考更立体,让模型同时拥有“大脑”和“眼睛”。sVU28资讯网——每日最新资讯28at.com

更好的模型性能、更低的延迟、加上视觉推理能力,将为深度思考模型打开更广泛的应用空间、解决更复杂的问题。即日起,企业用户可以在火山方舟平台使用豆包 1.5・深度思考模型。sVU28资讯网——每日最新资讯28at.com

sVU28资讯网——每日最新资讯28at.com

此次全新升级的豆包・文生图模型 3.0,能够实现更好的文字排版表现、实拍级的图像生成效果,以及 2K 的高清图片生成方式。可以广泛应用于影视、海报、绘画、玩偶设计等营销、电商、设计场景。sVU28资讯网——每日最新资讯28at.com

sVU28资讯网——每日最新资讯28at.com

小字与长文本生成、排版更美观sVU28资讯网——每日最新资讯28at.com

在最新的文生图领域权威榜单 Artificial Analysis 竞技场中,豆包・文生图 3.0 模型已超越业界诸多主流模型,排名全球第一梯队。sVU28资讯网——每日最新资讯28at.com

sVU28资讯网——每日最新资讯28at.com

sVU28资讯网——每日最新资讯28at.com

新版本的豆包・视觉理解模型具备更强的视觉定位能力,支持多目标、小目标、通用目标的框定位和点定位,并支持定位计数、描述定位内容、3D 定位。可应用于线下门店的巡检场景、GUI agent、机器人训练、自动驾驶训练等。sVU28资讯网——每日最新资讯28at.com

同时,新版本在视频理解能力上也有大幅提升,比如记忆、总结理解、速度感知、长视频理解等。豆包・视觉理解模型结合向量搜索,可直接对视频进行语义搜索,广泛适用于安防、家庭看护等商业化场景。sVU28资讯网——每日最新资讯28at.com

sVU28资讯网——每日最新资讯28at.com

更强的模型为我们打开了更广阔的应用空间。未来,AI Agent 将同时在“应用 Agent”和“OS Agent”两个方向上并行发展。sVU28资讯网——每日最新资讯28at.com

应用 Agent 具备更强的专业性,如客服 Agent、数据 Agent、代码 Agent 等,可以专注于完成特定领域的任务。sVU28资讯网——每日最新资讯28at.com

比如在代码 Agent 领域,相比于传统的 AI 插件产品,国内首个 AI IDE(AI 原生的集成开发环境工具)——Trae 可以让开发者和 AI 更智能的协作,实现软件开发的交付化(交付软件而不仅是代码)、智能化(意图理解-自主规划-调用工具-自主开发)、协作化(与用户在各个维度上进行协作)。sVU28资讯网——每日最新资讯28at.com

OS Agent 则拥有跨场景的通用性和灵活性,能够直接操作浏览器、电脑、手机或其他 Agent,完成复杂任务。今年 Manus 等通用 Agent 的火爆也点燃了市场对 OS Agent 的热情。sVU28资讯网——每日最新资讯28at.com

大会上,火山引擎正式发布 OS Agent 解决方案,未来两周将陆续上线火山引擎官网。sVU28资讯网——每日最新资讯28at.com

该解决方案通过火山引擎 veFaaS 平台对豆包大模型能力进行封装,可以让企业和开发者轻松构建轻量级的 Code use 和 Browser use。而针对任务相对复杂的 Computer Use 和 Mobile Use Agent,则可以通过 ECS 或云手机等调用豆包 1.5・UI-TARS 模型,驱动图形用户界面交互,精准识别用户的任务需求,进行感知、自主推理并准确行动。sVU28资讯网——每日最新资讯28at.com

想做出好的 Agent 同样离不开好的大模型。针对复杂的 OS Agent,火山引擎正式发布 GUI Agent 大模型 —— 豆包 1.5・UI-TARS 模型。该模型将屏幕视觉理解、逻辑推理、界面元素定位和操作整合在单一模型中,突破了传统自动化工具依赖预设规则的局限。目前,豆包 1.5・UI-TARS 模型已在火山方舟平台上线。sVU28资讯网——每日最新资讯28at.com

sVU28资讯网——每日最新资讯28at.com

好的模型和工具能够加速 Agent 的落地,但 Agent 也会带来更大量的推理消耗,因此 AI 时代需要更好的云原生架构来支持。sVU28资讯网——每日最新资讯28at.com

为此,火山引擎推出 ServingKit 推理套件,帮助企业实现模型的快速部署、推理优化、运维可观测。sVU28资讯网——每日最新资讯28at.com

ServingKit 推理套件可在 2 分钟内完成 671B DeepSeek R1 下载和预热,13 秒完成推理引擎的加载。sVU28资讯网——每日最新资讯28at.com

同时,为了降低推理过程中的时延、提高资源利用率,火山引擎 EIC 将KV cache 命中率提高了 10 倍,在 100% cache 命中场景下TPS 吞吐量可提高至 5 倍以上;而通过对算子、AI 网关、VKE 编排调度的优化和升级,可以大幅度降低 GPU 消耗。sVU28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-144987-0.html豆包 1.5・深度思考模型发布!效果好、低延迟、多模态

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 英伟达 CEO 黄仁勋:坚定不移服务中国市场

下一篇: 联想智会三大场景解决方案亮相 InfoComm 展,三包 plus 服务升级 3.0

标签:
  • 热门焦点
  • 对标苹果的灵动岛 华为带来实况窗功能

    继苹果的灵动岛之后,华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示,华为的实况窗可以更高效的展现出实时通知,比如锁屏上就能看到外卖、打车、银行
  • 红魔电竞平板评测:大屏幕硬实力

    前言:三年的疫情因为要上网课的原因激活了平板市场,如今网课的时代已经过去,大家的生活都恢复到了正轨,这也就意味着,真正考验平板电脑生存的环境来了。也就是面对着这种残酷的
  • 一年经验在二线城市面试后端的经验分享

    忠告这篇文章只适合2年内工作经验、甚至没有工作经验的朋友阅读。如果你是2年以上工作经验,请果断划走,对你没啥帮助~主人公这篇文章内容来自 「升职加薪」星球星友 的投稿,坐
  • 微信语音大揭秘:为什么禁止转发?

    大家好,我是你们的小米。今天,我要和大家聊一个有趣的话题:为什么微信语音不可以转发?这是一个我们经常在日常使用中遇到的问题,也是一个让很多人好奇的问题。让我们一起来揭开这
  • 在线图片编辑器,支持PSD解析、AI抠图等

    自从我上次分享一个人开发仿造稿定设计的图片编辑器到现在,不知不觉已过去一年时间了,期间我经历了裁员失业、面试找工作碰壁,寒冬下一直没有很好地履行计划.....这些就放在日
  • 三分钟白话RocketMQ系列—— 如何发送消息

    我们知道RocketMQ主要分为消息 生产、存储(消息堆积)、消费 三大块领域。那接下来,我们白话一下,RocketMQ是如何发送消息的,揭秘消息生产全过程。注意,如果白话中不小心提到相关代
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 华为Mate60标准版细节曝光:经典星环相机模组回归

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
  • iQOO 11S或7月上市:搭载“鸡血版”骁龙8Gen2 史上最强5G Soc

    去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,iQOO 11不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞屏,同时在快充
Top