当前位置:首页 > 元宇宙 > AI

科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1

来源: 责编: 时间:2025-03-04 15:05:19 232观看
导读 3 月 3 日消息,科大讯飞今日宣布星火 X1 升级,并发布星火一体机等系列新品。其中,深度推理大模型星火 X1 再升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1。科大讯飞表示,此次升级在数学答题效果上全面提升,尤其

3 月 3 日消息,科大讯飞今日宣布星火 X1 升级,并发布星火一体机等系列新品。ul128资讯网——每日最新资讯28at.com

其中,深度推理大模型星火 X1 再升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1。ul128资讯网——每日最新资讯28at.com

科大讯飞表示,此次升级在数学答题效果上全面提升,尤其是应对竞赛级难题表现显著。同时,星火 X1 在中小学数学作业的批改、辅导以及题目推荐等任务上也展现出了明显的优势。ul128资讯网——每日最新资讯28at.com

ul128资讯网——每日最新资讯28at.com

测试集合来源:中文测试集来自 2023/2024 年各学段考试真题 / 模拟题 / 竞赛题,英文测试集来自 AIME 2024/2025 和 MATH 500 竞赛集

在升级后的星火 X1 加持下,讯飞晓医、星火教师助手、AI 法官助理等应用与产品也实现升级,附官方介绍如下:ul128资讯网——每日最新资讯28at.com

讯飞晓医首发星火医疗大模型 X1

本次升级,讯飞医疗首发星火医疗大模型 X1,号称“大幅降低了医疗幻觉问题”,在回答复杂问题时,能够逐步解释循证过程,提高了医疗复杂场景推理的逻辑正确性、专业性、可解释性。在诊断推荐、健康咨询、检查检验报告解读等推理任务上效果均已大幅超过了 GPT-4o 以及 DeepSeek R1。ul128资讯网——每日最新资讯28at.com

ul128资讯网——每日最新资讯28at.com

数据来源:晓医、智医助理、安贞心内科等测试集

目前星火医疗大模型 X1 正式应用于 AI 健康助手“讯飞晓医”,与个人健康档案的融合更加深入,在用户健康咨询时,它能深度洞察用户健康状况并思考潜在需求,解决了过往 AI 医疗咨询中“建议答案宽泛不实用”的痛点,给出的医疗建议更加个性化、更具体实用。ul128资讯网——每日最新资讯28at.com

例如,用户在咨询疾病用药时,晓医能够循证指出该疾病正确的用药原则,同时结合个人既往健康状况,给出更适合更详实的处理意见和注意事项。ul128资讯网——每日最新资讯28at.com

星火教师助手

基于讯飞星火 X1 的全面升级,面向备授课的星火教师助手也进一步升级,给出了更清晰、更详实的 AI 教学思路。ul128资讯网——每日最新资讯28at.com

ul128资讯网——每日最新资讯28at.com

在备课时,比起之前直接线性流程生成教学设计,现在的星火教师助手能够结合教师意图,明确教学的重难点和要达成的目标,并在教学设计生成过程中一步步进行说明,便于老师理解生成内容的逻辑性、启发创新灵感。ul128资讯网——每日最新资讯28at.com

在授课过程中,通过思维链显性化呈现,能让师生实时观测认知思维构建过程,让课堂互动更直观,更易于探究式课堂开展。ul128资讯网——每日最新资讯28at.com

这些能力已在数学、语文、历史等多个学科上进行了应用。ul128资讯网——每日最新资讯28at.com

升级后的星火教师助手,实现了教育教学中 AI 工具的“思维可视化”,从学生对基础问题的提问,到复杂问题的进阶探究都有迹可循,更加有助于教学创新和学生高阶思维能力培养。ul128资讯网——每日最新资讯28at.com

AI 法官助理

本次升级,科大讯飞将星火长思维链深度推理技术、法律法规和司法解释等专业知识、法律专家思维链深度融合,号称不仅解决了传统大模型存在的知识幻觉问题,同时提升了证据审查、量刑辅助、裁判观点总结等复杂场景所需的法律推理能力。ul128资讯网——每日最新资讯28at.com

ul128资讯网——每日最新资讯28at.com

例如在裁判观点总结场景,根据卷宗材料总结案件事实,根据事实与匹配的法律法规和案例逐条分析对比,并将过程可视化,输出附有法理依据的裁判观点,为办案提供决策依据。ul128资讯网——每日最新资讯28at.com

目前星火大模型能力已经贯穿案情分析、证据审查、庭审提纲辅助生成、裁判辅助等多个环节。ul128资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11330-0.html科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 智谱宣布超10亿融资成功,杭州城投等助力,2025年将迎开源大模型发布

下一篇: 国内首个光子 AI 智能引擎在南京诞生

标签:
  • 热门焦点
  • 8个最适合艺术家发行NFT的交易市场

    近年来,加密风靡全球。加密圈最令人兴奋的方面之一是它能够用于创建称为NFT 的数字资产。从 CyberKitties 到 Cyber Galleries,NFT 已成为艺术家和艺术鉴赏家的
  • 从冰墩墩到无聊猿,解秘未来IP爆款的模因

    打造IP,是建设元宇宙的刚需。NFT能直接让IP的价值变现;虚拟人IP是元宇宙的第一入口,而元宇宙要搭建的,就是一个个品牌IP星球,考验的是IP世界观的建设能力。如果说在
  • Terra链上TVL跃升至第二

    据DefiLlama数据显示,当前,Terra链上应用锁仓的加密资产价值(TVL)为172.1亿美元,在公链板块中已跃升至第二,超越了币安智能链TVL的118亿美元,TVL排名居首的仍为以太
  • 重温 1602 年:DAO 是新的企业范式吗?

    作者:Andrew Singer“ 将你的选票委托给行业有能力的专家,将使所有者在这些公司的管理中拥有更强大、更清晰的话语权 。”1602 年,荷兰东印度公司成立,许多人认为
  • 小众有趣NFT艺术作品欣赏(1)

    随着NFT发展火热,越来越多领域与NFT融合,NFT艺术在加密领域中占据了很大一部分。NFT艺术与传统艺术有相似之处,也有完全不同的地方。NFT艺术与传统艺术一样,表现了
  • NFT自动售货机来啦!

    “纽约市有一台售卖 Solana NFT 的自动售货机,用信用卡就能买”Solana NFT 市场 Neon 可让您使用信用卡亲自购买 NFT,无需使用加密货币。由于基于 Solana 链的 N
  • NFTs正迎来数十亿美元的繁荣--NFT零工经济从业者开始暴赚

    当Stefan Prodanovic在13岁时开始尝试平面设计,与一位从事编程工作的学校朋友共同创作数字游戏时,他从未料到这个爱好会在他成年后变成一个相当有利可图的生意。
  • 2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    UGC作为元宇宙的主要内容创作模式,已经越来越多的呈现于游戏、娱乐、社交、传媒等方面,UGC模式勾勒了元宇宙的边界,现今元宇宙UGC模式的主要呈现方式以元宇宙概念
  • 全球十大元宇宙概念游戏

    A股市场中,不少游戏公司早早搭上了元宇宙概念。举例,中青宝宣称将发布一款元宇宙概念的模拟经营类游戏,尽管游戏尚在研发中,这一消息已经让中青宝的股价在51个交易
Top