当前位置:首页 > 科技  > 手机

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

来源: 责编: 时间:2025-09-30 10:15:53 70观看
导读 快科技9月29日消息,今天下午DeepSeek突然发布了DeepSeek v3.2-Exp大模型,这是前几天发布DeepSeek v3.1终结版之后的又一大动作,很符合重大节日前DeepSeek发新模型的习惯。DeepSeek v3.2的亮点很多,但是大家不必

快科技9月29日消息,今天下午DeepSeek突然发布了DeepSeek v3.2-Exp大模型,这是前几天发布DeepSeek v3.1终结版之后的又一大动作,很符合重大节日前DeepSeek发新模型的习惯。meF28资讯网——每日最新资讯28at.com

DeepSeek v3.2的亮点很多,但是大家不必关注于这个模型能力有多好,从她exp的后缀就可以看出它本质上是DeepSeek探索新技术用的,这方面才有价值。meF28资讯网——每日最新资讯28at.com

DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。meF28资讯网——每日最新资讯28at.com

DeepSeek v3.2还是小版本进步,大家关心的还是DeepSeek重大版本升级,也就是传闻了很久的DeepSeek v4及r2,尤其是v4这种基座大模型。meF28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练meF28资讯网——每日最新资讯28at.com

推上一个名为DeepSeek News Commentary的账号表示v4将于10月发布,带来100万上下文、GRPO驱动推理及NSA/SPCT等技术,数学、编程能力大幅提升,同时速度极快,成本也极低。meF28资讯网——每日最新资讯28at.com

这个账号的属地也是杭州,但目前来看并非DeepSeek官方账号,消息真实性值得商榷。meF28资讯网——每日最新资讯28at.com

不过10月份发布DeepSeek v4也不是完全没可能,毕竟DeepSeek v3.2是技术验证方向的,是在为DeepSeek v4重大技术升级探路。meF28资讯网——每日最新资讯28at.com

还有一点需要注意,DeepSeek v4早在四五月份就说要发布,但官方一直不为所动,期间还被传出什么训练失败之类的负面消息,只是这些传闻不足为信,无非是抹黑国产大模型及算力不及美国罢了。meF28资讯网——每日最新资讯28at.com

DeepSeek v4发布应该是需要一个重要契机,那就是与国产算力芯片全面适配,这一点DeepSeek官方之前已经明确了,下一代将支持FP8算法,与国产芯片全面适配。meF28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练meF28资讯网——每日最新资讯28at.com

现在已经不少国产AI芯片宣布支持FP8算法了,但是这方面的适配显然需要一个领头羊,那就是华为昇腾,联系一下前几天的大约上华为高调宣布昇腾路线图,明年Q1时候的昇腾950PR不仅支持FP4,还支持FP4,算力达到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8 /HiF8/MXFP4/HiF4等数据格式,互联带宽为2TB/s,内存容量和带宽做到了144GB、4TB/s。meF28资讯网——每日最新资讯28at.com

显然昇腾950PR上市的时候,DeepSeek V4才是佳的登场时刻,此前也早有消息称DeepSeek已经使用国产AI芯片训练,v3.2就同时支持CUDA和TileLang,v4自然也不会落下。meF28资讯网——每日最新资讯28at.com

后续DeepSeek v4肯定还会有其他国产AI芯片的适配版的,包括寒武纪、海光等。meF28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练meF28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-186418-0.htmlDeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 华为首次公开!MatePad Mini全系麒麟芯片:典藏版确认麒麟9010

下一篇: 余承东被任命为华为公司IRB主任:仍继续负责华为终端、鸿蒙智行等业务

标签:
  • 热门焦点
  • 对标苹果的灵动岛 华为带来实况窗功能

    继苹果的灵动岛之后,华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示,华为的实况窗可以更高效的展现出实时通知,比如锁屏上就能看到外卖、打车、银行
  • 6月iOS设备好评榜:第一蝉联榜首近一年

    作为安兔兔各种榜单里变化最小的那个,2023年6月的iOS好评榜和上个月相比没有任何排名上的变化,仅仅是部分设备好评率的下降,长年累月的用户评价和逐渐退出市场的老款机器让这
  • 6月安卓手机性能榜:vivo/iQOO霸占旗舰排行榜前三

    2023年上半年已经正式过去了,我们也迎来了安兔兔V10版本,在新的骁龙8Gen3和天玑9300发布之前,性能榜的榜单大体会以骁龙8Gen2和天玑9200+为主,至于那颗3.36GHz的骁龙8Gen2领先
  • 掘力计划第 20 期:Flutter 混合开发的混乱之治

    在掘力计划系列活动第20场,《Flutter 开发实战详解》作者,掘金优秀作者,Github GSY 系列目负责人恋猫的小郭分享了Flutter 混合开发的混乱之治。Flutter 基于自研的 Skia 引擎
  • 得物效率前端微应用推进过程与思考

    一、背景效率工程随着业务的发展,组织规模的扩大,越来越多的企业开始意识到协作效率对于企业团队的重要性,甚至是决定其在某个行业竞争中突围的关键,是企业长久生存的根本。得物
  • 多线程开发带来的问题与解决方法

    使用多线程主要会带来以下几个问题:(一)线程安全问题  线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间,该数据被其他的线程所修改,那么对于当前线程而言,该线程
  • 雅柏威士忌多款单品价格大跌,泥煤顶流也不香了?

    来源 | 烈酒商业观察编 | 肖海林今年以来,威士忌市场开始出现了降温迹象,越来越多不断暴涨的网红威士忌也开始悄然回归市场理性。近日,LVMH集团旗下苏格兰威士忌品牌雅柏(Ardbeg
  • 中国家电海外掘金正当时|出海专题

    作者|吴南南编辑|胡展嘉运营|陈佳慧出品|零态LT(ID:LingTai_LT)2023年,出海市场战况空前,中国创业者在海外纷纷摩拳擦掌,以期能够把中国的商业模式、创业理念、战略打法输出海外,他们依
  • 三星推出Galaxy Tab S9系列平板电脑以及Galaxy Watch6系列智能手表

    2023年7月26日,三星电子正式发布了Galaxy Z Flip5与Galaxy Z Fold5。除此之外,Galaxy Tab S9系列平板电脑以及三星Galaxy Watch6系列智能手表也同期
Top