当前位置:首页 > 科技  > 手机

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

来源: 责编: 时间:2025-09-30 10:15:53 86观看
导读 快科技9月29日消息,今天下午DeepSeek突然发布了DeepSeek v3.2-Exp大模型,这是前几天发布DeepSeek v3.1终结版之后的又一大动作,很符合重大节日前DeepSeek发新模型的习惯。DeepSeek v3.2的亮点很多,但是大家不必

快科技9月29日消息,今天下午DeepSeek突然发布了DeepSeek v3.2-Exp大模型,这是前几天发布DeepSeek v3.1终结版之后的又一大动作,很符合重大节日前DeepSeek发新模型的习惯。BTx28资讯网——每日最新资讯28at.com

DeepSeek v3.2的亮点很多,但是大家不必关注于这个模型能力有多好,从她exp的后缀就可以看出它本质上是DeepSeek探索新技术用的,这方面才有价值。BTx28资讯网——每日最新资讯28at.com

DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。BTx28资讯网——每日最新资讯28at.com

DeepSeek v3.2还是小版本进步,大家关心的还是DeepSeek重大版本升级,也就是传闻了很久的DeepSeek v4及r2,尤其是v4这种基座大模型。BTx28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练BTx28资讯网——每日最新资讯28at.com

推上一个名为DeepSeek News Commentary的账号表示v4将于10月发布,带来100万上下文、GRPO驱动推理及NSA/SPCT等技术,数学、编程能力大幅提升,同时速度极快,成本也极低。BTx28资讯网——每日最新资讯28at.com

这个账号的属地也是杭州,但目前来看并非DeepSeek官方账号,消息真实性值得商榷。BTx28资讯网——每日最新资讯28at.com

不过10月份发布DeepSeek v4也不是完全没可能,毕竟DeepSeek v3.2是技术验证方向的,是在为DeepSeek v4重大技术升级探路。BTx28资讯网——每日最新资讯28at.com

还有一点需要注意,DeepSeek v4早在四五月份就说要发布,但官方一直不为所动,期间还被传出什么训练失败之类的负面消息,只是这些传闻不足为信,无非是抹黑国产大模型及算力不及美国罢了。BTx28资讯网——每日最新资讯28at.com

DeepSeek v4发布应该是需要一个重要契机,那就是与国产算力芯片全面适配,这一点DeepSeek官方之前已经明确了,下一代将支持FP8算法,与国产芯片全面适配。BTx28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练BTx28资讯网——每日最新资讯28at.com

现在已经不少国产AI芯片宣布支持FP8算法了,但是这方面的适配显然需要一个领头羊,那就是华为昇腾,联系一下前几天的大约上华为高调宣布昇腾路线图,明年Q1时候的昇腾950PR不仅支持FP4,还支持FP4,算力达到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8 /HiF8/MXFP4/HiF4等数据格式,互联带宽为2TB/s,内存容量和带宽做到了144GB、4TB/s。BTx28资讯网——每日最新资讯28at.com

显然昇腾950PR上市的时候,DeepSeek V4才是佳的登场时刻,此前也早有消息称DeepSeek已经使用国产AI芯片训练,v3.2就同时支持CUDA和TileLang,v4自然也不会落下。BTx28资讯网——每日最新资讯28at.com

后续DeepSeek v4肯定还会有其他国产AI芯片的适配版的,包括寒武纪、海光等。BTx28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练BTx28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-186848-0.htmlDeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 一加Ace 6T原神神里绫华定制版上手:定制还得看一加

下一篇: 华为Mate80 Pro Max用了一周 这几个亮点真的戳中我了

标签:
  • 热门焦点
  • K60至尊版狂暴引擎2.0加持:超177万跑分斩获性能第一

    Redmi的后性能时代战略发布会今天下午如期举办,在本次发布会上,Redmi公布了多项关于和联发科的深度合作,以及新机K60 Ultra在软件和硬件方面的特性,例如:“K60 至尊版,双芯旗舰
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • 三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • .NET 程序的 GDI 句柄泄露的再反思

    一、背景1. 讲故事上个月我写过一篇 如何洞察 C# 程序的 GDI 句柄泄露 文章,当时用的是 GDIView + WinDbg 把问题搞定,前者用来定位泄露资源,后者用来定位泄露代码,后面有朋友反
  • 腾讯盖楼,字节拆墙

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之“想重温暴刷深渊、30+技能搭配暴搓到爽的游戏体验吗?一起上晶核,即刻暴打!”曾凭借直播腾讯旗下代理格斗游戏《DNF》一
  • ESG的面子与里子

    来源 | 光子星球撰文 | 吴坤谚编辑 | 吴先之三伏大幕拉起,各地高温预警不绝,但处于厄尔尼诺大“烤”之下的除了众生,还有各大企业发布的ESG报告。ESG是“环境保
  • 小米汽车电池信息疑似曝光:容量101kWh,支持800V高压快充

    7月14日消息,今日一名博主在社交媒体发布了一张疑似小米汽车电池信息的照片,显示该电池包正是宁德时代麒麟电池,容量为101kWh,电压为726.7V,可以预测小
  • iQOO Neo8 Pro即将开售:到手价3099元起 安卓性能最强旗舰

    5月23日,iQOO如期举行了新品发布会,全新的iQOO Neo8系列也正式与大家见面,包含iQOO Neo8和iQOO Neo8 Pro两个版本,其中标准版搭载高通骁龙8+,而Pro版更
  • OPPO K11样张首曝:千元机影像“卷”得真不错!

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
Top