当前位置:首页 > 科技  > 手机

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

来源: 责编: 时间:2025-09-30 10:15:53 29观看
导读 快科技9月29日消息,今天下午DeepSeek突然发布了DeepSeek v3.2-Exp大模型,这是前几天发布DeepSeek v3.1终结版之后的又一大动作,很符合重大节日前DeepSeek发新模型的习惯。DeepSeek v3.2的亮点很多,但是大家不必

快科技9月29日消息,今天下午DeepSeek突然发布了DeepSeek v3.2-Exp大模型,这是前几天发布DeepSeek v3.1终结版之后的又一大动作,很符合重大节日前DeepSeek发新模型的习惯。YRR28资讯网——每日最新资讯28at.com

DeepSeek v3.2的亮点很多,但是大家不必关注于这个模型能力有多好,从她exp的后缀就可以看出它本质上是DeepSeek探索新技术用的,这方面才有价值。YRR28资讯网——每日最新资讯28at.com

DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。YRR28资讯网——每日最新资讯28at.com

DeepSeek v3.2还是小版本进步,大家关心的还是DeepSeek重大版本升级,也就是传闻了很久的DeepSeek v4及r2,尤其是v4这种基座大模型。YRR28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练YRR28资讯网——每日最新资讯28at.com

推上一个名为DeepSeek News Commentary的账号表示v4将于10月发布,带来100万上下文、GRPO驱动推理及NSA/SPCT等技术,数学、编程能力大幅提升,同时速度极快,成本也极低。YRR28资讯网——每日最新资讯28at.com

这个账号的属地也是杭州,但目前来看并非DeepSeek官方账号,消息真实性值得商榷。YRR28资讯网——每日最新资讯28at.com

不过10月份发布DeepSeek v4也不是完全没可能,毕竟DeepSeek v3.2是技术验证方向的,是在为DeepSeek v4重大技术升级探路。YRR28资讯网——每日最新资讯28at.com

还有一点需要注意,DeepSeek v4早在四五月份就说要发布,但官方一直不为所动,期间还被传出什么训练失败之类的负面消息,只是这些传闻不足为信,无非是抹黑国产大模型及算力不及美国罢了。YRR28资讯网——每日最新资讯28at.com

DeepSeek v4发布应该是需要一个重要契机,那就是与国产算力芯片全面适配,这一点DeepSeek官方之前已经明确了,下一代将支持FP8算法,与国产芯片全面适配。YRR28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练YRR28资讯网——每日最新资讯28at.com

现在已经不少国产AI芯片宣布支持FP8算法了,但是这方面的适配显然需要一个领头羊,那就是华为昇腾,联系一下前几天的大约上华为高调宣布昇腾路线图,明年Q1时候的昇腾950PR不仅支持FP4,还支持FP4,算力达到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8 /HiF8/MXFP4/HiF4等数据格式,互联带宽为2TB/s,内存容量和带宽做到了144GB、4TB/s。YRR28资讯网——每日最新资讯28at.com

显然昇腾950PR上市的时候,DeepSeek V4才是佳的登场时刻,此前也早有消息称DeepSeek已经使用国产AI芯片训练,v3.2就同时支持CUDA和TileLang,v4自然也不会落下。YRR28资讯网——每日最新资讯28at.com

后续DeepSeek v4肯定还会有其他国产AI芯片的适配版的,包括寒武纪、海光等。YRR28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练YRR28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-186418-0.htmlDeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 华为首次公开!MatePad Mini全系麒麟芯片:典藏版确认麒麟9010

下一篇: 余承东被任命为华为公司IRB主任:仍继续负责华为终端、鸿蒙智行等业务

标签:
  • 热门焦点
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • 为什么你不应该使用Div作为可点击元素

    按钮是为任何网络应用程序提供交互性的最常见方式。但我们经常倾向于使用其他HTML元素,如 div span 等作为 clickable 元素。但通过这样做,我们错过了许多内置浏览器的功能。
  • 共享单车的故事讲到哪了?

    来源丨海克财经与共享充电宝相差不多,共享单车已很久没有被国内热点新闻关照到了。除了一再涨价和用户直呼用不起了。近日多家媒体再发报道称,成都、天津、郑州等地多个共享单
  • 2天涨粉255万,又一赛道在抖音爆火

    来源:运营研究社作者 | 张知白编辑 | 杨佩汶设计 | 晏谈梦洁这个暑期,旅游赛道彻底火了:有的「地方」火了——贵州村超旅游收入 1 个月超过 12 亿;有的「博主」火了&m
  • 华为Mate60系列模具曝光:采用硕大圆形后置相机模组+拼接配色方案

    据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将迎来更新,有望在9-10月份带来全新的华为Mate60
  • 三星获批量产iPhone 15全系屏幕:苹果史上最惊艳直屏

    按照惯例,苹果将继续在今年9月举办一年一度的秋季新品发布会,有传言称发布会将于9月12日举行,届时全新的iPhone 15系列将正式与大家见面,不出意外的话
  • Android 14发布:首批适配机型公布

    5月11日消息,谷歌在今天凌晨举行了I/O大会,本次发布会谷歌带来了自家的AI语言模型PaLM 2、谷歌Pixel Fold折叠屏、谷歌Pixel 7a手机,同时发布了Androi
  • 苹果140W USB-C充电器:采用氮化镓技术

    据10 月 30 日 9to5 Mac 消息报道,当苹果推出新的 MacBook Pro 2021 时,该公司还推出了新的 140W USB-C 充电器,附赠在 MacBook Pro 16 英寸机型的盒子里,也支
  • 利用职权私自解除被封帐号 Meta开除20多名员工

    11月18日消息,据外媒援引知情人士表示,过去一年时间内,Facebook母公司Meta解雇或处罚了20多名员工以及合同工,指控这些人通过内部系统以不当方式重置用户帐号,其
Top