当前位置:首页 > 科技  > 网络

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

来源: 责编: 时间:2025-06-17 19:13:35 167观看
导读 编程王者Claude地位不稳了??大模型竞技场新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。要知道Claude Opus 4可是公认的“全球强编码模型”。so,能在编程上战胜Claude Opus 4,DeepSee

编程王者Claude地位不稳了??E6o28资讯网——每日最新资讯28at.com

大模型竞技场新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。E6o28资讯网——每日最新资讯28at.com

要知道Claude Opus 4可是公认的“全球强编码模型”。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

so,能在编程上战胜Claude Opus 4,DeepSeek-R1-0528到底啥来头?E6o28资讯网——每日最新资讯28at.com

看名字你可能以为是个小版本更新,但实际上——E6o28资讯网——每日最新资讯28at.com

它在LiveCodeBench上几乎与OpenAI o3-high相当,乃至一众网友猜测其为传说中的R2。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

这样一看,在编程这一项上,双方貌似都不太好惹~E6o28资讯网——每日最新资讯28at.com

所以话不多说,咱们还是一手实测DeepSeek-R1-0528,康康究竟有多强。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

实测一下E6o28资讯网——每日最新资讯28at.com

目前DeepSeek-R1-0528已上线DeepSeek官方网站、App和小程序(打开深度思考)。E6o28资讯网——每日最新资讯28at.com

这里咱们直接进入官网体验。E6o28资讯网——每日最新资讯28at.com

测试1:制作一个太阳系的动画应用程序E6o28资讯网——每日最新资讯28at.com

提示词如下:E6o28资讯网——每日最新资讯28at.com

制作一个太阳系的动画应用程序,使用网络搜索。E6o28资讯网——每日最新资讯28at.com

仅思考49秒后,DeepSeek-R1-0528就给出了一段python代码。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

用VS Code运行后,结果如下:E6o28资讯网——每日最新资讯28at.com

出现了能自主运行的动画,不过页面相对粗糙。E6o28资讯网——每日最新资讯28at.com

不过呢,如果换成其他提示词,效果则明显不一样了。E6o28资讯网——每日最新资讯28at.com

用Three.js模拟太阳系,鼠标悬停在星球上时显示星球名称。E6o28资讯网——每日最新资讯28at.com

仅用时34秒,DeepSeek-R1-0528就理清楚了设计思路:E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

关键是这一次能直接一键运行了,无需再单独打开自己的编辑器。(运行功能感觉像开盲盒,不一定都会出现)E6o28资讯网——每日最新资讯28at.com

而且同样有动画、能交互,效果直接进入Next Nevel~E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

测试2:前端网页制作E6o28资讯网——每日最新资讯28at.com

接下来我们要求DeepSeek生成一个主题为AGI的网站,提示词如下:E6o28资讯网——每日最新资讯28at.com

请设计一个以通用人工智能(AGI)为主题的网页,包含“知识共享”、“社区”和“未来创造”三个概念部分。每个部分应配有相应的图标和简洁描述,整体风格现代且科技感十足,突出AGI的创新和协作精神。使用HTML、CSS和JavaScript实现交互和视觉特效。E6o28资讯网——每日最新资讯28at.com

思考23秒后,DeepSeek-R1-0528后续给出了一段HTML代码,依旧能一键运行。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

测试3:创建一个俄罗斯方块小游戏E6o28资讯网——每日最新资讯28at.com

后我们试试英文提示词:E6o28资讯网——每日最新资讯28at.com

Create a full featured version of tetris with beautiful graphics and controls.E6o28资讯网——每日最新资讯28at.com

创建一个具有精美图形和控制功能的完整版俄罗斯方块。E6o28资讯网——每日最新资讯28at.com

可以看到,DeepSeek-R1-0528思考12秒后就给出了一段python代码。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

运行结果be like:E6o28资讯网——每日最新资讯28at.com

虽然确实是俄罗斯方块小游戏,但基本演示存在明显bug,而且缺少交互按钮。E6o28资讯网——每日最新资讯28at.com

不死心的我们尝试让DeepSeek继续改进,结果第二次还是翻车了。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

改进后的游戏依旧无法正常运行(总是穿墙而过),且未实现我们明确要求的交互功能。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

小结一下,从以上简单实测来看,DeepSeek新版R1作为一款开源模型,在编程能力上确实大有进步,但仍有一定提升空间。E6o28资讯网——每日最新资讯28at.com

不过有一说一,它对咱们国内普通用户明显更友好(相对Claude模型来说免费又易于获取)。E6o28资讯网——每日最新资讯28at.com

One More ThingE6o28资讯网——每日最新资讯28at.com

除了编程能力榜单更新,DeepSeek新版R1还当选了当前好的开源文本模型。E6o28资讯网——每日最新资讯28at.com

MIT许可证下,总榜第六,开源当中第一。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

而在细分领域,它在困难提示方面排名第4,在数学方面排名第5,属于开源模型中相当能打的玩家。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

不过值得一提的是,Kimi新模型刚刚拿下代码开源SOTA——E6o28资讯网——每日最新资讯28at.com

参数量仅72B的开源代码模型Kimi-Dev,在SWE-bench Verified上以60.4%的成绩取得开源SOTA。E6o28资讯网——每日最新资讯28at.com

不仅编程水平比新的DeepSeek-R1还强,和闭源模型比较也表现优异。E6o28资讯网——每日最新资讯28at.com

网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一E6o28资讯网——每日最新资讯28at.com

不知道其真实能力又如何呢(doge)~E6o28资讯网——每日最新资讯28at.com

 E6o28资讯网——每日最新资讯28at.com


文章出处:量子位

本文链接:http://www.28at.com/showinfo-17-160494-0.html网页编程众测排名:DeepSeek-R1超越Claude 4加冕全球第一

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 股民或可考虑!美的集团“不差钱”拟大手笔回购股票

下一篇: 吉卜力风手游爆火 可灵+Midjourney生成的!教程已出 支持复刻

标签:
  • 热门焦点
  • 5月iOS设备好评榜:iPhone 14仅排第43?

    来到新的一月,安兔兔的各个榜单又重新汇总了数据,像安卓阵营的榜单都有着比较大的变动,不过iOS由于设备的更新换代并没有那么快,所以相对来说变化并不大,特别是iOS好评榜,老款设
  • 量化指标是与非:挽救被量化指标扼杀的技术团队

    作者 | 刘新翠整理 | 徐杰承本文整理自快狗打车技术总监刘新翠在WOT2023大会上的主题分享,更多精彩内容及现场PPT,请关注51CTO技术栈公众号,发消息【WOT2023PPT】即可直接领取
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • 重估百度丨“晚熟”的百度云,能等到春天吗?

    ©自象限原创作者|程心排版|王喻可2016年7月13日,百度云计算战略发布会在北京举行,宣告着百度智能云的正式启程。彼时的会场座无虚席,甚至排队排到了门外,在场的所有人几乎都
  • 猿辅导与新东方的两种“归途”

    作者|卓心月 出品|零态LT(ID:LingTai_LT)如何成为一家伟大企业?答案一定是对“势”的把握,这其中最关键的当属对企业战略的制定,且能够站在未来看现在,即使这其中的
  • 三星Galaxy Z Fold/Flip 5国行售价曝光 :最低7499元/12999元起

    据官方此前宣布,三星将于7月26日也就是明天在韩国首尔举办Unpacked活动,届时将带来带来包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
  • AMD的AI芯片转单给三星可能性不大 与台积电已合作至2nm制程

    据 DIGITIMES 消息,英伟达 AI GPU 出货逐季飙升,接下来 AMD MI 300 系列将在第 4 季底量产。而半导体业内人士表示,近日传出 AMD 的 AI 芯片将转单给
  • 三翼鸟智能家居亮相电博会,让用户体验更真实

    2021电博会在青岛国际会展中心开幕中,三翼鸟直接把“家”搬到了现场,成为了展会的一大看点。这也是三翼鸟继9月9日发布了行业首个一站式定制智慧家平台后的
Top