当前位置:首页 > 科技  > 数码

速度与准确性的权衡:苹果新语音转录 API 对比测试

来源: 责编: 时间:2025-07-04 12:12:11 99观看
导读 7 月 4 日消息,科技媒体 9to5Mac 昨日(7 月 3 日)发布博文,对比测试了苹果系统的全新转录 API,认为该 API 在速度上优于 OpenAI 的 Whisper 模型,但在准确性上仍有一定差距。注:该媒体使用一段 9to5Mac Daily 的播客

7 月 4 日消息,科技媒体 9to5Mac 昨日(7 月 3 日)发布博文,对比测试了苹果系统的全新转录 API,认为该 API 在速度上优于 OpenAI 的 Whisper 模型,但在准确性上仍有一定差距。s8U28资讯网——每日最新资讯28at.com

注:该媒体使用一段 9to5Mac Daily 的播客音频测试,长度为 7 分 31 秒,对比了苹果的新转录 API、OpenAI 的 Whisper Large v3 Turbo(通过 MacWhisper 应用)和英伟达的 Parakeet v2 模型。s8U28资讯网——每日最新资讯28at.com

s8U28资讯网——每日最新资讯28at.com

测试平台为 M2 Pro 芯片的 MacBook Pro 笔记本,配备了 16GB 内存,使用 Metric: cer 和 Metric: wer 两款 Hugging Face Spaces 来分析实际的字符错误率(CER)和单词错误率(WER)。s8U28资讯网——每日最新资讯28at.com

结果显示,Parakeet v2 的转录时间最短,仅为 2 秒,但 CER 和 WER 较高;Whisper Large V3 Turbo 的准确性最高,但转录时间长达 40 秒;苹果的模型在速度上接近 Parakeet,但准确性优于后者。s8U28资讯网——每日最新资讯28at.com

模型转录时间字符错误率单词错误率Parakeet v22 seconds5.8%12.3%Whisper Large V3 Turbo40 seconds0.2%1.5%Apple9 seconds1.9%10.3%

该媒体还使用了 ChatGPT、Claude 和 Gemini为基线来计算 CER 和 WER。结果显示,每个模型的性能都有所不同,但 Whisper 在准确性上仍领先。s8U28资讯网——每日最新资讯28at.com

ChatGPT (o4-mini-high)s8U28资讯网——每日最新资讯28at.com

模型转录时间字符错误率单词错误率Parakeet v22 seconds6.0%12.3%Whisper Large V3 Turbo40 seconds0.4%1.4%Apple9 seconds2.1%10.2%

Claude (Sonnet 4)s8U28资讯网——每日最新资讯28at.com

模型转录时间字符错误率单词错误率Parakeet v22 seconds8.4%11.0%Whisper Large V3 Turbo40 seconds0.1%1.0%Apple9 seconds3.5%8.2%

Gemini (2.5 Pro)s8U28资讯网——每日最新资讯28at.com

模型转录时间字符错误率单词错误率Parakeet v22 seconds7.6%12.3%Whisper Large V3 Turbo40 seconds0.3%0.4%Apple9 seconds3.4%5.3%

相关阅读:s8U28资讯网——每日最新资讯28at.com

《8 秒转录 30 分钟播客:MacWhisper 应用接入英伟达 Parakeet 模型》s8U28资讯网——每日最新资讯28at.com

《45 秒 AI 转录 34 分钟 4K 视频:苹果 Speech 技术力压群雄,比 OpenAI Whisper 快 55%》s8U28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-166017-0.html速度与准确性的权衡:苹果新语音转录 API 对比测试

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 小米手环 8 全量推送桌搭模式,“闲置手环再就业”秒变机器人

下一篇: 全球首款三折叠屏手机华为 Mate XT 官方首次降价:全系优惠 2000 元(17999 元起),另 Mate X5 直降 4000 元(8999 元起)

标签:
  • 热门焦点
  • JavaScript 混淆及反混淆代码工具

    介绍在我们开始学习反混淆之前,我们首先要了解一下代码混淆。如果不了解代码是如何混淆的,我们可能无法成功对代码进行反混淆,尤其是使用自定义混淆器对其进行混淆时。什么是混
  • Rust中的高吞吐量流处理

    作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库,还使用这些库实现了一个流处理程序
  • CSS单标签实现转转logo

    转转品牌升级后更新了全新的Logo,今天我们用纯CSS来实现转转的新Logo,为了有一定的挑战性,这里我们只使用一个标签实现,将最大化的使用CSS能力完成Logo的绘制与动画效果。新logo
  • 不容错过的MSBuild技巧,必备用法详解和实践指南

    一、MSBuild简介MSBuild是一种基于XML的构建引擎,用于在.NET Framework和.NET Core应用程序中自动化构建过程。它是Visual Studio的构建引擎,可在命令行或其他构建工具中使用
  • 深度探索 Elasticsearch 8.X:function_score 参数解读与实战案例分析

    在 Elasticsearch 中,function_score 可以让我们在查询的同时对搜索结果进行自定义评分。function_score 提供了一系列的参数和函数让我们可以根据需求灵活地进行设置。近期
  • 微软邀请 Microsoft 365 商业用户,测试视频编辑器 Clipchamp

    8 月 1 日消息,微软近日宣布即将面向 Microsoft 365 商业用户,开放 Clipchamp 应用,邀请用户通过该应用来编辑视频。微软于 2021 年收购 Clipchamp,随后开始逐步整合到 Microsof
  • Temu起诉SHEIN,跨境电商战事升级

    来源 | 伯虎财经(bohuFN)作者 | 陈平安日前据外媒报道,拼多多旗下跨境电商平台Temu正对竞争对手SHEIN提起新诉讼,诉状称Shein“利用市场支配力量强迫服装厂商与之签订独家
  • 华为开发者大会2023日程公开:开设鸿蒙HarmonyOS 4体验区

    IT之家 7 月 31 日消息,华为今日公布了 HDC.Together 开发者大会 2023 的详细日程。整场大会将于 8 月 4 日-6 日之间举行,届时将发布最新一代鸿蒙 H
  • AI芯片初创公司Tenstorrent获三星和现代1亿美元投资

    Tenstorrent是一家由芯片行业资深人士Jim Keller领导的加拿大初创公司,专注于开发人工智能芯片,该公司周三表示,已经从现代汽车集团和三星投资基金等
Top