苹果新 Speech API 转录速度惊人,胜过 OpenAI Whisper 55%

科技媒体 macstories 发布了一篇关于苹果新推出的 SpeechAPI 的博文,引发了业界的广泛关注。通过对一段时长 34 分钟、大小达 7GB 的 4K 视频文件进行转录测试,结果显示,苹果的新 SpeechAPI 仅耗时 45 秒,速度远超其他同类工具。相较之下, 的 Whisper 转录时间为 101 秒,苹果的技术优势可见一斑,提升了约 55% 的效率。

苹果在 年全球开发者大会 WWDC 上首次宣布了这一 Speech 框架,框架中包含了 SpeechAnalyzer 和 SpeechTranscriber 两款模块。这一技术的推出,标志着苹果在语音处理领域的进一步突破,尤其是在速度和准确性方面的提升。

在具体的测试中,媒体使用了基于新模块开发的 Yap 应用进行转录。通过对比不同工具的表现,Yap 以 45 秒的快速转录时间,成为了市场上表现最优的选择。相对而言,MacWhisper(基于 OpenAI 的 Whisper 开源语音转录模型) 需要 1 分 41 秒,而 VidCap 则需要 1 分 55 秒。更早版本的 MacWhisper(V2) 甚至要耗时 3 分 55 秒。

虽然所有测试工具在识别专有名词时都出现了一定误差,比如 「AppStories」 的识别,但 Yap 在本地化运算上的优势,确保了其在处理多段视频时的效率更为显著。通过计算每周处理多段视频所节省的时间,用户可以显著提高工作效率。

这项技术的快速发展,不仅为视频内容提供了便利,也为后续的应用场景拓展奠定了基础。未来,随着 的不断演进,苹果在领域可能会推出更多创新的解决方案,进一步提升用户体验。

划重点:

🌟苹果新 SpeechAPI 转录 34 分钟 4K 视频仅需 45 秒,速度超越竞争对手。

⏱️与 OpenAIWhisper 相比,苹果技术提升了约 55% 的效率,表现显著。

📈本地化运算优势使 Yap 在多段视频处理上效率更高,为用户节省大量时间。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

Meta 豪掷 1 亿美元挖角 OpenAI 人才,奥尔特曼回应:我们不会走!

2025-6-19 1:23:17

AI 资讯

特斯拉 Grok 车载 AI 助手即将上线,个性化定制让驾驶更有趣

2025-6-19 1:23:41

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索