苹果新 Speech 技术出击!34 分钟 4K 视频转录仅需 45 秒,速度超 OpenAI 55%

近日,科技媒体 macstories 通过一项实测,揭示了苹果公司全新推出的 SpeechAPI 的强大性能。通过转录一段长达 34 分钟、大小为 7GB 的 4K 视频,该技术仅用时 45 秒完成转录,速度之快令人惊叹。

这项技术的推出是在 年 WWDC 全球开发者大会上宣布的,其中包括两个重要模块:SpeechAnalyzer 和 SpeechTranscriber。macstories 团队使用了基于这些模块开发的 Yap 应用工具,对其转录性能进行了详细测试。结果显示,Yap 在处理视频时展现出了显著的速度优势,远超目前市场上其他主流转录工具。

在与竞争对手的对比中,Yap 完成转录所需时间为 45 秒,而 的 Whisper(MacWhisperV3Turbo 版本) 则需要 101 秒,速度慢了 55%。其他工具如 VidCap 和 MacWhisperV2 的转录时间分别为 1 分 55 秒和 3 分 55 秒,这进一步突显了 Yap 的优势。

尽管所有工具在专有名词识别方面存在一定误差,比如在转录 「AppStories」 时的识别不准确,但 Yap 的本地化运算能力使其在处理速度上具有无可比拟的优势。这意味着,如果用户每周处理多段视频,使用 Yap 将节省大量时间,提升工作效率。

苹果在转录技术领域的这一创新不仅提高了效率,也为、教育工作者和内容制作者带来了便利。随着这项技术的普及,未来我们可能会看到更多企业在视频处理和内容生成方面的应用。总之,苹果的这项新技术标志着语音转录领域的一次革命,未来的内容生产将因其而变得更加高效与智能。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

​字节跳动推出的 AI 视频生成模型 Seedance 1.0 悄然超越谷歌 Veo 3

2025-6-19 1:21:03

AI 资讯

硅基流动与阿里云合作 核心 API 服务将全面接入阿里云百炼平台

2025-6-19 1:21:28

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索