免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 数码科技 > 苹果新Speech API实测速度超越OpenAI Whisper,转录仅需45秒

苹果新Speech API实测速度超越OpenAI Whisper,转录仅需45秒

时间:2025-07-27 06:55

小编:小世评选

随着科技的迅速发展,语音转录技术正在不断演进,各大科技公司也在积极推出自己的解决方案。近日,来自科技媒体macstories的一项实测结果引起了广泛关注。该媒体在6月17日发布的博文中指出,苹果公司最新推出的Speech API在转录效率上远超OpenAI的Whisper模型。实测数据显示,对于一段长达34分钟、大小为7GB的4K视频,苹果的Speech API仅需45秒进行全程转录,而OpenAI Whisper所需时间则达到101秒,提升幅度超过55%。

苹果公司在2025年全球开发者大会(WWDC 2025)上宣布推出全新的Speech框架。这个框架包含了两个主要模组,分别是SpeechAnalyzer和SpeechTranscriber。借助这两款新工具的开发,macstories团队利用Yap应用进行转录测试,最终得到了上述的惊人结果。

在这次实测中,Yap的表现成为了焦点。除了速度之外,Yap在输出转录结果的格式方面也表现出色,支持SRT和TXT格式的输出,使得用户在后续编辑和使用中更加方便。相较之下,其他主流语音转录工具的表现则显得逊色,具体转录时间如下:

Yap: 45秒完成34分钟视频的转录。

MacWhisper(V3 Turbo): 1分41秒

VidCap: 1分55秒

MacWhisper(V2): 3分55秒

这组数据清晰地展现了苹果Speech API的速度优势。尽管所有测试工具在对专有名词的识别上都还存在一定误差,例如在识别"AppStories"时出现了错误,但Yap凭借地方化运算的特点,使得其在整体处理时间上具有明显的优势。在需要处理多段视频的场景中,Yap所带来的持续性时间节省可谓相当可观。

为了进一步探讨苹果新Speech API的潜力,我们不妨来看看它的技术基础。苹果Speech框架中的SpeechAnalyzer和SpeechTranscriber模块均采用了先进的深度学习和自然语言处理技术,这使得Yap在实时处理多种音频格式时,不仅能够快速生成文本,还能较好地理解语境。

除此之外,苹果在用户隐私方面也向来较为重视。Yap的转录过程是在本地进行的,这意味着用户的音频数据无需上传至云端,显著降低了隐私泄露的风险。在当今数据隐私越来越受到重视的背景下,这为用户使用Yap提供了更高的安全性。

尽管目前Yap在市场上的优势已显而易见,苹果显然并不满足于此。未来,随着苹果不断优化其Speech API,并扩大其应用范围,我们有理由相信,更多便捷的功能和更高效的处理速度将会相继推出。无论是在视频制作、教育,还是在内容创作领域,强大的语音转录技术都将成为用户提高工作效率的重要利器。

总体而言,苹果新Speech API凭借其出色的转录速度和良好的隐私保护,再加上不断更新的技术基础,定将在未来语音处理市场中占据一席之地。我们期待着看到该技术在各行各业中的实际应用效果,以及其给予创作者和用户带来的便利与启发。随着科技的持续进步,语音转录的未来定将更加光明。无论是科技行业,教育领域,还是内容创作,语音转录技术都将继续发挥其不可或缺的作用。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多