免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > MiniMax发布Speech-02,力压国际巨头夺双榜榜首,推动国内AI语音技术领先全球

MiniMax发布Speech-02,力压国际巨头夺双榜榜首,推动国内AI语音技术领先全球

时间:2025-05-20 18:45

小编:小世评选

近日,上海的AI科技独角兽MiniMax稀宇极智发布了其最新的语音大模型——Speech-02,不仅引发了业内的广泛关注,更在国际领先的两大权威语音评测榜单——Artificial Analysis和Hugging Face TTS Arena上,成功超越OpenAI和ElevenLabs等多家国际巨头,荣登双榜榜首。这一成就再次印证了我国在AI语音生成技术领域的突破性进展,标志着中国在全球AI技术竞争中的地位日益凸显。

据悉,Speech-02在多个关键技术指标上取得了显著的成果,特别是在字错率(WER)和相似度(SIM)等客观评估上表现优异。最新的测试结果表明,Speech-02在中英文零样本语音克隆任务中都实现了更低的发音错误率,为用户提供了清晰而稳定的语音输出。相较于其他国的先进模型,如Seed-TTS和CosyVoice 2,Speech-02的表现不仅令人瞩目,更为用户带来了更加真实、自然的听觉体验。

在对生成语音进行主观评价时,用户反馈同样倾向于选择Speech-02生成的音频,指出其听感更加舒服,语调更贴近人类自然发声。这一切,都表明Speech-02具备了技术领先的特质,成为了用户更加青睐的选择。

Speech-02在设计上的灵活性和多样性,为用户带来了诸多便利。其“文生音”功能是一个亮点,它允许用户根据给定的自然语言文本描述生成相应的音色,使得语音生成更加个性化。Speech-02同样具备“声音参考”功能,用户可以对任意给定的语音进行灵活控制,包括情感、语速、音高以及语种的自由切换,其技术的便捷性和实用性引发广泛赞誉。更令人振奋的是,Speech-02支持多达32种语言的生成,用户可以在同一段语音中自由切换多种语言,显示出其在多语言处理方面的强大优势。

值得一提的是,尽管Speech-02的技术水平与国际头部产品相当,但其商用定价仅为ElevenLabs语音模型的四分之一。这一极具竞争力的定价将助力国产AI语音技术的广泛应用和商业化落地,为国内各行业的发展注入强大动能。

MiniMax的这项新产品已经在多个领域展现出了强大的应用潜力,包括文旅导览、金融服务、智能语音助手和AI教育等领域。同时,AI玩具、教育学习机和汽车智能座舱等硬件场景也已形成了成熟的解决方案。MiniMax与国内多家知名企业开展了深度合作,如声网、阅文集团旗下的起点读书、高途教育以及香港电视台等。同时,MiniMax还在海外市场积极拓展,与Hedra、Moescape AI和Dusmart等全球机构建立了良好的合作关系。

从1月份发布的Speech-01语音模型到现今的Speech-02,MiniMax的技术进步有目共睹。Speech-01已经支持17种语言和上百种音色,迅速在北美、英国、澳大利亚、日韩、意大利、巴西等20多个国家和地区实现了落地合作。随着Speech-02的推出,MiniMax再次强化了自身在AI语音领域的实力和影响力,不仅料想今后的发展前景广阔,更预示着中国在全球人工智能领域的崛起。

MiniMax的Speech-02不仅是技术创新的结晶,更是中国AI语音技术走向世界的标志。随着这一新一代语音大模型的发布,MiniMax正在引领国内AI语音技术迅猛发展,为全球语音技术的发展方向树立了新的标杆。未来,随著技术的不断进步,Speech-02将更广泛地应用于更丰富的场景中,为创造更加智能化的生活带来新的可能性。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多