• 2025-05-20 07:38:34
  • 阅读(2058)
  • 评论(13)
  • 近日,AI独角兽MiniMax稀宇极智发布新一代语音大模子Speech-02,宣布该模子正在国际最权威的两项语音评测榜单Artificial Analysis(环球知名AI基准测试机构)和Hugging Face TTS Arena (抱抱脸文本转语音竞技场)上,超越OpenAI、ElevenLabs等国际巨头,登上双榜榜首。

    国际权威语音评测榜单Artificial Analysis 泉源:以下图片均由Minimax方供应

    据介绍,Speech-02正在语音模子核心技术指标:字错率WER和类似度SIM等客观指标上获得了SOTA结果,用户盲听客观评价反馈也表现其更自然、实正在。

    与Seed-TTS、CosyVoice 2和实正在音频比拟,Speech-02正在中英文的零样本语音克隆中均实现了更低的字错率(Word Error Rate, WER),表明其发音错误率更低且更清楚稳定。正在SIM方面,Speech-02正在所有24种测试说话中均明显优于ElevenLabs的multilingual_v2模子,前者天生的语音更切近亲近真人输出。

    展开盈余 31 %

    Hugging Face TTS Arena 评测榜单

    值得关注的是,Speech-02性能登顶的同时,其商用定价仅为环球头部语音模子ElevenLabs的四分之一,具有高性能和性价比双重优势。目前,MiniMax已正在文旅导览、金融服务、语音助手、AI教诲等领域应用其大模子服务。

    发布于:上海市
    16  收藏