1.小红书交互
小红书智创音频技术团队近日发布新一代对话合成模型 FireRedTTS-2该模型聚焦现有方案的痛点:灵活性差、发音错误多、说话人切换不稳、韵律不自然等问题,通过升级离散语音编码器与文本语音合成模型全面优化合成效果。
2.小红书艺声
在多项主客观测评中,FireRedTTS-2 均达到行业领先水平,为多说话人对话合成提供了更优解决方案

3.小红书的语音现场
论文标题:FireRedTTS-2: Towards Long Conversational Speech Generation for Podcast and Chatbot技术报告:https://arxiv.org/pdf/2509.02020
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。


评论(0)