
随着各种AI语音生成模型的推出,语音生成技术(Text-to-Speech,TTS)发展迅速,同时用户对语音生成的需求日益增长,这使得对不同语音模型的评估变得尤为重要。
然而,如何进行评估?又该从何入手?这成为了一个新的问题。
为了帮助使用者更便捷、客观地选择最符合自身需求的语音模型,302.AI推出了一款新工具:语音竞技场。该工具集成了来自中外5家最热门的TTS模型,提供超200种语音音色,用户不仅可以随机或自主选择两个音色进行文生语音比较,还可以选择音色模型并设置参数,用以批量生成语音。
I. 302.AI 语音竞技场界面展示与介绍
应用界面展示:
语音竞技场主要分为四个页面:音色PK、语音生成、排行榜、历史记录。

案例展示:
1、语音PK:
我们建议用户在评判语音优劣时可参考以下维度:
(1)自然度与清晰度:语音是否接近日常人声的流畅性和抑扬顿挫,无机械感或断续感。
(2)可懂度:语音内容是否在各种环境下保持清晰和易于理解。
(3)多情感与风格化:能否生成丰富的情感如愤怒、喜悦、悲伤等,并保持自然流畅。
2、语音生成-文本生成
音色:FishAudio-雷军
3、语音生成-语音克隆
上传的原音频:
(Tips:原音频声音越清晰克隆效果越好)
生成音频:
——————————————————————————————————
赛里木湖原话原声:
对比克隆后的效果:
II. 302.AI语音竞技场功能详解:
1、语音PK
(1)模型资源丰富:语音PK所支持的语音模型共5种、超200个音色,均为目前海内外市场上最热门的选择,测评结果更具客观性。

(2)语速调整:用户可以根据不同的特定场景进行语速(0.25倍-2倍)的设置,以便在进行语音PK时能够更好地挑选符合需求的模型。

(3)匿名客观公平:用户可随机或自选两个音色模型进行文生语音,投票选出效果更佳的模型。随机模型PK以匿名盲选形式进行,避免受主观偏好的干扰,结果更加客观公正。

2、语音生成
支持多种语音生成方式,包括:文本生成语音、语音转语音、语音克隆
(1)文本生成语音:支持单文本、多文本、单音色、多音色生成。
提供OpenAI、Azure、Doubao、FishAudio、Minimax语音模型,可满足用户不同需求。

另外针对不同语音模型,我们还使用中文文本进行了测试,以下测试结果供参考:
OpenAI:可生成自然流畅的英文语音,但中文语音会有典型的”外国人说中文”的味道。
Azure:支持中文方言,且文言文的特殊读音也能准确发音。
Doubao:提供了多种特色方言,比如四川话、粤语等,但对于一些生僻字或特殊发音的识别可能存在误差。
FishAudio:提供了一些特色音色,比如雷军、麦当劳、央视配音。但中文的文言文读音可能不够准确。
Minimax:中文语音生成自然流畅,情感表达细腻,能较好地把握中文语音的语调和情感变化,但实测发现文言文的特殊多音字可能无法提供准确的读音。
(2)语音转语音:通过上传录音或者在线录音,将录音文件转换成所需要的音色语音。
(PS. 上传的文件大小限制会因选择的音色不同而有所不同,支持MP3、 FLAC、 M4A、WAV等音频格式,AAC格式暂不支持。)

(3)语音克隆:
首先通过上传声音文件或录音,创建自定义声音模型。上传的声音文件要求最短10秒,最长90秒,推荐25秒。

创建完成后,输入文本并选择自定义的声音模型即可生成所需的语音。

3、排行榜
在语音PK中产生的结果,会自动统计到排行榜中,从而直观地评估各模型的优劣。测试次数越多,结果越客观。

4、历史记录
生成作品管理:语音PK以及语音生成的作品都会在历史记录页面展示,用户可查看过往所有的生成内容并进行删除或者下载,下载格式为MP3格式。

5、更多功能
灵活创作及高效翻译:无论是语音对比还是语音生成模块,用户均可点击随机生成文本。同时,还可迅速将文本翻译为中文、英文及日语。

III. 如何在302.AI上使用
302.AI提供按需付费无订阅的服务模式,用户可以根据自身业务需求灵活选择使用。
AI 语音竞技场的使用
步骤指引 :登录302.AI后,点击左侧菜单栏应用超市→找到【语音竞技场】。

Ⅳ.302.AI语音竞技场开源链接
语音竞技场现已在Github上开源,用户可在此基础上进行二次开发或本地化部署,以便实现更符合自身业务需求的功能扩展。
直达链接:https://github.com/302ai/302_ai_voice_arena/blob/main/README.md
想体验语音竞技场?
👉立即注册免费试用302.AI,开启你的AI之旅!👈
为什么选择302.AI?
● 灵活付费:无需月费,按需付费,成本可控
● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求
● 开源生态:支持开发者深度定制,打造专属AI应用
● 易用性:界面友好,操作简单,快速上手
