F5TTS – Ai声音克隆工具 克隆任何人的声音
软件大小有点大,打开的时候会比较慢,慢慢等,支持上传音频,也支持自己录制音频
以下是该软件的参数和玩法:
- 合成音频的时候,可以看见有2个类型,F5和E2,两者的区别在于F5训练更快,E2还原度更好。但是我实测下来,感觉F5效果更好,大家可以自己测试下看看。
- 生成播客功能(Podcast)
就是可以上传2个人的音频,然后输入对话的文本,可以合成语音播客。 - 多语气音频合成
就是允许你上传不同语气,比如开心、伤心、愤怒等情绪的音频,然后你输入你要合成的文本,在文本的指定位置用花括号指定情绪,然后合成语音,这样合成的语音就带有情绪更逼真了。