meiwanlanjun
meiwanlanjun

llEleven语音合成工具。

我们之前一直都在用的AI语音,其实有一个非常严重的缺陷,那就是它没有办法模仿人类在说话时候的真正的语气起伏和情绪,确实有一些语音已经有这种功能可以模仿人类的情绪了。

我可以给你演示一下,我们用这个悲伤的语气来生成一段语音。

这种AI语音其实已经算是目前顶级的AI语音了,它能够模仿人类的情绪和语气,而且这种程度的AI语音在我看来已经能够达到,被影视作品用来当做配音的这个级别了。

但是问题在哪里,就是我们在现实生活中的真人对话交流的时候,说话并不是这样的,你可以给AI语音一个语气和情绪,这个没有问题,但是当你给AI语音指定一个情绪之后,这个AI只会从头到尾带着这个情绪把这段话读出来,它在这个过程的AI语音的更新已经把这个问题几乎完美的解决了,你可以来到eleven labs的这个页面上,这个新功能在,speech sentences这个语音合成的模块里面,在这模块里面你可以看到有两个语音生成的任务选项,第一个就是文字转语音,就是我们传统的,你输入一段字,然后AI会把这段字用它的合成的声音读出来,第二个选项就是它最近更新的这个新功能,叫做语音转语音,这个功能的工作方式是你先给它输入一段语音,这段语音里面可能带有你自己的情绪,带有你自己说话时候的风格和节奏的起伏,在你输入了这段语音之后,AI就会用另一种声音把这段语音再复述出来,而在它复述的过程中你的情绪,你的节奏和性格气质全都被保留,有的我们来试一下,首先选择这个语音转语音的功能,然后选择一个你喜欢的AI声音,然后接下来你就可以上传你原本的语音文件,或者说现场录制一段,然后你在录好了之后,你可以预览一下你刚刚录的这段声音,这是AI。

你可以看到,它已经把你刚刚说的内容用另外一个声音复述出来了,而且这个声音是,跟你说话时候的情绪节奏是完全一致的,我们再换一个声音试一下,听到了吧,这种情绪的起伏和节奏,是之前我们用传统,这种AI语音,完全没有办法模拟出来的。

目前我能想到这个工具的最大的用途,就是你知道有一些特定的领域,他们的里面的观众大部分都是男性,比如说电子游戏,或者其他的财经,或者说理工科之类相关的领域,在这些领域里面,如果有一个女性的创作者,或者是女性的主播的话,他一定会很受欢迎,所以我能够想到的是,可能会有一些非常具有商业头脑的人,在这些特定的领域,把自己的声音变成另外一个性别,同时保留自己说话的节奏和自己的风格,这样的话,用这种工具肯定能收获更多观众的喜爱,同时这也给我们观众一个提醒,那就是你不能相信互联网上的任何形象,任何一个你觉得很可爱的甜妹,都有可能是是一个抠脚大汉,但如果你要说这个功能是AI语音行业一个颠覆性的发明的话,我觉得倒也不至于,因为现在这种不同的AI语音形式,实际上都有它们各自比较适合的使用场景的,比如说如果你在做一些偏向信息类或者知识类的内容的话,那用这种传统的AI语音我觉得还是,最好的选择,因为它的重点在于它能够帮你节省大量的时间,如果你用真人去录制你的旁白的话,那你录制一个1千字的文稿,可能需要花费半个小时到一个小时左右的时间,当然也要看你自己的熟练度,如果说你在录制的过程中有更多的口误,或者说经常会犯一些错误的话,那可能需要时间还会更长,而用这种AI语音的话,你就可以直接把你的文稿贴进来,然后点一下鼠标,在几秒之内就能够完全生成一份可以用的配音,那这种传统的AI语音的最大特点在于,它的效率非常高,而如果你想让你的频道,或者你的内容,能够更多的保留一些人性的元素在里面,你会想让观众有一种跟人在沟通的感觉的话,那这个新功能也许是更好的选择,因为你可以保留你自己真人说话的语气和节奏,能够给观众一种是真人在跟他沟通的感觉,而实际上这个声音,可能并不一定是你真实的声音,所以现在各种各样的工具都有了,至于如何去用,用哪一个就完全取决于你自己的创造力,想象力,以及你具体的使用场景

CC BY-NC-ND 4.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…

发布评论