您当前的位置:中国科学网>资讯>正文

我把导航语音换成了父亲的声响

放大字体  缩小字体 时间:2019-09-19 12:22:45 作者:责任编辑。王凤仪0768

  文/宇多田

  先说个题外话。

  今年夏天,或许没有哪部悬疑剧能比《轮到你了》更火。

  这部被称为实际生活版“狼人杀”的日本悬疑电视剧,让全网都在跟着反响有点愚钝的男主一同在5层公寓里寻觅连环杀人案凶手。

  可是,也在静静追剧的技能宅们和我等科技屁民,对这部剧的关注点,稍微有那么一点误差

  比如,坐在我周围计算机专业结业的妹子,在看到剧里的理工男男二号对着电脑击打代码一闪而过的屏幕时,静静允许表明:

  “他确实在给男主做那个组成了妻子语音的AI软件(男主的妻子叫菜奈,因而这款软件叫菜奈AI,有点类似于换了语调的Siri),你看他正在编的便是一个日历的代码。”

  “不过,你看他提过用 javascript 编,但人工智能要先用Python练习,或许C++优化¥%&*¥%……”(此处省掉一万字)

  被她发现的代码

  而作为一名科技屁民,尽管还达不到技能宅的精神境界,但由于职业病,我对剧中的理工男“二阶堂”开宣布的菜奈AI语音软件与AI监犯猜测体系,也怀有很大的爱好。

  (当然,我严峻置疑AI监犯猜测体系输入的数据量或许有点不行;另一个古怪的点是剧情没表演菜奈AI软件制作者是怎么获取菜奈的语音数据的)。

  菜奈AI(上图),从界面就很好了解,这其实便是一个定制版Siri(语音帮手)。

  但之所以能让男主角每次都能对着它泪如泉涌(菜奈被杀),便是由于这个Siri完美组成了菜奈的说话音谐和口气,像是一向在他身边。

  实际上,单看组成声响这件工作,从技能视点来看并没有让人觉得多么奇特。

  还记得科大讯飞在2016年发布的那段爆火的“奥巴马用中文预祝活动圆满成功”的视频吗?那时候就现已让群众充分认识到了语音组成的文娱影响力。

  其时的语音工程师们从网上下载了很多奥巴马网的讲演音频和视频资料,用神经网络对其进行剖析,终究组成了声响和嘴型都十分匹配的假视频。

  当然,这项技能最成功的使用场景,当属地图导航里的林志玲姐姐和郭德纲大哥。

  可是这几天,百度地图等导航软件又忽然赶着在十一假日到来之前,拿出这套并不新的技能做了一个产品设计上的“微立异”:

  假设你好像对导航里各路女神的声响彻底无感了,没问题,不如…就用老婆或许爸爸妈妈的声响时不时“吓唬”一下自己好了。

  就在前天App里静静上线的“定制个人导航语音”功用,让我严峻置疑他们的产品司理是受了《轮到你了》里菜奈AI语音软件的启示。

  而我的榜首反响,是对作用产生了严峻置疑。

  由于整个语音的组成过程反常简略,根本能够总结为一句话:

  读20个语句,然后再等15分钟让体系自动组成。

  已然等待时刻长度能够承受,我终究决议,把一切版别都测验一遍。当然,还有低龄儿童版别……我也试了。

  为了恪守“要在特别安静环境下录制”“用普通话朗诵,吐字明晰”等一堆附加条件,我只能钻进办公室的一个犄角角落里投入到录制环节……

  读语句自身其实不难,可是假设你要在一个特别静的环境里字正腔圆地读出:

  “差人叔叔,来查看每个人的车票”,“佩奇和乔治,证耍弄他的玩具”以及“熊大和熊二在喝蜂蜜”,“喜洋洋,快想个办法”……

  请必定保证周围没人,你才不会有太多羞耻感,或许是便利“入戏”(整个状况需求一向“端着”,莫非这便是黄渤的声响在导航里不对味的原因?)。

  此外咱们发现,尽管录制语音包有四个版别,可是电影版别的“台词”其实最不容易读好,大约是由于略长,并且个个像勉励电影里的名言警句,读之前感觉自己要先积累起“一身正气”。

  实际上,假设你一开始不会觉得15分钟的语音组成练习作用能输出多么传神的音效,那么这个成果肯定会高出你的预期;

  可是,假设你觉得这15分钟模型练习时刻能够彻底仿制自己的声响,那你也想多了。

  这是我用引荐阅览版别、卡通版别、电影版别以及男声低龄儿童版录制的语音导航。其间,引荐版别与卡通版别的作用最好,与我自己的实在声响比较,类似度能够到达70%~80%。

  不过能够显着听出,卡通版别的声响稍微尖细和洪亮,并且语速更快。

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!