你的声响,说一句话就能被克隆

2018-06-04 13:54 泉源:大洋网

声希科技结合开创人钟静华、CEO孙立发博士、CTO李坤(左起)。广报全媒体记者轩慧摄

大洋网讯 似乎一夜之间,树立在声响之上的语音科技就要片面进入我们的生存,你只需会语言,就能指挥身边的一切智能产物。

人的声响是极具特性的,而如今,声响也能被转换,并且学习起来只需“一句话”的工夫?这种声响的邪术,究竟有何巧妙之处,又能为人类做些什么呢?为此,记者专访了现在在语音转换范畴国际排名第五的孙立发博士。

消沉男音秒变心爱声线

孙立发博士,结业于香港中文大学,他在2016年提出的“基于音素后验概率的语音转换办法”,现在在语音操控范畴被普遍使用,该项论文2016年取得国际顶级集会ICME最佳论文奖,现在他跟两个博士同窗在深圳创建了声希科技。

往年5月10日,在文博会主论坛之一的数字出书高端论坛上,科大讯飞副总裁章继东在讲坛上是如许引见语音转换技能的——“我只需给呆板念一段15分钟的故事,当前呆板就可以模拟我的声响,给我的孩子念林林总总的故事了。”

语音转换真的这么神奇吗?孙立发博士答复说:“是的。”孙立发博士是2018年国际语音转换竞赛环球第五名,他的技能特点是“一句话极速克隆”。便是说,只需求提供A的一句话,对呆板停止训练,呆板就能把B说的每一句话,酿成A的声响。并且,无论任何语种、任何内容都可以转换。

在孙立发博士的办公室里,孙立发给记者展现了他们正在测试的一款手机APP,孙立发用消沉的男中音说了句:“你好,我是志玲。”几秒钟之后,手机立刻用志玲姐姐那标记性的心爱声线,说出了“你好,我是志玲”。

已可使用于多种场景

科技的目标是让人们的生存愈加便当,语音转换能用来做什么呢?孙立发博士给记者引见了一系列语音转换技能的使用场景。

语音转换可以用在影戏配音上。比方说,一些港星来边疆开展,但平凡话说得不敷好,这时就可以用他的声响来训练呆板。当呆板乐成克隆了他的声响时,就可以把其别人的平凡话酿成他本来特有的声线。也便是说,周星驰假如再当男配角,影片在边疆刊行就没有石班瑜什么事了(注:周星驰影戏的平凡话版本大局部是石班瑜配音)。

语音转换可以用来打造特性化的语音助手和智能硬件。比方让siri用你爱人的声响,让家里的智能音箱用你偶像的声响,给爸爸妈妈买的伴随呆板人用你的声响语言……

语音转换技能可以用在手机游戏里添加脚色代入感。比方当你玩王者光彩,用程咬金这个好汉时,你跟队友语言时就会酿成集约的声线,用小妲己这个好汉时,又会酿成心爱的声响……

语音转换可以用来克隆名流的声响,用在有声书的范畴。同时,还可以用在动漫COSPLAY,如许不只仅外貌忠于原著脚色,连声响也可以跟原著如出一辙了。

语音转换还可以用来做言语学习。在孙立发的创业团队里,另一开创人李坤博士专攻的便是言语学习,两人把言语学习和语音转换停止了却合。他们做了一个英语纠错的APP,你说英语,它就能辨认你的发音,并准确定位动身音错误的中央,然后呆板会用你本人的声响再精确地念一次这个单词。孙立发说:“我们随着本人的声响念单词,显然会比随着其别人的声响念愈加精确愈加容易。”

用声纹辨认为声响“加锁”

随着语音转换技能越来越成熟,人们无疑会对声响的平安愈加担忧了,怎样辨认哪个是“原版”的声响,哪个是“翻版”的?

科技带来的题目固然照旧靠科技处理。孙立发给记者指出了别的一种黑科技——“声纹辨认”。

孙立发创业团队的另一位结合开创人钟静华,她跟孙立发和李坤都是同门,钟静华专攻的偏向便是声纹辨认。钟静华指着孙立发说:“别担忧,他们有几多数据来训练语音转换,我们就有几多数据来研讨声纹辨认。语音转换技能在开展,声纹辨认技能也在开展,现在许多场景都用上声纹辨认技能了。”

声纹辨认是一种经过声响鉴别语言人身份的技能,而在辨认之前只需先做一个语音转换的检测,就能断定声响能否颠末分解或许转换的。

钟静华引见,呆板会从声响的频谱里提取一局部特性,然后把这种特性跟分解声响的相干特性相比对,看这种特性更像分解声响的特性照旧真实灌音的特性,就能做出判别了。钟静华通知记者,“这是一种二分法,现在这种检测的精确率可以到达95%以上”。

现在,声纹辨认技能会使用在银行、社保等一些范畴。在蒸蒸日上的智能音箱范畴,声纹辨认也被用作一种语音登录的手腕。

瞻望

用语音转换“翻译”中风病人的话

孙立发通知记者,现在研讨职员正探究将语音转换技能与医疗相联合。此中一个研讨偏向,便是把语音转换用在中风病患者身上。

我们晓得,口齿不清是中风患者的体现之一,家人和大夫每每因而很难与病人相同。而经过语音转换技能,就可以用中风病患者的声响来训练呆板,让呆板能终极辨认、了解中风病患者所要表达的意思,然后再用明晰的声响将其意思表达出来。这就处理了中风病患者与人的相同困难了。

孙立发说,这只是现在正在研讨的使用场景之一,将来还会有更多的场景能用到语音转换技能,“迷信技能的开展是不行逆的,它终将越来越成熟,终极造福人类”。

往年7月,声希科技将作为深圳呆板人协会会员表态深圳蛇口代价工场举行的零一科技节,这是环球首个全场景浸入式科技展,观众届时可以现场一睹语音转换的魅力。

文/广报全媒体记者王纳

[ 编辑: 郭夏凡 ]
分享到: