欢迎访问：沃派博客每天不定时发布IT文章相关资讯

当前位置：沃派博客-沃派网 > IT文章 > 正文

能骗173万的诈骗电话可以做到多逼真？

09-08 IT文章

语音合成的技术，其实已经发展了有一些年头了。

像我们日常用的智能助理、导航语音、甚至听到的一些新闻播报，用到的都是机器合成的语音。

AI 主播每天自动合成语音和视频生产新闻内容

能骗173万的诈骗电话可以做到多逼真？

来源：澎湃新闻 App

如何合成一段语音

语音合成看起来很复杂，但其实合成语音我们自己在家就能做：

比如把「支付宝到账」、「元」和「一二三四五六」一类的词都录好，以特定的拼接组合方式播放出来，你就收获了中国 8 亿支付宝用户都听过的报账声。

当然了你自己录的声音既不甜美，也收不到钱

能骗173万的诈骗电话可以做到多逼真？

这种通过「拼接」一段段音频，最终获得一份语音的方式，就叫做拼接法。

拼接法制作的合成音，在日常生活中其实最早可以追溯到超大号计算器的语音播报声。

“ 加一，加一，加二，等于，归零！”

能骗173万的诈骗电话可以做到多逼真？

最原始的拼接法录制的样本就是那么几个固定短语句子，给导航录的音就只能用于导航，你要是问它今天天气怎么样，它哪怕知道答案也没法用语音播报出来。

后来，有个聪明人一拍脑袋，想出来一个绝招：要是我把每个中文字都录一遍，不就什么话都能拼起来了么。

不过，拼接法合成的语句还有一个重大缺陷：语气和停顿。

给支付宝配音的展妍小姐姐就曾自曝，在录「四」的音时录了好几个发音，才保证了不同场景下的合成效果。

能骗173万的诈骗电话可以做到多逼真？

来源：小时视频24

并且拼接法也不知道该怎么给「小明找不到 / 爸爸妈妈很着急」，「小明找不到爸爸妈妈 / 很着急」断句。

能骗173万的诈骗电话可以做到多逼真？

拼接法能解决每一个字怎么念的问题，但是读出来肯定不像一个正常人。

所以怎么让合成语音听起来更逼真，成了大家优化的重中之重。

如何让语音更逼真

这个时候，除了增加样本量，我们还必须引入另外一样关键的技术：算法。

有了算法的合成音就仿佛被注入了灵魂。说的直白点，就是「聪明的算法，知道怎么处理一句话的语气和停顿」。

而这种使用算法辅助生成合成音的方式，叫做参数法。

能骗173万的诈骗电话可以做到多逼真？

参数法对音源的要求自然更高，「消除静音片段」、「专业录音环境」这些都是常规操作，最关键的是，需要录制的声音不再是字的发音了。

小学语文教会了我们，每个字的发音其实都可以通过类似「波（ b ）破（ p ）么（ m ）佛（ f ）」这类的声母和韵母的两两组合出来。

能骗173万的诈骗电话可以做到多逼真？

因此只要录下了这些声母和韵母的发音，再通过算法进行合成，任何声音、任何语调就都能被生成出来。

连那些只闻其声不见其形的那些字儿也不在话下。。

你饿了吗？

能骗173万的诈骗电话可以做到多逼真？

不过合成音每逼真一分，背后需要考虑到的情况都要增加数倍，很多时候，简易的算法都不能正确计算出一句话应有的语调、语气。

而一旦算法变得复杂了，运算量也就增加了，合成音的生成速度也就变慢了。（电费也增加了）

能骗173万的诈骗电话可以做到多逼真？

来源：DeepMind 博客

以现在这些大企业的能力来说，只要肯烧性能，逼真的合成音大家都能做出来，但要使用什么复杂程度的算法，就要在 “ 效果 ” 和 “ 效率 ” 之间做权衡了。

像我们平常在翻译 App 里听到的合成音都比较粗糙，毕竟不能赚钱嘛，能听个响就得了。

而在能有钱进账的项目上，合成语音却做得栩栩如生、惟妙惟肖。

譬如不差钱的广告商们，就很喜欢买这种服务，毕竟只要量上来了，肯定比雇真人打电话便宜不是。

能骗173万的诈骗电话可以做到多逼真？

说起来，大家肯定猜不到，走在合成语音技术应用最前沿的场景是什么。。

是诈骗！

能骗173万的诈骗电话可以做到多逼真？

为了骗倒更多人，骗子们是真肯下血本儿啊。。。

就算是这样，我们也不能只盯着语音合成不好的地方。

像语音助理和智能音箱，平时方便了不少人。

版权保护: 本文由沃派博客-沃派网编辑，转载请保留链接: http://www.bdice.cn/html/80491.html

上一篇：卖卖卖，跨国药企扎堆剥离非核心资产，诺华7.9亿元出售苏州工厂
下一篇：车企号脉，资本试药，出行服务带病也要上场

博客主人Cooper
沃派博客-沃派网：是一家IT自媒体平台网站，每天会定时更新相关IT资讯以及相关文章。

18520文章总数

10727793访问次数

建站天数

推荐文章

网易有道公布定价区间，募资规模约2.26亿美元 2019/10/16
阅文集团和迪士尼合作，推出'星战"首部中文网文 2019/10/16
谷歌云游戏服务Stadia 11月上线最高支持4K分辨率 2019/10/16
网易有道10月25日在美上市，股票代码为“DAO” 2019/10/16
易车姜安琦：用AI能力找对人、进对场、做对事，才能提升汽车营销效率 2019/10/16

热门文章

网易有道公布定价区间，募资规模约2.26亿美元 2019/10/16
阅文集团和迪士尼合作，推出'星战"首部中文网文 2019/10/16
谷歌云游戏服务Stadia 11月上线最高支持4K分辨率 2019/10/16
网易有道10月25日在美上市，股票代码为“DAO” 2019/10/16
易车姜安琦：用AI能力找对人、进对场、做对事，才能提升汽车营销效率 2019/10/16

标签

友情链接