当前位置：沃派博客-沃派网 > IT文章 > 正文

AI技术突破音频内容生产瓶颈，文字时代加速转向声音时代

08-25 IT文章

2018年2月，中读的会员卡分销一夜之间在朋友圈刷屏，一日之内售卖5.4万份，也让这个《三联生活周刊》（以下简称《三联》）推出的知识平台第一次为大众所熟知。

然而，当知识分销后来被微信紧急叫停，一次性打包售卖10年杂志电子版的“大甩卖”，注定要回归到细水长流的知识付费。

传统媒体转型的最大痛点：文字内容“产品化”

虽然中读也曾经找过朗郎这样的明星IP来合作头部内容，但并不顺利。因为与得到、喜马拉雅这样的头部内容平台相比，20多年下来积累的优质内容及读者群体，才是中读相比其他平台最大的优势。

然而，把这些文字内容专为化知识付费产品，却注定要经历一个“内容产品化”的过程。10年电子版会员卡这种简单粗暴的方式，也要让位于更精细、更原生、更智能的产品设计。

“我们的文字内容是常态化生产的，但是音频内容没有达到这个目标，不管是小课还是专栏，都不能做大常态化生产。”中读创始人朱文轶曾经表示，让音频内容可以有规律性地持续生产是中读团队一直以来的追求，也是整个知识付费行业的“痛点”。

2018年，中信出版集团找到《三联》，将《我们为什么爱宋朝》、《宋朝那些人》两个“爆款”封面故事集结出版，这也是杂志将内容再次变现的传统方式。

然而，随着互联网碎片化内容获取变得愈发廉价与便捷，纸质书销量的连年下滑，对于杂志来说，“集结出版”这块原本脂肥膏厚的蛋糕优势不再。

“我们还可以做什么？”当中信出版的图书引发了一定反响后，《三联》总经理李鸿谷陷入了新的思考。

本次大会上，李鸿谷提到：

古登堡发明印刷机的时间是1439年，有个统计是，此后的1453到1503年，欧洲的印刷文本共800万册，等于之前欧洲全部手抄本的文字量。

而如今，随着信息进入互联网深度传播时代，全球每年创造的信息量更是不计其数。《三联》的执行主编每日至少要通过pad或手机、电脑读5万字的文本，这些容易产生视觉疲劳和“视觉超载”。

AI音频技术，突破了声音内容的生产瓶颈

鉴于此，《三联》开始考虑扩大此前于2017年开始试水的音频课程，将宋朝故事发展成了音频内容《我们为什么爱宋朝——宋朝美学十讲》。继按专栏集结成书之后，存量内容又有了更易消费和传播的呈现方式。

只是接下来，在大规模“文字音频化”的过程中，原作者的时间成本与专业声优的制作成本，成为了其盘活亿级内容资源的瓶颈。

在中读开设音频节目的《三联》资深主笔袁越，谈到了自己录制时的使用感受：

我花15年写了80多万字的《生命八卦》专栏文章。如果在录音棚里把它们一遍又一遍朗读出来，会累死。如果用普通音频软件来读，又很容易读成催眠曲。

随着AI语音技术的持续发展，中读终于找到了音频内容常态化生产的“最优解”。

8月21日至8月25日，北京国际图书博览会（BIBF）期间，中读举办了以“声音里的知识和AI”为主题的知识大会。在大会上，中读介绍了自己谋求转型的新经验，在2017年年入局付费音频领域后，又发布了首个AI语音定制专栏。

为此，《三联》采用的新方式，是携手微软，将个性化语音定制技术运用到有声内容生产中，AI音频在经过训练后被赋予文章原作者的声音，让听众感觉到“如闻其声”。

传统的有声内容主要依靠名人、主讲人或者声优亲自上阵录制，往往需要耗时几个月，成本巨大。声音录制也受限于人员、时间、环境等因素，无法实现产能最大化，求知者接收优质内容的时间也会随之延迟。

而个性化语音定制系统则彻底突破了生产瓶颈，只需少量训练数据量就可以训练出一个逼真自然的人工智能声音，大幅度提高了存量内容的转化效率，有利于优质内容的高效生产、再生产以及声音知识的优化和传播。

文字内容的音频化也不仅是一个文字转换为声音的过程，更是与用户关系的进一步拉近，毕竟性格各异的声音比千字一面的文字更有亲切感，更容易打造作者的独特人设。

不仅如此，相比于文字内容结集出版，音频课程的规模化生产可以更自由、灵活地对文字内容进行结构化梳理，无论是大课、小课都可以灵活定制。除了亿级的存量内容，《三联》每期15—20万字的内容将成为源源不断的内容库。文字内容与音频课程的同步、互动，也将激发出更大的想象空间，可以称得上是内容领域的O2O。

破壁语种障碍，多语言音频内容助力文化出海

版权保护: 本文由沃派博客-沃派网编辑，转载请保留链接: http://www.bdice.cn/html/77962.html

AI技术突破音频内容生产瓶颈，文字时代加速转向声音时代

推荐文章

热门文章

标签

友情链接

关于本站

联系我们

特别鸣谢