lishuhang
lishuhang

中文科技专栏“航通社”作者。lishuhang.me

播客在 2018:今日之声,只是昨日回响

本文首发于航通社,原创文章未经授权禁止转载。航通社 微信:lifeissohappy 微博:@lishuhang

2008 年前后,正在上大学的我有机会见到一些正在捣鼓 Podcast 的人,他们是中国最早一批播客玩家。

2005 年 5 月 1 日开播的《反波》(AntiWave)播客由“平客”和“飞猪”始创,他们来自正规的广播电台,节目也采购了先进的播音和录音设备。除此之外,两人也具备广播级别的反应和串场能力。

他们要做自己的节目原因只有一个,就是用他们在电台学到的技能,播出在广播电台不太能上的节目。

我觉得要是反播生在今天,它们必须得叫“正波”,不然上不了线。

《反波》获得德国之声 2005 年国际博客大奖的“最佳 Podcast”奖项,这个极高的标杆似乎为后来者指明了道路,此后不管是专业还是业余,有一个标志性的几千块钱的大麦克风成为你专心做 Podcast 的象征。

然而《反波》仅坚持到 2006 年 10 月就宕机了。这同样也是一个预言式的结局:很多基于兴趣而起的播客节目都坚持不下去,因为制作成本太高。

我认为,现在你看到的播客行业经历的一波波潮起潮落,只不过是后来者逐渐有钱玩得起票了以后,开始不断重复他们俩的故事。

十多年后,坚持不下去的问题依然如故

最近,正好有文章开始讨论播客重新火爆流行起来的问题。腾讯全媒派的编译文章讲了《纽约时报》《卫报》《经济学人》投入资源准备通过上下班、做家务、开车等时间里对用户听觉心智的占领,达到获取新客源的目的。

我注意到,这些所列举的案例都和十多年前的《反波》一样,采用高标准,高成本的精良制作,有时采集声音的成本甚至超过了制作视频节目。《纽约时报》的自然探索节目可以录制播放火山熔岩增长,植物破壳而出这样的声音,却故意丢弃了画面,实在是暴殄天物。

只有在像广播剧一样对待节目制作的基础上,才能偶尔看到《SERIAL》这样的红火局面,而且就像是文字公众号一样,指望长期产出爆款内容也是不现实的。

正因如此,最早开始尝试播客制作的 BuzzFeed 也选择了知难而退。《卫报》本身也是在挣扎后停止了好多年更新的,现在重启播客可能更多是跟风竞争对手。

在国内环境下,诸如蜻蜓、荔枝、喜马拉雅、网易云音乐这样的平台,就像微信公众平台一样,给任何人提供了几乎平等的音频生产工具,但负面作用也随之而来。

就像图文公众号一样,平台考核和补贴催化了更多播客主为了更新和流量考核,而不得不将内容水化,变成定期的清谈节目。

假设他们受过专业训练,能把控得住也还算好,但即使是广播电台主持人也需要全职备稿,精心的选材和与嘉宾事先沟通,清谈节目想做的好同样不容易。

最后能剩下来的还坚持用人嘴播出的节目,也就随之变成了让你听他们两三个人连麦,扯一个半小时的闲篇儿,扯到哪算哪。我一位常听科技类 Podcast 的小伙伴时不时会给我传来一些做得很垃圾的节目,吐槽江河日下、漏洞百出的谈话水平。

所以,更切合实际的办法,也就只能是在尽量少花成本甚至不花成本的前提下,为已有的图文消息生成一个声音文件。这既能保持内容的质量不缩水,让不擅长临场发挥的作者们少一些 NG 重录,又能提供更多样更方便的格式给读者,还能在音频这个领域“占坑”,等有余力的时候再玩一点新花样。

何以解忧,唯有 AI

时代在进步,AI (人工智能)遍地开花。这波通过机器学习实现自我训练,不断优化的 AI 浪潮中,其中一个被公认效果最好的应用就是 TTS (文字转语音)。

讯飞、百度、谷歌等 TTS 产品已经投入使用,而微软和苹果在各自的操作系统内也预置了离线可用的语音引擎,方便视力残疾人使用电脑。

值得注意的是,一些 TTS 服务提供商也开始针对码字的所谓“内容创业者”,提供将文字快捷转变为声音的方案。

百度为不懂编程的人提供了一个网页版界面,用户只需要贴入纯文本,选择语音、语调和语速,就可以等待生成和下载 mp3 文件了。

讯飞提供一个全平台的 TTS 工具,名为“讯飞快读”,提供最多 8 种中文播音员和方言、外语、蜡笔小新等特色人物,但使用全部功能,如朗读超过 500 字以上的文章,需要购买会员,一个月 12 元,一年 72 元。

但是,讯飞和一个辅助内容创业者的浏览器插件合作,向该插件会员免费开放了“讯飞快读”的主要功能,且并不限制字数或次数。在安装该插件后,用户可以在微信公众号后台新建素材时,在插入音频的窗口找到该功能的链接。

同时,TTS 也广泛用于新华网、人民网、财新等媒体的新闻详情页,每篇文章都可以提供相应的人声朗读版。新华网还将每日精选的有声新闻做成了微信小程序,但这并不需要他们雇佣专门的播报员来完成。

新华社和阿里巴巴在今年初正式启用了“媒体大脑”,其中就包含语音合成功能,采用阿里云的朗读引擎,并通过新华社成立的合资公司向国内媒体出售服务。

在 TTS 相对并不成熟的 2014 年,腾讯公益曾经推出名为“为盲胞读书”的活动,向社会各界“众筹”声音,希望大家义务为盲人制作有声书。但时至今日,我们听到的声音却越来越多地来自机器合成,需要用到人的地方更少了。

我们值得为音频投入多大人力物力?

TTS 和播客分发平台的出现,无疑让 2018 年相比世纪初的播客生态,有了更低的入行门槛和更多的参与者。然而,在短视频已经进入白热化比拼的现在,音频内容门槛的降低,是否还是一个值得关注的趋势呢?

有的人或者机构选择只用很少一点点精力,甚至尽可能自动化和 0 成本的方式来为已有的文本内容添加声音,尽可能实现同一内容的“中央厨房”式反复使用。另一些人则仍然坚持主动录制节目,他们视主持和剪辑为一种生活乐趣,并全情投入其中。

这些人认为音频仍可深耕是有他们的道理的。在挤公交地铁、开车、运动健身的三大场景中,音频内容仍有其顽强的生命力。同时,声音展现形式也是一个培养 IP 人格化魅力的好机会。

就像微信的私人语音消息一样,音频让听众直接听到有人对他们说话,是一种非常直接、亲密的接触方式。有时候,一些播客听众不会在意是否言之有物,而是着迷于主播富有魅力的声音。

在图文作者们都在试图人格化和建立 IP 的时候,语音说不定能起到雪中送炭的作用,罗振宇坚持的 60 秒语音就是这样一个成功的例子。

不过,另一种人利用耳朵的方式,是单纯将现有文字内容转换为语音。他们利用音频只是因为不得不将眼睛移开,但又不愿意放弃接收信息。

因此,他们会采用 Pocket 或者微信读书这样的工具先订阅 RSS 或者公众号,再用系统 TTS 引擎读给自己听。

同样也有很多理由支持你对音频内容仅是浅尝辄止,不要投入太多。比如做好内容的成本太高,但听众不一定听得出来,或者你不知道用什么指标来反馈“好”与“坏”。

音频传达的更多是感性和柔软的内容,但这种高度个性化的内容,意味着无形中欢迎一部分目标听众,并“驱赶”另一部分。但被“驱赶”的用户往往会将内容与“三观”,和节目制作的精良程度相混淆,说你费尽心思做的节目是“很差劲”。

同时,音频变现问题就算在国外也没有完全得到解决,Twit 这样的直接打广告形式基本不可复制,你要播客作者卖肉松饼又实在是很尴尬。真正可以用声音来创收的人,都不会去做免费的 Podcast,而是进入了我们都很熟悉的知识付费平台。

最终,2018 年做播客的那群人,和 2008 年或以前也没有太大变化:都是一群即不愁钱,又有时间,将录音作为兴趣爱好和生活方式的人。但他们也会因为累了、觉得不好玩了,或者突然没钱没时间了而不能长久继续——就像当年的《反波》。

如果发展不起来一些职业的,以此为生的播客作者,或者现有的视频 MCN 不会花精力到免费音频内容上的话,播客就无法建立起一个可持续的商业模式,那么今日的播客之声,也就只是互联网萌芽时的昨日回响。

2018.9.26

欢迎随手转发到朋友圈。寻求转载授权,请关注微信公众号航通社 (ID:lifeissohappy) ,并在后台留言输入关键字转载。转载时请保留版权信息。

CC BY-NC-ND 2.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…

发布评论