Terence
Terence

Let's geek and art.

paper为什么这么难读以及应该如何吃掉它

阅读一篇高质量的paper,往往会比阅读一本专著高效得多。它能快速让你吸收最前沿的知识,以高屋建瓴的方式带领你走进问题的核心。但这样高质量的paper,往往伴随着致密的信息,即便是篇幅不多,那些密密麻麻的小字也足以让你望而生畏。

想要体会阅读paper的收益或许并不容易,也许我们可以从更简单一点的任务开始做起,即阅读一篇技术blog post。往往,当developer遇到问题时,会通过搜索引擎大致定位出几篇貌似不错的post,然后一篇篇地略读、进而精读。如果你的问题足够小,那么这个过程还可以加速,或许扫描三五行就足以让你解决问题。又或者是这个topic是中等规模大小,在你解决问题的同时,你还希望顺道了解一点背后的机制和原理,那么,多参考几篇稍长的post便足以让你达到目的。我想,阅读post的收益,是很多普通developer共有的日常经历。

那么,阅读paper的方式和收益,其实同阅读blog post几乎相同,只不过前者的规模要大得多。但其所用方法和指导思想都差不多,只不过需要对每一个环节做更精细的处理罢了。

同阅读blog post一样,你首先要做的,不是开始阅读,而是要对你的阅读材料进行选择和甄别。通过搜索引擎、StackOverflow、知乎的推荐也好,通过阅读paper的introduction也好,通过阅读某篇著名paper的reference也好,你首先需要搜集关于某个topic的paper,但不要急于开始阅读。分清主次,判断清楚这篇paper所要解决的问题是否符合你的需求,是更要紧的事情。这样一轮下来,应该可以自己的需求锁定几篇要紧的paper。是为了了解某个前沿领域,还是为了就某个细分问题进行深入探索,你的目的不同,那么对paper的选择标准就会不同。

锁定好一两篇paper之后,就可以开始精细阅读了。

首先需要吐槽或者分析的问题是,为什么这些高信息密度的paper如此令人望而生畏?!除了其本身用词精炼、惜字如金以外,我想,一个非常巨大的产品交互问题便是paper的排版(如果把paper当做知识类的产品来看待)。让我们随意看两张paper的截图:


实在是致密得可怕!无论是几十年前的paper,还是如今在arxiv上发布的paper,几乎都是以这样糟糕的交互方式来展现。

为什么?!我们可以稍作分析。

首先,这些paper的受众并不是普通的付费阅读者。这就意味着paper的写作者没有义务更没有经济动力去让paper的格式更贴合人们的认知心理。试想,把这样的排版扔到「得到」这样的付费平台上,不被骂的狗血临头才怪!

再来,写作paper的主力军都是象牙塔的professor。对于这些”清高“的学者们,实在是没有什么实际的利益可以争夺,所以只剩下”名誉“的游戏可以玩一玩。所以,所谓的武侠或者“山头”,你可能更容易在学术圈中发现。专家的名誉,往往就意味着艰深的研究,说得直白点,就是让人捉摸不透的逼格。为了装X,也必然要把这些排版弄得反人性一点,如此你才能够看不懂,才能体会到你同写作者之间的差距。

记得在知乎上看到有人吐槽詹青云和许吉如的辩论方式为何为让人感到貌似高深莫测但却又有种说不出来的不舒服。原因是,这两位喜欢以异样的断句方式来组织辩论语言。于是,听着会有点懵逼。但到底是因为对方提出来的论点、论据、论述让你懵逼,还是因为这个反人类认知的断句方式让你懵逼,普通人是分辨不出来的。于是会产生一种貌似高深莫测的神秘感。

paper如此紧密的排版,也是深得其中反人性以凸显高深莫测的精髓。所以,这其实可以回答另一个问题,就是为什么有时候你看一篇blog post,虽然它可能很长很长,但似乎也能让你看懂。其原因就在于,由于open source的盛行,那些长篇的技术blog会被发布在open source所搭建的写作平台上,如WordPress或者企业运营的技术社区CSDN、medium。这些平台往往都能提供良好的文字排版,即便是文字数量远远长于某些综述性的paper,但往往能够以较大的段落间隙和良好的文字排版让阅读者减轻”认知负担“,进而更容易吸收post中的知识内容。

再来,我们从经济的角度来分析一下为什么paper会以这种致密的形式做排版。很显然,以前的paper确实是实实在在地发表在纸质刊物上的,你订阅的杂志、或者论文集,就是由这样一篇篇的paper组成。试想,为了收录更多的paper、压缩刊印成本,出版商应该如何处理?(由于论文集这样的刊物,并不能像一般通俗刊物那样有巨额的发行量,一般出版商的把字体放大多卖几本的小伎俩就变得毫无意义了)那必然只能缩小字体、拼命地多压缩几篇paper到一本论文集里。

如果这还是纸质出版物的时代,这或许还可以理解。但作为电子阅读物已经如此盛行的今天,大家还在以纸质出版物的标准来对paper做反人性的排版,实在是让人惊讶。(其实也不怎么惊讶啦,毕竟搞学术的都是小圈子,大家都彼此同化,看不出交互上、或者工具使用上的弊端。)

基于这些考虑,你应该怎么来阅读paper呢?很简单,就是一点点地把一篇压缩的paper给它读厚了。怎么做呢?你可以使用「语雀」或者「石墨文档」这样的在线文档,为每一篇paper写一篇对应的notes。读一段paper,就用你自己的语言总结一下这段paper的内容,以notes的形式记录到在线文档中。之所以用在线文档,是因为它方便云端同步,不必因为使用了不同的PC而导致无法看到内容。再来是在线文档的基础排版要好一些,并给你无限的创作空间。

还记得研究生时代阅读paper的时候很可怜,paper之间的空隙就那么大,于是只好草草写下几笔自己的notes。但稍微对写东西多一点的同学都知道,如果给你的空间足够大,那些你以为很少的notes会越写越多,你会在为这段paper写总结notes的过程中,对这段文字有更为清晰的理解和认识。你会一步步地展开自己notes中对自己提出的问题,做进一步深入的探讨。于是,你会从这个写作notes的过程中获得更多意想不到的灵感和看待问题的角度。这就像是自己跟自己在开一个seminar讨论班,通过自己和自己互博,来激发自己的灵感和洞见的深入。

顺着这个思路,由于你使用的是在线文档来做笔记,于是你有足够的空间和工具来绘图。无论是engineering流程图,还是概念性的思维导图,你都可以为paper中信息较为致密的一段绘图。这里需要重点澄清的是,很多人喜欢搜集别人思维导图,或者是截取他人的流程图、架构图,这其实完全没有抓住重点。绘图给人收货最大的是”绘制“的过程,因为这个过程在强迫你把自己脑海中非结构化的信息整理成结构化的信息。稍微有过作图经验的同学会发现,作图并不是像想象中的那样简单,并且,当自己逐步绘制出某个复杂系统的思维导图或者架构图时,你会为自己所惊讶到,你会发现那些曾经看不见的细节上的联系,你发现自己会逐渐掌握以”宏观“的角度看待问题的方式。所谓的创造的联系、洞见的深刻,都可以在这一过程中培养出来。

但别忘了,这都要归功于你现在有一张无限长的文档可供你自由挥洒。试想,如果你的落笔空间只能在一篇排版致密的paper的空隙之间,那么,这些更为丰富的灵感、观察和洞见,都将随之而去。

根据自己的需求圈定好需要仔细阅读的两三篇paper,为这篇精度paper开一份由在线文档承载的notes,试着为这篇paper的每一段用自己的论述方式写下对应的总结性notes,而notes不限于文字,还可以是自己绘制的思维导图和架构流程图,如此深入往复,一篇信息致密的paper就能以恰当的方式被你完全吸收。





近期回顾

气定神闲背后的手段与手腕

《后浪》中的浪中浪

投资策略的思维框架 | SeminarT


 

如果你喜欢我的文章或分享,请长按下面的二维码关注我的微信公众号,谢谢!


  

更多信息交流和观点分享,可加入知识星球:


CC BY-NC-ND 2.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…

发布评论