ZandY

关注数字极权(监控审查宣传)、社交媒体和广义AI带来的社会问题 An incoming Ph.D. student in Information Science

让Matters上的作品,像星空闪烁 -- 历史文章引申关系的可视化

标题有点夸(rou)张(ma),但应该比某同学建议的【找寻你的大肠杆菌】要好。

而我只是给Matters做了一点微小的数据工作。

在新版网站上线前,Matters有一种特别的功能,叫做“引申”。其性质和论文的引用很接近,不过每次只能引申一篇站内文章(一点内部小消息,这个功能正在被重新设计和改进,不久后会重新上线)。

于是,为了能更好地了解Matters之前的文章概况,我把引申数据拿出来处理了一下,放到了neo4j(一种图数据库)制成了网络(network,也可以说成是 图-graph)。每个节点代表一篇文章,连线是引申关系。红色的节点是整个引申关系中的最上游,又叫做 根结点(root node);绿色节点是整个引申关系中的最下游,又叫做 叶结点 (leaf node)。

为了便于观察,我分成了两张图。一张图只包含文章聚落(cluster)规模大于10的文章集群,另一张图则是规模小于等于10的文章集群。同时我删掉了所有规模为2的文章组。


聚落规模大于10的文章群

我猜这个图里,大家一定会最好奇两个地方:一个是上方那一条条蓝色的连线是什么?另一个是下面那个像一簇花的文章又是什么?

对于第一个问题,选择最上方放大一下吧:

一点点放大,如果还不够清晰请原谅我……

可以发现,这里其实有三条不同的文章链。分别是@Isaac 连载的王力雄所著的《大典》@纪小城 的“每日一问“和“女权史上的今天”。

如果放大右下方的那条比较大的文章链,就会发现这是对佳士事件的记录(@翻身课题组

还有一些比较大的文章链,比如@寓森自恋系列@EiffelFly替代役系列@學展台湾系列等等。

而那朵最大的文章花簇,则是中国MeToo档案的系列文章。另外,左下方的那个小花簇,也是MeToo系列的一众讨论文章。这些也算是,Matters的MeToo之花了。

最大的MeToo文章聚落

另外还有一个有趣的花簇式文章聚落,则是从@曉雅的《说说今年让你最难忘的一本书或一位作者》引发的书籍阅读分享大讨论。

下面这张图,是规模更小的文章聚落。就不一一介绍了。大概来说,有顺序关系的系列文章,就可能形成文章链;只是主题相关的系列文章,则更有可能形成花簇式的文章集群。

聚落规模不大于10的文章聚落

不知道大家会把这个形容成什么。可能好听点是星空?不那么好听,其实更像显微镜下的细菌😂

有兴趣的胖友们可以留言,我可以发局部图或者svg文件(当然,想直接要neo4j数据应该也可以)

發佈評論

看不過癮?

馬上加入全球最高質量華語創作社區,更多精彩文章與討論等著你。