纪小城
纪小城

也聊聊微信、微博对图文内容的审查过滤机制

博主很细心啊,我也分享一下经验~

微信和微博都会针对关键词或关键词组合来屏蔽文字和图片,也都会在发出瞬间就屏蔽,这是根据他们各自的敏感词数据库决定的。

微信的表现包括:

1、群聊,你发了别人看不到。

【发现方法】:手机端和桌面端都在线,如果你用手机端发,那你的桌面端跟别人一样出于收发状态,如果被屏蔽了,桌面端也收不到,反之亦然,这样就立刻发现了。

【解决方法】:最简单的就是截图重发,目前看,针对图片内文字识别的标准和文字版本身的标准不同,新建的图都能发出来。

2、朋友圈,你发了之后,所有人或部分人看不到。部分人疑似又分两种情况(这个还不确定,供参考):(1)通过大陆手机号注册的和通过海外手机号注册的人彼此互相看不到(特定事件/特定时期,香港ip发的别人都看不到);(2)常联系的人(比如家人)能看到,不常联系的人看不到,这个比较可恶,找身边人验证都发现不了,不过这个还只是猜测哈,缺乏大量实验。

【发现方法】:等一会看有没有人点赞回复;用别的号看。btw,前一阵子微信也较大规模炸号了一批,多注册一个号也有必要了。

微博的表现包括:

1、“你发布内容不符合blabla”反正直接发不出,

2、你以“公开”形式发布,但发出瞬间直接被转入“仅自己可见”或“仅好友可见”(后者我只遇到过一次,前者不到100次),这两个功能是微博自有的,实际效果就是被屏蔽了。

【发现方法】:(1)用另一个关注了这个号的微博号查看,可以立即发现。可以用手机登陆多个微博帐号,切换起来比较容易,一键切换。(2)微博会显示阅读数,被“仅自己可见”了,阅读数会停留在很少的数字上,个位数或20多,可以在一两分钟内发现。

【解决方法】:如果发的是千字文,组合可能太多,排查起来会特别麻烦,建议不必浪费时间,用锤子便签等工具转成图片发就好了。

另外,微博和微信还有针对图片的过滤,又包括两种情况:

1、通过读图软件识别图中文字,然后根据识别出的敏感词情况屏蔽。不过如前面提到,有些文字发不出的内容截图后却能发出,或许两种情况的敏感词库不同,也或许图片识别文字错字率较高?不知道。

【解决方法】:用谐音、代号等表述替代敏感词。

2、这种更普遍,通过跟已经被列为敏感图的图片进行对比。如果是同一张图,那最容易,图片信息都吻合,直接根据md5值等信息就屏蔽了。所以我们经常看到,有时一张图热传,传着传着就突然发不出来了——在朋友圈会屏蔽,在微博会down掉。

【解决方法】:如果不是长图,把原图重新截屏一下,相当于创建了一张长的一样的新图,就可以发出了。如果是长图,可以倒置、涂鸦、打马、以上全都用,我还见过图片被扭曲了的,总之搞成不影响读者阅读但干扰机器识别就行了。(突然想到,这其实跟很多网站注册时搞各种扭曲的字母验证码,识别你是人还是机器,是一个逻辑啊!原来我们注册微博时,微博就已经给了我们攻略,只能怪自己没参透。。。)

对于微信和微博哪个审查力度更大,我的结论是:不一定。目前可以确定的是,两家敏感词和敏感图库是不一样的,一方能发、另一方不能发的情况互相都有,取决于你倒哪家的霉;况且他们自己因不同时令审查力度会有调整,不太好比,也没必要比个高下。

另外,加拿大一个团队最近刚发了一篇对微信朋友圈屏蔽图片规则的测试,供参考: 中文摘要版 英文全文版

CC BY-NC-ND 2.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…

发布评论