JimSun

Human race is overrated, save climate change!

被豆瓣封号后的我如何为我的书影记录安家

發布於

一天晚上正在调试我的豆瓣图书备份脚本时,我就被豆瓣永久封禁了。我总算成为一个活生生的豆瓣无警告、无告知封禁的案例了。好在我的书影音条目没有被豆瓣隐藏,但我的3k+收藏日记已经看不到了。再加上昨天(2020年9月4日)豆瓣宣布要整改豆瓣图书、近几个月在豆瓣发长动态和长评需要等好几小时/天的审核【友邻“丧面人”和“水泥”的遭遇】

当然可能许多人还有友邻在豆瓣上,不舍得离开。但如果有喜欢的友邻现在不去询问其他联系方式/平台账号,等到他们封禁后这个人的存在将会被豆瓣从你的世界抹去,不难受吗?还有他们的日记、长评也“被消失”,多可惜?

所以我不打算再在豆瓣发布长文章,能看到本文的豆瓣用户可能也算是我以前《豆瓣备份计划》的老用户了吧,如果是新人也不用担心,不麻烦,脚本帮你解决了大部分操作。


1. 准备工作

  • 一台电脑。macOS 需要安装 python3 运行源码。Windows可直接用exe
  • 解压我的脚本压缩包解压到一个找得到的位置
  • 500+以上条目请做好被豆瓣暂时控制 ip 访问(1天左右)的觉悟,你可以用手机app玩豆瓣

2. 获取你的豆瓣 id

豆瓣id是标示你的唯一代号,并不是你的用户昵称。电脑端可以打开个人主页 https://www.douban.com/mine/ 查看你的豆瓣id

3. 把你的书影记录下载为表格

使用我开发的python脚本,你可以把你的书影记录下载为表格(csv)。以后可以用Excel、WPS打开查看,也可以导入Notion笔记,csv是一个很常用的数据保存格式。

脚本的源码可以在 https://github.com/JimSunJing/douban_crawler 看到,macOS用户可以直接下载源码使用

mac 编程小白可以点进来

很简单,将脚本【解压】到一个【以后找得到】的文件夹。

双击exe、根据屏幕上的要求输入你的备份类型、豆瓣 id、cookies(电影备份可不输入),指定页码(便于你分批备份)

爬取结束后将会在文件夹里出现一个csv文档:icecode-2020-09-07 12-54-09想读plus.csv 可以打开看一下爬取的内容:


4. 往Notion的数据表导入

  • 新建一个 Table,删除原有的行,将标题表头改成“电影名“OR”书名”(见展开图4-1)
  • 点击右上角的【···】再点击【Merge with CSV】选择csv文件
  • 把表格的【warp-cell】关闭会美观一些
  • 将【封面】表头属性改为【Files&Media】
  • 【短评们】里面是豆瓣上的热门短评汇总
  • 点击左上角【Add a view】添加一个Gallery视图

恭喜你!你已经备份好了。

脚本可以在 https://www.notion.so/jimsun6428/for-Share-26945cf67a2a407cb9f381109dd438a1 下载。我已经爬取了我死去的账号的书影作为纪念。

喜歡我的文章嗎?
別忘了給點支持與讚賞,讓我知道創作的路上有你陪伴。

CC BY-NC-ND 2.0 版權聲明
2

看不過癮?

一鍵登入,即可加入全球最優質中文創作社區