数字记忆指南

十几年前读《三体》时基本什么都没记住，只记得也不知道是谁在月球上留了几个石碑或是别的什么东西，原因是雕刻比所有软盘、磁盘、固态硬盘都要可靠，能够更长时间留存记忆。大概八九十年代开始，一面是各种存储媒介越来越发达，一面是整个社会中已存储、待存储信息的爆炸性增长，越来越多人开始讨论现代记忆问题，尤其是各种依托于外部物质存储的记忆。且不说学术圈子里相对有名的「档案热」或是「回忆空间」等等问题，「数字失忆」早就是所有人现代生活体验的一部分：十年前主流硬盘还是 HDD 的时候就要学会换硬盘时不能磕碰摔到，移动硬盘更是要小心保护，在包里多晃荡两下，一不留神就是满盘皆输；五年前在百度贴吧或是什么网盘搜索引擎里找到别管正版还是盗版的什么资源，点进去二十个大概十八个都显示已经过期或分享已失效；今天更是发展出一众网页剪贴工具，鼓励大家将各种文章存到本地或是备份一次，免得再次打开已是不知何处来的红色感叹号甚至域名直接跳转到广告商的占位页。

嘀咕一堆之后，我们大概也能意会，所谓「中文互联网正在加速崩塌」本质上是数字公共记忆在崩塌。根据这篇已经被审查的文章的说法，有两个主要原因导致「互联网消失」：其一是经济成本（即各种机房、运维成本）；其二是审查压力（即网站备案、平台审核）。对一篇公众号文章的分析做严肃批评显得有些微妙，但基本上两点分析算不上对：且不说审查到底多大程度上助力网络封闭，中文互联网巨头们早在 QQ 空间时代开始就已经发现，扩大自家业务最好的方式就是把内容封闭起来，将自身变成一个平台，最好是公共爬虫只能看到内容的标题和摘要，正文必须注册才能阅读；智能手机应用兴起之后，主要的问题则是平台化，直观体现为各种应用内部的数据池天然就没有为搜索引擎优化，也不需要开放给公共搜索引擎或其他形式的爬虫，用户生产内容被协议和平台私有化（例如早已运作多年的微信公众号和近几年显得越来越「好用」的小红书），作为整体的互联网被分割成一个个小型局域网，需要专门的方式（付费墙或特殊应用）才能打开。

考虑到类似批评在中英文世界中都相当多，绝非某国或某地的特色，而是整个互联网商业模式发展到当前的全球性共识，我再说一遍也不会有什么作用——硬要说中国有什么特殊性，大概也就是和马克思说「犹太人」一样，偶然成了现代先知，提前十几年就开始安排装上电子防火墙的局域网——这篇短文要考察的是另一个问题，甚至可以说是更加重要的问题：对于个人来说，应该怎么让自己的数字记忆更健壮？如果你玩过 NAS 或是有类似经验，那么你一定知道，多留两个备份是重中之重：网上看到的文章最好存一份或者丢给 Internet Archive 备份，自己的文档放可靠的、最好带上版本控制的云盘（显然应该排除 iCould），也要本地偶尔打包多存几份。此外种种原理都可自行推广，它们相当常规，实践起来也相当麻烦，最好是自己找些工具（类似 Cubox、Readwise、Devonthink 等等软件都有相关功能）辅助处理，至于具体用什么，那并非我们要讨论的核心问题。

还是沿用「剪贴」或者「保存」文章的例子。如果你用过各种存储网页的软件且用它们保存过微信公众号的文章，你就会惊喜地发现，因为跨域限制，大概率你保存的版本里无法直接看到图片，还是需要跳转原链接（除非你将整个网页全部缓存下来变成其他格式）。在这个案例中，是一些特定的技术构造（跨域规则）导致你的记忆出现困难（难以保存完整的文章）。类似的情况还可列出许多，例如文章中的图片使用某个图床外链，两年后它倒闭了，留下一条无法打开的链接；例如文章版式中包含一整套 CSS 规则，你保存为 HTML 后又过 20 年，随着 CSS 规范的演变，这篇文章打开之后格式根本渲染不出来；例如文章在本地保存为 Word，多年后随着 AI 写作越来越普及，微软砍掉 Word 产品线，你只好四处寻找还能安装的盗版软件和旧版系统来打开它。讨论种种或现实或科幻的场景并不是为了渲染互联网末日论，而是要说明，在绝大多数情况下，中长期记忆面临的困难都不源于审查，而是源于内容所依赖的媒介本身的脆弱，而脆弱则相当程度上源于复杂。

想象一篇纯文本式的文章，当你在其中加上版式和图片的时候，它变得更加丰富，同时也开始依赖别的东西（例如 Word 或其他软件对特定格式的正确解析）；当你将它变成一篇公众号文章，它就搅和进更多东西，包括但不限于公众号的发表协议、浏览器的 CSS 规范、图床的跨域规则、微信内部的索引等等。因此，让我们稍微抽象一下：无论是政府审查、公司封闭还是个人财力，威胁记忆的根本问题是被记忆的内容所依赖的呈现媒介或表达形式越来越复杂。如果我们将记忆所依赖的技术系统作为衡量指标，那么这一组合相对简单的情况下，例如纯文本 TXT，甚至是一个打印出来的文件（它依赖纸张而不依赖硬件、系统、软件的多重支撑），那么它就会更稳定，你能够期待它们在尽可能多的场景中存活下来；相反，在这一组合相对复杂的情况下，例如在公众号中，它会和更多的法律技术、政治技术纠缠起来，那么它的存在就会更加脆弱，简单的审查、侵权的投诉、他人的删除、平台的故障都可能导致记忆一去不复返。

如此思考，作为个体（而不是数字记忆的社会运动家），我们能做的事情就是在自己的日常生活中，尝试将形式与内容区分开，至少在面对需要记忆的事物时，尽可能用最简单的技术组合去保留其内容，放弃其形式：例如将文章保存为 TXT 而非 Word（除非它的格式很重要），将公众号文章同步发表在自己的域名和博客中或同步一份到更开放一些的平台（除非你帐号全没了），将笔记存在纯文本文件里而非各种数据库本位的笔记工具中（或至少保证笔记工具能够导出纯文本形式的数据库文件），使用纯文本编辑器而非富文本编辑器甚至是块编辑器（或至少留一个纯文本版本的备份）。简言之，要想保护自己的数字记忆，最重要的是考虑它再次浮现时需要的技术背景，越是重要的资料越应该采用坚固的、长期的组合，相对不重要的信息则允许它们更自由地存在。当然，你也可以尝试让内容活在别人的脑子里（看起来更加困难），或是选择在特定的技术组合中下注，依靠自己的远见卓识战胜技术和社会的快速变迁，超越每天都在迭代的软件代码和法律条文。