如何搭建知识库

大脑的注意力和记忆力都非常有限。根据艾宾浩斯曲线的理论,刚学习的知识,在1天后,66.3%将被遗忘,只有33.7%被记住。

从演化论的视角看,人类的大脑从来都不是为了今天的信息时代而生的。

根据IDC2017年的《数据时代2025》白皮书,到2019年全球的网民数量将达到40亿,其中中国有不到9亿的中国网民。且根据这家机构做的测算,他们估计到2019年,互联网上的信息量将达到40个ZB(1ZB=10^12GB,1GB=2^10bit)。

也就是说,理论上每个网民可以平均分配到1ZB。而实际上,人终其一生在互联网上涉猎信息,其中只有不超过几十个TB的数据量是有用。

所以在信息爆炸的时代,大脑的记忆力早就不够用了,我们需要一个工具来辅助大脑记忆。知识库就是大脑的辅助工具,知识库只负责存储和记录,让大脑可以专注于思考和理解。

同样是存储和记录,也许有些人会问,现在搜索引擎这么发达,想要的知道的东西搜一下就有,为什么还要建一个自己的知识库呢?

因为在搜索引擎中搜索到的,只是信息,而不是知识。知识是阅读信息后,经过思考和理解的产物。搜索引擎里搜索到的信息,你依旧需要进行阅读处理,而不能直接使用。

下图描述了从信息到知识的变化过程,信息是零散的点,而知识是经过处理后的产物。

此外,搜索引擎搜索到的内容,并非为你打造。某种程度上看,知识库是你的第二大脑,我们在知识库里记下的是大脑思考和理解的成果。

在知识库里,过往积累的知识将变得容易追溯,每次读到自己过去的思考,都如同和自己过去的思想对话,思考后,或许又有新的发现。有时会发现自己的进步,修正过去的思想;有时又会惊讶于过去的思考,即便现在也让自己有启发,这种草稿拾遗的感觉很奇妙。

在开始设计知识库之前,我们先要了解什么是知识,这样才能设计一个存储知识的容器。

关于知识的基本单位,我认同下面两种观点。

首先是我在Zettelkasten中提到过的知识卡片,每一张知识卡片都包括以下的内容

标题:笔记的核心观点

标签:标识内容,聚类内容的方式

主题内容:知识的论述过程

链接:和其他笔记之间的联系

参考文献:从哪里获取到这个知识

关于Zettelkasten方法,翻译到中文里是卡片盒笔记法,是德国社会学家卢曼发明的笔记记录方法。

知识=模型+实例

我的理解是:知识=命题+实例

知识都有命题,复杂些的命题,就是模型。

对于实例,我的理解是可以分为三类:演绎论证、归纳论证和类比

一个知识可以有多种论证方式,从不同的视角出发论证;可以有多种案例,正例和反例;还可以有类比,类比可以用来启发思考,但不能用来论证。

通过论证、案例和类比的补充,可以帮助我们不断完善一个知识。

了解完知识的基本单位,进一步我们要了解知识与知识之间的关系。

回到我们最初的设定上,知识库是大脑的辅助工具,所以我们应该尽量像大脑存储知识的方式一样去构建知识库。所以其实问知识的结构,其实是在问我们的大脑是怎样存储知识的。

记忆可以区分为长期记忆和短期记忆。短期记忆非常有限,人脑最多可以在短期记忆中保存七件左右的事情。短期记忆有两种结局,要么逐渐被遗忘,要么转化为长期记忆。

为了将短期记忆转化为长期记忆,我们有以下三种常见的增强记忆的方式:

①创造记忆间的关联

和原有的记忆之间创造关联,一个信息与其他信息之间的联系越多,他就越容易被记住。

依赖原有的记忆,可以帮助我们理解新的记忆。例如在只有学习了加法才能够理解乘法,如果上来就直接学习乘法,是要难理解的多的。

环境信息,也可能成为记忆的关联。有时在背过单词后的几天里,在想起这个单词的同时也会想到背这个单词时所处的环境,可能是走到学校教学楼的某一段路程。这种记忆被称为——非自愿记忆:指的是人的大脑在记忆时,会带上很多环境因素,如阳光,背景声音等等。

②简化记忆

将记忆简化,结构化到人脑可以理解的逻辑关系和思维模型中,理解了知识之后才能更好地记忆。

《金字塔原理》中说的人类有且仅有的两种思维方式:归纳和演绎。将知识简化到这两种逻辑关系里,是最好理解的。

《穷查理宝典》中说的思维模型也是如此,例如经济学的供需模型,数学的函数关系等模型,可以帮助我们更好地理解信息

③间歇重复

重复也有助于长期记忆的形成,重复有助于增强我们的神经回路,重复知识会让信息变得更熟悉,但更重要的是要理解信息,要能够把知识描述清楚,理解知识后再重复回顾,效果是最好的。

还有一种观点是:记忆不是直接存储在大脑中的,而是以某种介质。每一次回忆,大脑都会重新编码,生成记忆。这听起来很奇妙,

就会像任何的信息存储在计算机中,都是一长串的0和1一样,每一次在计算机中播放音乐,都需要音乐播放器的帮助。大脑也有自己的存储方式,在调用记忆时也有一样的原理。

因为多个记忆之间存在着联系,知识之间也是如此,想想有若干个知识块,将他们用随机的线条联系在一起,最终形成的是一个网络结构。

①知识大多数情况下是网络结构的,少部分情况是树状结构的。

网络结构是因为大脑中,信息之间总是存在着联系,各种各样的联系。

树状结构的知识,是需要认为梳理过的,像教科书,像教程,大部分是其他人在学习理解过后,梳理好的结构。

如果没有经过梳理,知识本身就是杂乱的,存在的只有知识和知识之间的联系,是一团网络。只有当在某个领域或主题下的知识量积累到一定程度,知识与知识之间的关系逐渐明朗时,才能梳理成树状结构。

基于此,我们在设计自己的知识库时,要搞清楚,你的知识是树状结构的,还是网络结构的。

②对于大部分人来说,知识是树状结构的。

很多人的学习在离开学校以后就几乎停滞了,在课程之外,如果你仍有学习的习惯(探索版的学习)。比如在研究生阶段,你要自己不断地读文献,做研究。或者是业余的兴趣爱好者,针对某个领域不断探索和学习。此时你接触到的新知识,很可能是碎片化的,网络结构的。

③信息爆炸的时代,知识多是碎片化的

也因为上文提到的,如今我们处在一个信息爆炸的时代,大量的信息每天被传到互联网上,还来不及被梳理,所以我们接触的的信息大多是碎片化的。碎片化的信息需要经过链接,才能形成网络结构,网络结构可以进一步梳理出树状结构。

根据上面的信息,我们已经知道了知识的基本单位,是命题+实例。知识存储在大脑中的方式,彼此之间有着若干个联系,最终形成一个网络结构。但有时,经过梳理的知识,会以树状结构的方式存储在大脑中。

基于以上的信息,我们可以开始设计自己的知识库。

既然知识有两种结构,那么知识库应该是怎样的结构呢?

我的观点是知识库应该是网络结构的,但我们可以基于网络结构的知识库,整理和表达树状结构的知识。

当然也有很多树状结构是在学习过程中直接记录的,前人已经梳理好了知识的结构,我们可以在前人的结构上继续扩展。

Zettelkasten是德国社会学家卢曼使用的一种笔记方法。直接翻译成中文是卡片盒笔记法。方法的概要是将每一个知识做成一个知识卡片,放到卡片盒中。笔记与笔记之间,可以创建联系,或是引用、或是类比。或者用标签将同类的笔记聚类到一起。这个过程和大脑非常相似。

大纲笔记,顾名思义就是有明确的目录或脉络的笔记,树形结构是经过特定梳理的。一般产生于阅读书籍或学习课程,这些是其他人梳理好的结构。你也可以自己组织知识之间的关系,梳理成树形结构。

过去流行的知识管理方法里,提倡使用学科分类的方式来给知识库作区分,在使用了这种方式两年后,我觉得的它引导了错误的思考方式,让我们去想笔记存放在哪里?这个思维是错的。

如果按照学科分类,很多笔记并没有明显的学科特点,很多创新都发生在学科和学科之间的交汇处。例如一些分析人类行为的知识,它既有心理学的特质,又有微观经济学的特质,甚至是脑科学的知识,他应该往哪里放呢?

在创建笔记时,我们不应该去想这个笔记应该放在哪里,而是应该思考这个笔记的内容与原有的笔记之间有怎样的联系。创建关联才有助于理解和记忆。

同样的,你在检索笔记时想的第一个问题,不应该是“这个笔记我放在哪里了?”,因为这个信息和知识本身的关联性不大。别忘了每一次回忆都是重新生成记忆,而如果你耗费了大量的脑力来回忆笔记存放在哪里,而不是回忆笔记本身的内容,将无助于你的记忆。

再类比现实世界中的知识库——图书馆,图书馆的存储基本单位是图书,存储的结构是杜威十进制图书分类法。图书馆的分类方法,复杂到本科教育里有一个专门的学科分类来支撑——档案学。如果按照学科分类的方法去搭建知识库,那么维护的成本会非常高。

知识库是大脑思考的辅助工具。所以我们按照了大脑记忆的方式来搭建知识库的结构。为了帮助大脑更好地思考,知识库应该还有以下的功能:

我们将内容记录下来,如果不加以回顾,也容易遗忘。所以知识库应该尽量多地将知识呈现在我们面前。表现为两种方式:

被动重复:将知识按照某种规则编程,定期出现。

在知识与知识之间创建关联,上面已经说过了这样有助于记忆。

除此之外,新知识与原有的知识之间创建联系,可能是原有知识的补充论证,也有可能是一个相反的观点或案例,通过案例的补充,可以不断修正我们原有的知识,这也是贝叶斯决策的基本思想——通过后验概率来修正先验概率。

当然这个想法只是目前在只有3个案例的情况下得出的结论,未来通过其他信息的补充,肯定可以不断修正,直到获得更准确的答案。

除此之外,知识之间的关联还有利于创新的产生。创新发生于知识之间的碰撞,更多的碰撞会产生更多的新知识。所以在外部,能够与更多人讨论,不同的观点碰撞可以促进知识的产生。在内部,通过知识库之间建立更多的联系,也可以加速知识之间的碰撞,产生新的知识。

在具体功能的体现上,创建知识之间的关联。笔记软件里的功能是「双向链接」、「标签」等。当你选择知识库工具时,可以优先选择具有这类功能的笔记软件。

并且记得在每一次添加笔记时,多想想这个知识与原有的知识之间有怎样的联系呢?并将他们关联起来。

费曼学习法中,核心的观点就是——理解一个知识最简单的方式就是用自己的话把它讲清楚。

只有你能够用自己的话把一个知识讲清楚的时候,才真正算是掌握。所以建立知识库,不止是为了记录,更是要为了输出,通过输出来确认自己掌握了知识。

思考是网络结构的,而表达是树状的。

网络结构利于思考,树状结构利于表达。思考时我们需要的是逻辑关系、类比、和关联,需要网络结构的笔记。表达时,我们是从网络结构中梳理出知识的关系,并整理成金字塔结构,需要的是树状结构的笔记。

输出时,必要掌握的技能是金字塔原理,用到的工具,有些人习惯用思维导图来梳理思绪,有些人习惯用纸笔,有些人用内容编辑器即可。使用那种工具取决于你,重要的是将不同的知识组织成金字塔结构输出。在输出的过程中如果发现自己在某一块内容的缺失,也可以查缺补漏,保证知识的完整性。

金字塔原理的4个基本原则

结论先行

以上统下

归类分组

逻辑递进

金字塔原理的规则

每组中的思想必须属于同一种逻辑范畴

每组中的思想必须按照逻辑顺序组织

学习是一件反人性的事情,持续做一件反人性的事情,并不容易,很多时候会中途放弃。所以我们在设计知识库的时候,也应该保证尽量简单,只有流程尽量简单,才能养成记录和使用知识库的习惯。

为了在检索时方便,应该尽量将所有的内容放在同一处。所以你的知识库应该只有一个,不要用多个工具来做同一件事。例如今天把笔记记在备忘录里,明天记在纸上,后天记在Notion里。这样的记录,不仅无助于记忆,反而让记忆变得更加困难和混乱。

当你有不同的产物存放在不同的工具中,应该借助一些自动化的工具来完成信息的迁移,汇于一处。

《游戏改变世界》一书中,说明了游戏化设计的4个特点是有明确的目标,规则和良好的反馈系统,并且玩家需自愿参与。

如果从这个角度看的话,知识库正是学习的游戏化设计方案。

知识库要求我们完成某个目标(记录一个知识卡片)时,必要地进行刻意练习,游戏规则明确,就是学习完成后记录笔记。

笔记本身是一种知识的可视化,强化了学习的反馈系统。同时知识具有复利性,你学习到的知识越多,吸收新知识也就越简单,速度也越快。知识的复利效应让我们成功进入大脑和知识库同步成长的双正反馈循环中。

从这个目的出发,了解了知识库中,存储知识的基本单位是一张张的卡片,也可以理解为是一篇篇的笔记,知识可以分为网络结构和树状结构两种。

并且,我建议在建立知识库时,使用网络结构的笔记,可以帮助我们思考。从网络结构中,可以梳理出树状结构的笔记,这是一个输出的过程。有时我们学习的是前人已经梳理好的树状结构内容,我们可以记录并在前人的树枝上进行扩展。

同时,为了更好地辅助思考,知识库还需要有间歇重复功能来辅助记忆,需要有链接工具来串起知识与知识之间的关系,需要有好的写作工具来辅助输出。

在知识的工作流程上,应该有且只有一处知识库,并且将流程尽量地自动化,只有尽量保持简单才能养成记录笔记的习惯。

最后,知识库只是大脑思考的辅助工具,最重要的思考,还是要由大脑来完成。持续地记录笔记,知识库的作用将会越来越强大,知识之间的网络效应会起作用,知识的复利效应会起作用,思考的价值也会随之放大。

工具会影响人的思维习惯。

再例如习惯使用Photoshop的人,习惯将画布拆解成一个一个的图层,所有的处理都基于图层发生。而习惯使用figma的人,则是将画面拆分成了画面、矩形、线条几种元素,所有的画面都是由这些元素搭起来的。

这里我推荐几款市场占有率较高的笔记软件,他们的特点各不相同。

Notion:是我正在使用的笔记软件,特点是具有database功能,可以实现笔记规则;缺点是内容在线化,国内网络访问较慢,迁移成本高等。

Obsidian:可以说是最强大的笔记软件,符合上述的所有需求,有大量的UGC插件生态来实现各种功能,但缺点是学习成本很高,有太多值得探索的内容。

Roam:第一款让双向链接流行的笔记软件,满足上述的所有需求,缺点是收费太高了,适合搞学术的同学。

Logseq:这款软件也满足上述的所有需求,他的特点是一切笔记基于大纲结构,而我不太喜欢这样的工具思维,使用的不多,无法评价。

如果你过去使用的是类似印象笔记或有道云笔记,那么将知识迁移到新的笔记系统上的成本或许会比较高,网络上有一些现成的迁移方法,你可以了解后评估是否要迁移。

但可以肯定的是,印象笔记过去的那种按照笔记本为本位的模式是已经过时了,也希望这两个平台可以推出新的功能来适应新的时代。目前我们也看到这个过程正在发生,印象笔记正在推出新一代的笔记软件——VERSE,也希望像这样的工具可以帮助印象笔记的用户更好地建立知识库。

THE END
1.葛剑雄:图书馆不仅是“硬盘”,还是文化场所和精神空间来源:南方南方周末:怎么看待电子图书资源在今天的功能? 葛剑雄:它能更有效地促进知识信息的普及和及时传递。普通公众也可以拥有很多免费的资源,从信息的传播和社会化、资源充分利用的角度来看,这的确是人类历史上空前的变化。很多人担心,这样会导致纸本图书的传统消失。从工具性阅读的角度来看,的确现在的电子化完全可以取代原来的https://www.bplisn.net.cn/news/3497.html
2.图书馆档案管理12篇(全文)正如瓦洛说:“档案就是人类记忆、文化和文明的金子。”档案这种“金子”是人类社会连续性发展的桥梁, 是人类社会历史的浓缩, 透过档案我们能够触摸到人类社会绵延不断的“脉搏”。图书馆档案浓缩了图书馆发展历史, 透过图书馆档案我们能够看到图书馆发展轨迹。为使高校图书馆发展轨迹得到真实有效的记录, 使图书馆工作https://www.99xueshu.com/w/ikeyhbqg5nwr.html
3.论巴特勒的图书馆记忆思想*1928年杜定友先生提出图书馆“是社会上一切人的记忆”[2]; 1933年在大洋彼岸的美国,巴特勒先生将图书馆定义为“移植人类记忆的社会装置”[3]1。同一时期,一中一西两位图书馆学家对图书馆功能的形象描述,一直被学界奉为图书馆记忆研究的圭臬。相较于杜定友先生的简言,巴特勒依靠对“记忆”的理性分析,构建了一种“https://www.fx361.com/page/2021/0107/14300579.shtml
4.haossr对《图书馆学是什么》的笔记(1)研究对象的确定本身就是一种困难 学科划分的悖谬 众说纷纭的研究对象有共识 共识多于分歧 社会科学范式难以统一 二、图书馆学的基本内容有哪些 2.1 从文献到客观知识 1 文献与知识的定义 GB3469-83 "文献是记录有知识的一切载体" 定义的缺陷:青铜器不是书修正的定义:文献是专门记录、传播有知识的一切载体文献的https://book.douban.com/people/surdcn/annotation/3034654/
5.信息技术的论文范例15篇具体到一个高中的信息课程课堂上而言,要结合学生的学习能力、知识背景、兴趣爱好等综合制定一个标准,针对不同学生设定的目标也要有差异,如果没有差异那么与我们的传统教学有什么区别呢。设置分层目标要遵循“既要让全体学生达到教学大纲要求的基本目标,又允许学有余力的学生超过课程要求去学习”的原则,使目标层次与各类https://www.fwsir.com/jy/html/jy_20240603113152_3864105.html
6.资源发掘与保存(精选十篇)笔者在教学活动中,一方面立足课堂教学的内容进行拓展延伸,如组织学生开展课文仿写,针对教材内容进行资料搜集,以及开展一些社会小实践活动等等,通过这样的方式让学生在课堂学习中无法满足的内容在课外得以自由发挥。另一方面,笔者在课外活动环节发挥以赛促学的作用,定期组织一些背诵记忆方面的语文学习竞赛,让学生的思维活跃起来https://www.360wenmi.com/f/cnkeydzakdwv.html
7.图书馆情报与文献学研究的新视野9最新章节其中,对知识创新客体管理的研究是“知识创新”研究的核心内容,主要针对知识创新内容和过程的管理,相关研究的数量众多、范围广,包括对知识创新的类别、组织、传播、服务、影响因素等各方面的研究,具体有知识共享、知识服务、组织学习、知识经济、高校图书馆、隐性知识以及知识经济等研究;对知识创新主体的研究主要是为了应对https://m.zhangyue.com/readbook/11816907/16.html
8.计算机应用基础心得体会(精选11篇)了解计算机这一现代化工具的基本知识,学会计算机基础软件的应用和操作技能,从而具有应用计算机来获取信息的能力,满足和适应信息化社会对学生基本素质的要求。因此,在计算机应用基础课程的教学中要注重精讲细练,培养学生的信息意识和计算机应用能力。 一、结合生活,激发学生学习兴趣 https://mip.oh100.com/daxue/5152708.html
9.2018级高职康复治疗技术专业人才培养方案(8.29)4.具有康复评定和物理治疗、作业治疗、传统康复治疗以及言语治疗和假肢矫形器应用等康复治疗基本知识。 5.具有社会科学、医学伦理以及康复医疗相关政策法规与诊疗范围的基本知识。 (二)能力目标 1.能熟练应用声、光、电、磁、热等物理因子治疗技术;熟练应用肌力训练技术、关节活动技术、软组织牵张技术、关节牵引技术、https://jwc.wfhlxy.com/info/1023/1376.htm
10.英语的重要性与学习英语学习普遍失当的根源是目前中国社会仍然缺少英语语言环境,诱因是中国文化中由来以久通过考试选拔人才以及检验能力的传统。根源和诱因是不能颠倒的,对考试的倚重在各个学科中都存在,然而,惟独在英语学习中失当才有最充分的体现。语言具有极强的社会性,一种语言在被广泛学习的同时体现出的失当也反映了一些基本社会人文https://www.ruiwen.com/ziliao/english/6975963.html