三个大脑系列(三):思维大脑(上)——信息搜集与整理

所以这也是为什么我将这一节的标题起为「信息搜集术」的原因。因为这一部分的内容基本不涉及思想,只是将我这些年积累的重要信息源和搜索技巧做了整理和介绍(如下图所示),可以说是把我这么多年压箱底的精华拿出来了。

书籍在我的信息收集术中占据了很重要的一趴,因为很多专业领域都可以在书籍中找到系统化的知识,对于快速掌握一个领域帮助非常大。

可能很多人会选择购买纸质书,但是我更加倾向寻找PDF版本的电子书。原因是有两点:

至于为什么我统一选择PDF而不是mobi、epub等其他格式,则是因为PDF的适用范围最广,无论是macOS、iPad、Windows,都可以默认打开PDF文档进行查阅(以及还有书签等好处,下面细说)。

理想的情况下,需要使用的信息源应该越少越好。在我这么多年的实践下,在书籍检索上我将检索信息源收敛到了两个,分别用于检索英文书籍与中文书籍。通过这两个信息源,几乎就能轻松找到市面上90%以上的PDF书籍。

而且LibraryGenesis上的图书更新速度很快,例如《DesigningInterfaces》在去年(2020年)出版了第三版,我10月份查的时候这上面就已经有了。

而如果你用Google去搜这本书,第一页的结果根本找不到第三版的PDF。

这也正是我在前文所说的,只要找对正确的信息源,获取有效信息就会易如反掌,但是在不合适的信息源中找目标信息,只会事倍功半。

在这里搜索的书籍,只要存在这个试读按钮,就一定可以下载到相应的PDF,同样的,如果没有试读按钮,这本书大概率在全网找不到PDF(不绝对),就乖乖买纸质版吧。

中英文的PDF通过这两个信息源查到或者下载到以后,我第一件事是确认这个PDF是否有书签。这也是我获取完的PDF书籍,然后把它们入库前的最后一个操作。

数据格式的PDF对比上纸质书,最大的一个优势就是它的数字化——便携且方便查阅。为了最大程度上发挥出这种数字化的优势,带有跳转功能的目录是不可或缺的。一旦有这种目录之后,书籍的查阅就会变得极为方便。原来一本很厚的很难查阅的书籍,有了这样的导航能力后,对我来说就变得很「薄」了。因为只要在我需要用到的时候,直接通过目录跳转到书籍相应的位置阅读即可。

然后结合一些OCR工具,就可以很轻松地将文本提取出来,用在我需要用到的地方。

既然带书签目录的PDF这么好,那么从哪里能够得到这种PDF呢?

从大概2015年开始,我就找到了一个专门做给PDF加书签的服务。他们会给PDF加上书签后再发给我,就这么稳定给我提供服务一直到现在,我的几百本电子书基本上都是这么来的。

论文和书籍相对来说比较类似,也是可以按照中文与英文分成两类。

这个学术引擎非常好用的一个特性就是,它会在搜索结果中直接显示引用该论文的高引论文(一般我们会认为被引次数越多的论文影响力越大)。例如pix2code这篇论文,在SemanticScholar的结果页会直接显示有15篇引用了这篇论文的高引论文。

在搜索结果上选择按高影响力倒序之后,就可以直接看到pix2code这篇论文后续的重要研究。例如下图中《AutomaticallyGeneratingCodesfromGraphicalScreenshotsBasedonDeepAutocoder》、《YODA–YourOnlyDesignAssistant》等都是引用了pix2code的高影响力论文(如下图所示)。那我我接下来只要看完这些论文就能知道pix2code之后该领域的研究进展了。

因此,利用SemanticScholar可以非常轻松地找到单篇论文的高引论文,从而发现领域的后续发展脉络。所以在研究某个学术领域的发展脉络上,SemanticScholar可以算得上是一个非常好用的神器了。

再配合上Zotero、sci-hub等配套设施,我基本上可以在短短几分钟中之内找到我要的论文,拿到PDF并完成归档。

在现在这样快节奏的时代,很多人不太喜欢看体系化的视频教程,但是就我个人这么多年的学习经历来看,成套的视频教程对个人的成长、对领域的了解,帮助非常之大。

在我之前做工业设计的时候,曾经花了一个月自学结构设计,基本达到1-2年工作经验的结构工程师的水平,能达到这种水平完全是因为两套系统化和体系化的教程。

除此之外,我的PS、AI使用技巧、我的前端开发能力、Keyshot渲染功底,无一不是通过这种方式习得的。(有关前端开发的学习路径,可以看看下面这篇回答,算是我自学前端的一个总结)

因此在我看来,一套好的视频教程是一条帮助人快速成长的「捷径」,只要找到合适的教程,你就能以火箭般的速度在相应的领域成长,以比别人快几倍的速度掌握该领域的核心能力。

那如果找视频教程的话,有没有什么好的渠道平台呢?当然有,这也是我自己珍藏多年的宝藏级别的资源第一次完整地对外公开。

Udemy是一个在线学习的平台或市场。与传统大学课程推动的学术MOOC课程(Coursera、EdX等)不同,Udemy更像是一个任何人教任何人的MOOC平台。只要你有一技之长,就可以在上面可以免费或者付费地卖课。

正因为Udemy是一个非常开放的课程平台,据我所知已经成为国外最大的在线学习平台。Udemy上有超过100,000个课程。其中有一些专注于专业技能(我的前端就是在上面学的),而另一些则专注于学习爱好,例如乐器、美妆,甚至有教如何玩游戏的课程。

虽然Udemy上课程很多,但是有一个小小的缺陷,就是大部分课程都是英文的,如果你英语不太好的话,可能就会错过这个巨大的宝藏。

关于Udemy更多的评价可以看看这篇知乎问答,基本上很客观的反应了Udemy的课程情况。

之前的Udemy值得我大吹的一点是,任何课程30天之内可以无条件退款,而且经常打折(一门课10$左右,每次打开Udemy的主页都会发现他们在变着花样打折,甚至怀疑这完全就是一种营销策略),非常适合学生党筛选适合自己的课程。(但是好像今年Udemy的课程政策做了个改版,买的课当看过多少以后,就不能退款了。)

讲了综合教程和稀缺教程的网站平台后,这一部分来讲讲一些我以前整理过的垂类教程平台网上,在这些网站平台上可能就只是包含了某个特定领域的教程资源,内容往往会是精且深。

慕课网:程序员的视频教程平台

如果看过我写的如何自学前端的小伙伴,应该知道这个我一直强烈推荐的学习平台。有一说一,国内的慕课网是我看到过垂类领域做的最好的视频教程平台。慕课网上的「实战课」,大部分都是有多年大厂经验的开发者讲师,将自己在一线的经验整理录制出来的,极为干货。

不过我知道大部分小伙伴应该对前端并不感兴趣,因此在这里点到为止。

C4D之家、菜鸟C4D

信息搜索术解决了信息的输入环节,但是如果没有一个体系化的信息承接系统,那么看过再多的资料,都不可能沉淀为真正属于自己的东西,为自己所用。因此信息的整理系统就非常有必要。而这样的信息整理系统,就是「知识大脑」的一部分。

语雀是我承载90%以上碎片化知识的主阵地。主要的采集手段就是剪藏。

胡适说过:「怕什么真理无穷,进一寸有一寸的欢喜」,就是我这两年多来使用语雀的最佳写照。

我非常喜欢Zotero的文件夹功能,以及文件夹与资料条目的关联逻辑。首先Zotero的文件夹和语雀目录一样,是无限层级,这就可以让我以结构化的方式去拆解一个领域,构建细分的子领域文件夹。而文件夹与条目之间是多对多的关系。即一个条目可以同时放在A文件夹和B文件夹下面。而它的实例只有一个。

此外,由于Zotero支持智能文件夹(功能名叫「搜索」),即通过条件筛选,找出所有符合需求的资料。譬如我设定一个「添加日期晚于2021年1月1日,并早于2022年1月1日,条目类型为书籍」的搜索文件夹,就可以自动生成我今年的添加的书籍,就直接得到了我今年的书单(如下图所示)。

Zotero让我非常满意的另外一点则是它支持自动同步,由于我拿Zotero存了很多PDF书籍,而很多PDF都是动辄上百兆,因此,我是直接选择订阅了Zotero官方的120$无限存储空间的年费服务。(更多人可能会选择使用坚果云同步,这个就各取所需就好)

虽然Zotero的iOS内测版已经有了,但是从体验上暂时还是PaperShip领先一筹。(另外说一嘴,12.9寸的iPad看PDF是真的舒服)

Airtable很好地解决了一些零散、但值得被结构化的信息,例如我用Airtable整理自己的macOS装机软件合集、设计资源工具箱、开发辅助效率工具等等。

我相信大家大家的浏览器标签页都遇到过开的非常多而杂(就像下面这样)的情况,进而就会遇到「哎,我刚看到的网页在哪」、「哎怎么现在网页有点卡」的问题。

造成这样问题的原因是,我们之前打开的页面往往都是有用的,不想关闭,但是现在手头在做的也是有用的,也不能关闭,结果页面越开越多,最终就变成了这样尴尬的局面。虽然Chrome提供了标签组的功能尝试解决这样的问题,但是体验上并不良好。而Workona则很好地解决了这个问题。

因此Workona基于Workspace的思路解决了这个问题。在每一个Workspace中,都会记录下当前打开的标签页,当切换Workspace时,则可以自动打开那个Workspace中打开的页面。

此外,在Workona的Workspace中除了持久化临时打开的窗口以外,还允许用户将某些网页为Resources、关联Notes,如下图所示,这个就是我在研究学习GithubAction时,在找到某些问题的解决方案时,顺手将其存为Resources,并记录关键用途。

不过Workona要使用的话,必须要学会魔法,同时由于可能是近年来才做起来,因此哪怕在少数派上都没什么人推荐,在我看来也是一个非常宝藏的产品了。

以上就是我目前整个信息管理系统,基本上可以比较完美地捕获我在日常学习、生活、工作中获取到的所有类型的信息,并以合适的形态沉淀到我的知识大脑中,在日后便捷地获取和使用。

我的信息管理系统,从信息源到收口平台的对应关系,只要看看下面这张表格就好,我觉得应该写的比较清晰了。

在互联网上找某个领域的有效信息,就好比是沙漠里的一棵孤独的胡杨树在寻找水源。你能在表面看到大量的沙子,但是它们对你无用。而有效信息就像是水源,对你来说至关重要,但是它们不存在沙漠表面,也非常难以获得。

进行信息搜集和聚合的过程就像是树根不断地往地下挖土,寻找水源的过程。你可以轻松在表面找到大量沙子,但是它们对你的成长无用。就像是百度一下都能找到某个关键词的定义,但是它们对增加你的经验和知识并没有多大帮助。

寻找水源的过程非常困难,也非常艰辛。但是一旦找到一滴水(一句关键的话),你就有可能快速定位到一片水源(有效的信息源)。而这片水源可能还连接到另一片水源,把你整个的水源全部串联在一起。(有效信息之间的互相验证与证实)

随着你对沙漠地下的挖掘越深入,你就越能发现好的水源,树根遍布整个沙漠地下,你的生长也会更加迅猛快速,甚至比那些在绿洲中的树木还要健壮与强大。

和我共事的结构工程师只看到我接触了结构设计软件一个月,所以他会得出结论,认为我在结构建模上很有天赋,但他没看到我这一个月内光是看这个软件的教程就花了40个小时。

但是我越是这样被赞扬,越是深刻的意识到,自己只是看得多、积累的多而已,因此进而更加努力去积累。

拖了一年的《思维大脑》终于写了一半了,大家可能会好奇,既然上讲了信息搜集与整理,那么下篇会讲什么呢?

这套核心逻辑我已经私下和一些朋友或者同事简单介绍过,每个听到的人都有被深深地震撼到。甚至有人直接表示:「这个工具啥时候做出来?我现在可以给你预付年费。」

所以对此抱有期待的小伙伴们,请再耐心等待等待吧,好东西是要多磨的~

THE END
1.架构13持久化存储(2)存储相关概念 Mount 和 Volume **Mount:**将外部存储挂载到系统中。 **Volume:**物理存储的逻辑抽象,提供有弹性的分割方式。 Docker 的挂载类型 **Bind:**将宿主机目录挂载到容器中。 **Volume:**Docker 管理的存储资源。 **tmpfs:**内存中的临时存储,不适用于持久化存储。 https://blog.csdn.net/liyou123456789/article/details/144385743
2.configmap数据持久化mob6454cc77b8eb的技术博客Hibernate通过持久化对象Persistent Objects(PO)对数据库进行操作,底层数据库操作 对于应用程序来说是透明的,应用程序无需关心JDBC操作,底层数据库连接、数据库访问实现、事务控制,而是直接以面向对象方式进行持久层的操作。 Hibernate详细的框架体系如下: SessionFactory:是依赖于ConnectionProvider的会话和客户端工厂。 它拥https://blog.51cto.com/u_16099322/12777408
3.GBase数据库在分布式存储中的优化实践GBase 数据库是中国自主研发的关系型数据库,涵盖事务型数据库 GBase8a、分析型数据库 GBase8s 和云原生数据库 GBase8c。 GBase8a 侧重于 OLTP(联机事务处理),适用于高并发小事务场景。 GBase8s 专为OLAP(联机分析处理)设计,支持复杂查询和海量数据分析。 GBase8c 云原生架构,支持容器化和微服务,适用于云计算https://zhuanlan.zhihu.com/p/11969718242
4.LSMTree在存储系统中的优化策略与实践天翼云开发者社区2. 磁盘上的优化 磁盘上的持久存储区(SSTable)是LSM-Tree设计的精髓之一。SSTable的数据结构可以保持有序,同时又能利用磁盘追加写的高性能。在SSTable中,数据按照Key有序地组织,使得查询操作可以通过索引或布隆过滤器来优化查找速度。 磁盘上的SSTable会定期进行合并(Compaction)操作,以优化读性能。合并操作分为Minor https://www.ctyun.cn/developer/article/621618565951557
5.达梦数据申请一种基于ApacheCommonsPool2的SSH连接池专利,降低金融界 2024 年 12 月 13 日消息,国家知识产权局信息显示,达梦数据技术(江苏)有限公司申请一项名为“一种基于 Apache Commons Pool2 的 SSH 连接池装置、方法、设备及存储介质”的专利,公开号 CN 119109965 A,申请日期为 2024 年 9 月。 专利摘要显示,本发明公开了一种基于 Apache Commons Pool2 的 SSH 连https://www.163.com/dy/article/JJ9KPFPE0519QIKK.html
6.sparkcore入门到实战之(6)spark优化从入门到实战大码王(2)尽可能地避免采用含有指针的嵌套数据结构来保存小对象。 (3)考虑采用数字 ID 或者枚举类型以便替代 String 类型的主键。 (4)如果内存少于 32GB,设置 JVM 参数-XX:+UseCom-pressedOops以便将 8 字节指针修改成 4 字节。与此同时,在 Java 7 或者更高版本,设置 JVM 参数-XX:+UseComhttps://www.cnblogs.com/huanghanyu/p/12995617.html
7.学校图书馆管理信息系统开发的可行性研究报告(通用10篇)学校图书馆管理信息系统开发的可行性研究报告 一、项目概述: 该次系统开发的对象是银杏酒店管理学院,开发该系统的目的主要是对有关读者,书籍,借书,还书,存书等方面的信息进行统一管理,本系统结构分为读者信息管理模块、书籍信息管理模块、借阅信息管理模块和管理者信息管理模块。图书馆信息化是对信息管理系统化、科学化https://www.360wenmi.com/f/fileiv3v59e5.html
8.README.md·初九/GPT智能图书管理系统后台Vue2智能GPT图书管理系统(SpringBoot2+Vue2),全局异常拦截器,登录校验拦截器,Echarts展示借阅量,可添加爬虫功能获取图书数据。API认证采用JWT。后端CORS跨域支持。HTTP Status Code表示状态。数据返回格式JSON。接入GPT接口,支持AI智能图书馆。https://gitee.com/Serenity-Lin/vue_-book-manage-system_backend/blob/master/README.md
9.成都中医药大学图书馆2023年电子资源采购项目1二次政府采购合同受业主委托,中国采招网于2024年01月23日发布成都中医药大学图书馆2023年电子资源采购项目1(二次)政府采购合同公告;项目简介: 一、合同编号:N5100012023003343-1 二、合同名称:图书馆2023年电子资源采购项目1(二次) 三、项目编号:N5100012023003343 四、https://m.bidcenter.com.cn/news-4-269642373.html
10.可持续发展与社会责任12篇(全文)企业履行道德层次的社会责任,所需要的资金来自企业利润的一部分。企业利润分配的制度化,以及动用企业利润用于社会公益事业的程序化、规范化,是企业履行道德层次社会责任持久化的保证。上述的制度化、程序化和规范化,既能协调投资者、管理层和职工之间的关系,又能协调企业的近期发展和长期发展之间的关系。 https://www.99xueshu.com/w/ikeymdlj6g0n.html
11.云图书馆平台网站建设方案/蚁坊软件舆情监测系统云图书馆平台网站建设方案,蚁坊软件舆情监测系统,做教育集团的网站,上海嘉定网站建设Solidity 合约类似于面向对象语言中的类。合约中有用于数据持久化的状态变量,和可以修改状态变量的函数。 调用另一个合约实例的函数时,会执行一个 EVM 函数调用,这个操作会切换执行时的上下文,这样,前一个合约的状态变… http://www.mhkc.cn/news/445231.html
12.www.rjlqq.com/mokaka85964.html据报道,这次部署测定装置大约要花经费2400万日元(约合人民币154万元)。据日本防卫省2013年的年度预算,将按原定方针依次分时期在这三个村进行选址、安装等,并会对在官网上公布的结果加以探讨。 7月三元材料排产转好,磷酸铁锂排产持稳,碳酸锂产量过了释放高峰,或因原料倒挂、夏季检修,7月碳酸锂产量预计持平或https://www.rjlqq.com/mokaka85964.html
13.信息管理系统实习报告(精选12篇)3.1.2掌握项目开发相关的技术 在整个过程中,学习到了公司项目开发流程,SpringMVC三层架构的构建,Maven项目管理工具的使用以及Maven项目的搭建,Svn版本控制的使用方式,丰富了java基础知识,hibernate框架、Spring框架的使用,数据库MySQL的巩固和加强,学会使用左联接,右联接等的复杂查询应用。数据持久化操作hibernate的相关技术https://www.ruiwen.com/shixibaogao/4489931.html
14.图书管理系统api接口(图书管理系统功能简介)2.图书远程编目 图书馆管理系统提供Z39.50的客户端,并与编目系统完整的结合,不仅实现本地书目总库的查重,本地共享编目库的套录,也实现与INTERNET上其他编目中心数据库的连接,达到免费套录异地数据库中的编目数据,大大提高了图书编目速度,又节约了成本。 https://www.eolink.com/news/post/61446.html
15.Chapter2.实体Beans(II)Chapter 2. 实体 Beans 2 2.2.5.4. 机联持久化 | Transitive persistence with cascading 你可能已经注意到cascadeattribute有一个CascadeType的数组值.EJB3中的cascade 观念和Hibernate 持久化cascade 观念很相似的,但是也有一些语义上和cascadeing types 的不同 : http://www.360doc.com/content/07/0725/14/12931_632089.shtml
16.书栈网·BookStackQuestDB (2) QuestDB是面向关系列的数据库,旨在对时间序列和事件数据进行实时分析 Redis (24) 一个开源基于内存可持久化的、Key-Value数据库 RocksDB (3) 来自Facebook 的可嵌入的支持持久化的 key-value 存储系统 SequoiaDB (7) 巨杉数据库,一款开源的金融级分布式关系型数据库,主要面对高并发联机交易型场景提https://www.bookstack.cn/
17.关于创新意识的心得体会28篇学校应加大投资,为大学生营造良好的学习环境和学习氛围,大力宣传创新的重要性,努力提高高校大学生的学习兴趣和自主创新意识[5]。实验室、图书馆和多媒体教室等学习资源要全面放开,真正做到一切为了学生,一切为了教育,办让人民满意的教育,为学生们的自主创新活动与实践搭建平台,提供便利的条件。 https://wenku.puchedu.cn/63693.html
18.基于vue的图书馆管理系统的设计与实现.docx摘要 图书管理系统是一个实现了自动化、规范化、高效化的系统,它是一个仓库物流作业的核心,是为提高书店、图书馆或相关机构提高管理的效率而设计。通过自动化改变了一直以来人工参与的仓库管理方式,极大减少了因为管理人员的疏忽而造成的数据丢失、错乱、重复等问题,能有效降低图书在仓库管理中的成本且大大提高了管理https://max.book118.com/html/2022/1026/6011125013005010.shtm
19.有关班主任的工作总结(合集15篇)开学的第二个星期,我们就开始实行早自修制度,早晨7:30分,每班学习最困难的5名学生到图书馆集合,由任课老师进行细致的一对一的辅导,至8:15分结束,整整一节课的时间。许多任课教师经常匆匆赶到学校,连早饭都来不及吃,就直奔图书馆。有的还立刻之后上第一节课。问到其感受时,老师们的回答惊人的一致:“这不https://www.oh100.com/a/202302/6204355.html
20.图书管理系统(纯HTML).rar一个前端的图书管理系统页面,纯HTML,黄色调,可以直接嵌套在项目使用,兼容,如果是vue等项目,直接改改也是可以用的https://www.iteye.com/resource/qq_41098163-12183791
21.学校卫生先进个人主要事迹集锦15篇学校举办健康教育宣传专栏,每月更换一次内容,让教职工经常收看中央电视台《健康之路》节目,针对不同季节购置疾病预防科普读本充实图书馆,每季度对教职工进行卫生与健康知识考试,培养教职工良好的生活习惯,如戒烟限酒,增强运动等等,每学年对学生进行体检,建立健康档案,通过各种形式,鼓励教职工多做身体检查,对各种疾病早https://www.unjs.com/fanwenwang/shijicailiao/20221208100805_6077276.html