打造可持续的个人工作流02:系统篇

正所谓「知之真切笃实处即是行,行之明觉精察处即是知」,要想深刻地理解,不仅需要思考,更要持续的实践和反思。

接下来,我将按照「实践→系统→需求→工具→实践」的循环来介绍每个环节中的基本思维方式,展示可供选择的光谱,希望这种讨论能帮大家帮助理解工具的逻辑,更有效地构建适合自己的工作流。

如果你曾与这样的同事合作过——他们将自己的工作视为孤立的任务,仅仅完成分配给自己的工作而不考虑上下游的配合,那么你一定能理解系统性思维的重要性。万事万物都是相互联系的。很多时候通过提升视角,拔高层次,以「整体」的视角从更高的维度审视问题,就能够发现更优的解决方案。

在工具的使用上,我们同样需要培养一种系统意识:工具不应被视为孤立存在,而应成为某个系统的一部分。唐纳德·A.诺曼在《设计心理学》中写道:

解决服务的复杂性的唯一方法是,将它们当做系统,把全部体验作为一个整体来设计。如果每个部分都被孤立地来设计,最终结果就是各个独立的部分不能够很好地配合在一起。

之所以需要有工具的系统意识,是因为真实的使用场景是灵活多变的。例如:

因此,理想状况下,流程之间不应该是孤立的,而是融合在一起,根据具体情况提供必要的协助。这种组合工具的使用,是更高维度的「服务」,也是我们所期望构建的输出导向的个人工作流。

那么,我们应该如何培养工具的系统意识呢?我的思路是「结构化」和「流程化」。

通过结构化和流程化构建的工作流,未来可以进一步进行标准化和自动化,并循序渐进地进行迭代,使其更加契合个人习惯。

尝试新的工具、设计新的工作流本身就能给人带来快乐,特别是与之对照,需要用工具完成的工作往往痛苦得多。但是,我们的最终目标始终是输出,因此不要为了工具而工具,有时需要自我克制这种折腾工具的欲望,只进行必要优化。

我会建议遵循奥卡姆剃刀原则「如无必要,勿增实体」,具体来说,有两点值得考虑:

就像项目需要拆解成任务来执行,工作流的构建也无法一蹴而就。那么工作流应该如何拆解呢?既然工作流是由要素组成的具有一定结构的系统,可以把它想象成是乐高积木组装的建筑,我们先顺着结合不那么紧密的地方,拆解为一个个更独立的模块,再根据个人需求,组装成更适合自己的工具。

在从工作流中拆解出不同的需求之后,我们可以很清晰地看到,不同需求所对应的工具,不管是软件的逻辑,还是选择的侧重点都有差异。而且就像层次步速理论(PaceLayeringTheory)所言,建筑中的每个层次、社会中的各个领域都有自己的变化频率,不同类型工具的使用周期也是不同的。我们应该对那些核心的、基石般的工具事前精打细算、事后物尽其用,不要轻易大改,为整个工作流提供稳定性;而另外一些服务可以不用过分货比三家,只要满足当下需求就算物有所值,未来如果发现不合适,也可以快速找到替代或升级方案,在现有基础上优化。

基于上述目标,我采用计算机领域经典的二分法:关于「数据」的需求和关于「程序」的需求。更通俗地讲,也可以说是关于「文件」的需求和关于「流程」的需求。

或许程序类的需求相对小众,但只要是数码用户,肯定都有数据类的需求。我把以下三者都归到数据类的需求:

浏览和编辑毋庸赘述,我们来看看最核心的管理功能。文件管理功能是如此基础,以至于所有的操作系统都会自带文件管理器;用户的文件管理需求又如此多样,因此很多人都有过寻找系统文件管理器之外、更强大的文件管理器的经历。就个人而言,尽管换成macOS多年,我依然没有发现一个能够完全满足自身需求的文件管理器,结果还是开着ParallelDesktop运行TotalCommander来管理macOS中的文件。

随着系统的更新换代,文件管理工具也在不断迭代升级,但是再怎么优化,也无法解决系统层面的局限:文件只能放在单一目录,而现实世界的分类往往需要多个维度。此外,不同媒介类型的文件管理有其独特性,很难被通用的文件管理工具满足。这些限制催生了库管理工具的发展。它在传统文件管理基础之上,加入了元数据管理,使得文件的组织和检索更加灵活,大大提升了效率。下篇还会进一步讨论不同的管理方式:除了传统的文件管理和库管理,二者之间还有一个选择的光谱;二者也并非全然对立,还存在一些兼容不同管理方式的解决方案。此处不再展开。

为了帮助大家更好地理解三类文件需求的区别,在此简单列出不同媒介类型的典型管理、编辑和浏览工具:

IFTTT的名字「IfThisThenTriggerThat」,就是理解程序类需求的绝妙范式:

不同程序类工具的区别主要在于「what」和「how」的支持范围和配置方式的不同。对于专门针对某一模块的设置工具,how一般内置在工具的逻辑中,不需要用户自行配置,用户只要设置what就好。例如设置鼠标行为的工具默认在有鼠标操作时触发,安卓上的各种启动器默认在返回主屏幕时触发。而通用自动化工具需要用户自行配置what和how。

IFTTT可谓是最简单的通用自动化工具了,从工具支持的服务范围中,手动选择相应的how和what就好。

更高阶的需求就需要对what进行手动组装,需要how支持多个触发条件了。下图的两个自动化工具(n8n和KeyboardMaestro)虽然看上去差别很大,但这只是交互和呈现逻辑的区别,本质是相同的。只要把握了工具的内在逻辑,很容易进行迁移。

再高阶的需求难免要写代码。大部分情况下是what使用代码实现,在工具中手动配置对应的代码文件路径来实现how,例如LaunchBar中:

这个json文件会被macOS上的Ubersicht访问、展示在桌面。同时会同步到安卓平板,被一言工具访问、展示在桌面。

现实中,程序和数据之间的关系暧昧不清。一方面,哥德尔在证明不完全性定理时,把数论命题转化为编码,与「程序即数据」的思想相呼应;另一方面,把数学理解为计算,例如把PI的计算过程和计算结果区分开来,导致了计算中心这一20世纪科学界最大的思想转向。

在工具中,我们也可以看到上述分类并非泾渭分明:

因此,进行程序和数据的区分并非由于真有这么一道明晰的边界,而是因为这种分类可以成为我们理解应用逻辑的思考工具。了解所属的类别后,我们可以更好地:

THE END
1.机器学习面临的三个关键数据挑战当前,关于捕获哪些元数据没有行业标准。然而,元数据与数据本身一样重要。当您具有填充了不同元数据字段的相同类型的数据时,如何关联和过滤数据? 如果以浮标为例,初始数据传感器每十分钟收集一次水温,而较新的浮标每三分钟收集一次水温。关联数据的唯一方法是通过元数据在捕获时公开。当科学家进行历史分析时,他们需要元https://www.528045.com/article/7f423917e5.html
2.排序不完全成功的原因是什么?这种问题如何影响数据处理?在数据处理的领域中,排序不完全成功是一个较为常见但又颇为关键的问题。造成排序不完全成功的原因多种多样。首先,数据的复杂性和多样性是一个重要因素。当数据包含多种类型、格式不一致或者存在大量的缺失值时,排序算法可能无法准确地处理和比较这些数据,从而导致排序结果不完全准确。 https://funds.hexun.com/2024-12-18/216258656.html
3.四不像正版资料,构建解答解释落实m418.39.40看点在数据分析的世界里,我们经常会遇到各种看似杂乱无章的数据,这些数据就像“四不像”一样,难以直接归类和解释,正是这些“四不像”的数据,往往蕴含着最有价值的信息,本文将深入探讨如何构建、解答和落实这些“四不像”的正版资料,以期为数据分析师提供一套实用的方法论。 https://www.yzcjl.cn/post/5569.html
4.四不像正版资料,综合解答解释落实1b93.47.84最新我们时常会遇到一些难以直接归类或解释的数据集,这些数据被形象地称为“四不像”数据,它们既不完全符合传统的结构化数据特征,也不具备典型的非结构化数据模式,同时在半结构化数据的范畴内也显得格格不入,甚至超越了多结构化数据的复杂度,本文旨在深入探讨这类特殊数据的处理策略,提供综合解答,并确保解决方案的有效落实https://vip.cshuijitang.cn/post/2894.html
5.数据分析面临的挑战是什么会计实务答:提高数据分析效率的关键在于建立一套完善的数据管理和清洗流程。通过自动化工具和算法,可以快速识别和处理数据中的错误和不一致,从而提高数据质量。同时,利用先进的分析技术和工具,如大数据平台和云服务,可以加速数据处理和分析的过程,提高整体效率。 在数据安全方面,企业应采取哪些措施来保护用户隐私? https://www.chinaacc.com/kuaijishiwu/krky/zh20241216112531.shtml
6.机器学习找不到创新点?三种特征选择的方法包你拿下顶会!文章介绍了两种新的决策树框架LDATree和FoLDTree,它们结合了不相关线性判别分析(ULDA)和前向ULDA。这些方法能够高效地进行斜切分,处理缺失值,支持特征选择,并提供类标签和概率作为模型输出。通过在模拟和真实数据集上的评估,LDATree和FoLDTree在准确率上与随机森林相当,显示出作为传统单树方法的稳健替代方案的潜力。 https://www.bilibili.com/read/cv40067807
7.数据孤岛“孤”在哪里?不同部门或系统可能采用不同的数据格式来存储和处理数据,造成了数据格式多样杂乱。https://www.zhihu.com/question/440784592/answer/57419373127
8.清博智能王欢:实时接入结构化数据的大语言模型是如何练成的?结构化数据和非结构化数据有何不同? 王欢:非结构化数据,比如说你现在访问的网页,你只看正文部分它就是文本,它的内容就是原始正文。搜素引擎看的就是原始正文,给它训练的数据也是原始正文。 结构化数据不仅知道它的原始正文信息,还对这些信息做了结构化处理,包括发布提及的地域信息、文本分词信息、内容分类以及正负https://m.cls.cn/detail/1388555
9.2022年中国知识图谱行业研究报告澎湃号·湃客澎湃新闻同时,文本、图片、各类报表和音频、视频、HTML等非结构化数据广泛存在于互联网中。互联网企业需要在现有的存量业务中,收集碎片化信息,处理非结构化数据,挖掘信息间的潜在联系,还原完整的、有价值的信息。然而,信息的关联关系挖掘是一项工作量巨大且复杂的工程。https://www.thepaper.cn/newsDetail_forward_19458208
10.行政管理论文15篇这势必导致学生处理社会现实问题和交往能力的技能很难有所提升,他们的知识结构、能力结构和素质明显存在不平衡,很难适应信息社会高速发展的需要。操作性和实践性教学严重薄弱。虽然目前我国高校《行政管理学》课程内容体系一般都设置了教学实习、实训等实践环节,但由于其时间短、任务重,而且管理松散,缺乏常态化和规范化,https://www.ruiwen.com/lunwen/6220159.html
11.RPA机器人在处理非结构化数据时,有哪些挑战和解决方案?强化异常处理能力: 开发健全的异常处理机制,包括自动化的错误恢复和报警系统,以确保RPA在面对非结构化数据处理中的异常情况时能够迅速应对。 综上所述,虽然RPA在处理非结构化数据时面临诸多挑战,但通过结合先进技术、进行数据预处理、持续监控与调整以及强化异常处理能力等措施,我们可以有效地提升RPA在这方面的性能。https://www.ai-indeed.com/encyclopedia/9960.html
12.数据治理新要求2018 年初加入度小满金融开始组建数据智能部,从0到1建设度小满金融的智能引擎的核心算法,深耕计算机视觉、自然语言处理、图模型、机器学习、因果推断等技术能力,多篇文章被EMNLP、ACL、CIKM等国际顶会收录,“智能化征信解读中台”工程荣获吴文俊人工智能科技进步奖。相关技术广泛应用于度小满营销、经营、风控、反欺诈全流程https://hub.baai.ac.cn/view/32749
13.0.技术知识介绍:工业级知识图谱方法与实践1.3.1 非结构化数据的知识建模 1.候选术语抽取[目的是过去更多、更全的术语] 2.术语过滤[剔除低质量候选术语] 领域术语与普通词汇有不同特征,可以采用统计信息和语义信息过滤噪声,常见方法:互信息(MI)、词频逆文档频率(TF-TDF),术语相关频率(RTF)等定量刻画统计特征,或者用词向量方式捕捉术语之间的语义相关度刻画https://download.csdn.net/blog/column/12167028/126426906
14.大数据一般用什么数据库大数据领域的数据库通常使用开源软件,如Hadoop、Cassandra等,相比于传统的商业关系型数据库,成本更低。 综上所述,大数据领域的数据库相对于传统的关系型数据库,具有更好的可扩展性、高可用性、更快的处理速度、更好的适应非结构化数据和更低的成本等优势。https://www.linkflowtech.com/news/2745
15.非结构化数据灾难恢复方法有哪些?非结构化信息数据恢复主要针对3种不同的故障类型进行恢复工作,其基本原理是利用日志文件、副本来对系统中的非结构化信息进行恢复。 1.事务故障恢复 对于事务故障,利用保存在磁盘上逻辑日志以及物理日志中关于故障事务的信息,来撤销故障事务对非结构化信息所产生的影响。其具体的恢复步骤如下: https://www.qinfeng.gov.cn/info/4283/194279.htm
16.研究生开题报告模板这些非结构化数据库因为可扩展性强、资源利用率高,高并发、响应速度快等优势,在大数据应用环境中得到了广泛的应用。但此种应用只解决了前端的业务处理,要真正利用大数据实现商务智能,还需要为决策支持系统和联机分析应用等提供一数据环境——数据仓库。为此,导师指导本文作者拟此题目,研究基于Hadoop框架的数据仓库解决https://www.yjbys.com/file/yanjiushengkaitibaogaomoban.html
17.大数据中非结构化数据的挖掘:文本一、 点击流中的非结构化文本数据都有哪些? 首先来定性什么是非结构化文本数据,这里指的是点击流原始数据中以文字形式展现的数据,包括原始LOG日志以及已经被结构化入库中的部分数据,比如Adobe Analytics的Data Feed,Webtrekk中的Raw Data。当然,有些数据虽然是文本或字符串的形式,但并不是真正意义上的非结构化,比如https://www.51cto.com/article/432085.html