前不久,在素有知识图谱“世界杯”之称的OGB(大规模图数据,OpenGraphBenchmark)挑战赛中,来自中国的度小满AI-Lab团队凭借自创的TranS模型荣登OGB-wikikg2榜首。OGB是国际公认的知识图谱基准数据集和“竞技场”,比赛汇聚了全球AI顶级人才。此次,度小满夺冠的OGB-wikikg2是OGB三大类任务之一。
近年来,随着数字化时代到来,基于人工智能的一系列技术蓬勃发展,知识图谱技术便是其中不可或缺的一环。全球各大科技巨头逐步加强知识图谱布局,期待着知识图谱在更多领域发挥重要作用。那么,究竟什么是知识图谱。请看——
穷本溯源,知识图谱逐步发展完善
知识图谱技术,指的是建立和应用知识图谱,对海量数据信息进行检索、抽取与处理,并且利用数据挖掘和机器学习技术来管理和分析,从而形成图模型来描述知识和建模世界万物之间的联系。
知识图谱的概念最早在2012年由谷歌提出,其发展史却可以追溯到1960年的语义网络。
语义网络是一种较为直观的知识表达方式,采用相互连接的节点和边来表示知识。其中,节点表示对象或者概念,而边表示对象或概念之间的关系。
20世纪80年代,哲学概念“本体”被引入到人工智能领域用以刻画知识,为知识图谱搭建了基本的框架。万维网的出现,初步实现了文本间的链接,形成了知识图谱的雏形。
随着万维网技术不断发展,它的技术栈(所使用的不同种类的技术的统称)越来越庞大、复杂。2006年,万维网的发明者、英国计算机科学家蒂姆·伯纳斯·李提出“关联数据”的概念。他希望所有机构以标准化形式将原始数据公开,从而建立一个互联互通的知识网络。而这已经很接近现在的知识图谱技术了。
2012年,谷歌发布了知识图谱,用于改善搜索的质量。知识图谱除了显示其他网站的链接列表,还提供详细的关于主题的信息及其所属结构。不同于传统网页搜索的是,使用知识图谱的语义搜索不是展示网页,而是展示结构化知识。比如输入“戴高乐号”,传统网页搜索会给出“戴高乐号”航空母舰的舰长、舷宽、排水量和下水日期等属性信息,如果点击“戴高乐号”的技术特点版块,则可以直接进入其知识卡片,了解到舰体防护、动力系统、船电系统、舰载武装等信息,实现即问即答。
聚焦未来,大力发展知识图谱成为趋势
互联网技术发展进入快车道后,数据的爆炸式增长早已使知识图谱潜移默化地融入人们的日常生活。无论是一次平常的“百度”,还是与手机AI助理的知识问答,或是个性化教学服务,都是基于知识图谱技术的发展实现的。
基于知识图谱等前沿交叉技术开发的人工智能正在风靡全球。
知识图谱让智能系统具备了认知能力。这类人工智能相较于只拥有海量、繁杂数据的机器而言,显得“聪明”和“可靠”许多。它能利用知识图谱管理归纳数据,将数据以多种类型和关系连接在一起,在检索信息时,可以更加全面、更加开阔、更加系统地将要找的信息整理出来,输出出去。
反过来,因为更强大的智能系统,可以更好地从客观世界中去挖掘、获取和沉淀知识,这些知识和智能系统形成正循环。两者共同进步,这也正是知识图谱的优势所在,不断为数据提供“住处”的同时也提升自己的容量,进一步自我完善。
随着技术的成熟及应用的推广,知识图谱逐渐向生物、金融、能源等知识密集型领域渗透。比如,中国林科院科信所林草大数据与知识服务团队日前研发成功的“林草领域知识图谱应用系统”,就实现了林草领域知识资源的协同建设与共享。
如果进一步放开眼界,知识图谱技术的应用更加宏阔。今年4月19日,中央全面深化改革委员会第二十五次会议审议通过了《关于加强数字政府建设的指导意见》。数字是手段,治理是目的。利用知识图谱技术可以更好地促进政府决策科学化、社会治理精准化、公共服务高效化。
可以说,人类未来的生活,已经与知识图谱技术密不可分了。
整合分析,知识图谱赋能智能化战争
正如网络诞生之初是为了服务于军事活动,很多新技术的发展,不但会在日常生活中大量应用,同时也会触及军事领域,成为军事发展的热点,甚至会对未来战争的模样产生影响。
世界上一些军事大国已敏锐地洞悉到利用知识图谱分析数据的重要性。早在2013年,美国国防部高级研究计划局(DARPA)就牵头开发了Insight项目,该项目能够将互不相干的信息源整合成一张统一的战场图片,通过对来自不同信息源的数据进行整合归纳,形成鲜明的体系结构,以提高情报传感器的工作效率。
目前,军事领域知识图谱的研究正火热开展。
军事领域知识图谱是链接指挥系统、作战部队和武器平台等各项作战要素的重要桥梁。
在信息化智能化战争中,指挥效率对作战进程和结局有着决定性影响,而战场数据是指挥员作出决策的最重要依据。来自海军、陆军、空军等各军兵种的海量信息数据,无论是作战还是非作战数据,人员还是装备数据,演习还是训练数据,都在呈指数级趋势增长,这使得作战问题更加复杂。据美军报道,仅1架“捕食者”无人机1天搜集的视频数据就需要19名情报分析人员来处理。前美国国防部情报局局长空军中将杰克·沙纳罕称:“谈到情报、监视和侦察,我们有比国防部历史上任何时候更多的平台和传感器。这些平台和传感器产生了海量的情报数据,但我们却无法充分利用。”
构建军事知识图谱,将使这一问题迎刃而解。
针对正面战场多、参战军兵种多、武器装备多、突发情况多的实际,可以运用知识图谱技术对大数据进行采集、归纳与分析。这份战争的知识图谱,将为指挥官提供武器分配、兵力调动等决策辅助,帮助他们及时了解、掌控各个点位和战场态势。知识图谱技术的运用将使整个作战指挥控制体系更加高效,推动战争由信息化向智能化发展。
此外,在情报侦察方面,利用知识图谱能够将孤立的数据源进行知识融合,实现碎片信息的深度挖掘,从中获取高质量的情报。