(吉林大学商学与管理学院,长春,130012)
随着人类社会进入信息化时代,情报学科在服务国家重大战略需求、保障总体国家安全、促进社会经济发展等各个领域中发挥着越来越重要的决策支持作用。在新的国际形势下,如何发展我国情报事业是一个新的命题和挑战。深化推进情报学科建设与情报理论方法创新是每一位情报学人和情报工作者亟需思考的问题。
2021年9月28日至9月29日,“2021年中国情报学年会&情报学与情报工作发展论坛暨第十一届全国情报学博士生学术论坛”在长春线上线下同时隆重召开。本次会议由中国科学技术情报学会、中国国防科学技术信息学会、全国图书情报专业学位研究生教育指导委员会和吉林大学主办,由吉林大学管理学院承办。会议入选中国科协2021年度重要学术会议指南,得到《中国图书馆学报》《情报学报》《图书情报工作》《情报理论与实践》《情报资料工作》《图书情报知识》《图书与情报》《情报科学》《信息资源管理学报》《情报杂志》《现代情报》《数据分析与知识发现》《情报工程》《图书馆论坛》《图书馆学研究》《图书馆建设》《农业图书情报学报》《智库理论与实践》《知识管理论坛》《文献与数据学报》《山西档案》《数字图书馆论坛》、DataΙntelligence等三十余家期刊的大力支持。
会议开幕式由吉林大学管理学院院长李北伟教授主持,吉林大学党委常委、常务副校长郑伟涛教授,中国科学技术情报学会理事长戴国强研究员、军事科学院军事科学信息研究中心主任耿国桐研究员,武汉大学人文社会科学资深教授马费成先生和吉林大学管理学院教授靖继鹏先生在开幕式上分别致辞,表达了对情报学科发展和情报学工作未来走向的期望,并对本次会议的召开表示热烈祝贺。郑伟涛副校长介绍了吉林大学的发展历史和人才培养计划;戴国强理事长指出,面对全球百年未有的大变局,必须学会站在更高的起点,找准新定位,塑造新优势,展现新作为;耿国桐主任介绍了国防科技情报工作的起步和发展过程;马费成教授指出情报学的理论研究应服务于国家的重大战略需求;靖继鹏教授强调情报研究应始终以我国社会经济发展为导向。开幕式上还举行了2021年中国科学技术情报学会情报科学奖颁奖仪式,中国科学技术情报学会副理事长兼秘书长潘云涛研究员宣读了获奖名单。
会议邀请中国科学技术信息研究所党委书记、所长赵志耘研究员,军事科学院军事科学信息研究中心主任耿国桐研究员,南京大学信息管理学院院长孙建军教授,北京大学信息管理系李广建教授,中山大学信息管理学院情报学学科负责人曹树金教授,南京农业大学社会科学处处长黄水清教授,南开大学国际合作与交流处处长李月琳教授和吉林大学大数据管理研究中心主任王晰巍教授作大会主旨报告。武汉大学信息资源管理中心主任李纲教授,中国科学院大学图书情报与档案管理系主任初景利教授,武汉大学信息管理学院院长陆伟教授,南京大学信息管理学院副院长朱庆华教授,中国人民大学信息分析研究中心主任卢小宾教授,中国人民大学信息资源管理学院院长刘越男教授,北京大学信息管理系党委书记、主任张久珍教授和华中师范大学信息管理学院院长李玉海教授分别主持了8场主旨报告。
“十四五”时期对于中国科技创新是一个最紧迫、最关键的时期,也是中国科技自立自强的窗口期,我们面临着更加严峻的情报需求和任务形势。第四次工业革命的加速演进、中国科技创新态势的变化、中国面临的国际竞争压力使全球科技创新的竞争环境发生了重大变化,对我国科技情报行业提出了更高要求。
想要全面实现科技自立自强,迫切需要科技情报的“先行”引领。同时,面对我国科技创新发展的紧迫需求,科技情报工作仍存在着一些不足之处,我国科技情报工作整体上缺乏顶层设计与统筹协调机制。
为此,科技情报工作有五大能力亟待构建。一是强化科技文献信息资源战略的保障能力;二是提升科技情报智库决策的服务能力;三是构建前沿技术态势感知的情报预警能力;四是打造科技计划管理全流程的情报支撑能力;五是强化产业创新情报的服务支撑能力。
创新发展,情报先行。赵志耘研究员提出了五点“十四五”时期科技情报工作政策规划的建议。一是建立科技情报工作的统筹协调机制,推动、落实科技规划;二是加大科技情报创新投入,建立较为稳定的多元化科技情报工作的投入机制,支持科技情报工作的开展;三是增强情报学理论方法和关键技术供给;四是加快培养聚集科技情报人才队伍;五是进一步加强科技情报的国际合作。
从情报研究范式来说,人工智能技术的加入会引起情报研究范式的深层次转变,使该范式从以归纳总结为主的“理论科学范式”走向以大数据分析为基础的“数据密集范式”,以及以智能技术应用为基本特征的“智能化范式”,未来的科技情报研究范式可能是将“数据+智能+情报研究专家”三者深度融合的科技情报研究新范式。未来的科技情报智能化会重塑科技情报研究组织模式、人员素质、专业分工方面的工作生态,更加精准和高效地完成科技情报研究任务。
科技情报实现智能化的基本任务是动态智能监测、情报智能挖掘与情报智能预测评估。为此,实现科技情报智能化的途径是构建高质量的情报数据空间、加强情报业务的流程化建模、搭建人机协同的情报生产线。
围绕着国防科技信息大数据的开发利用,耿国桐研究员提出了科技情报研究工作的实践探索。从应用角度分为三个层次,分别是大数据与资源池的构建、情报对象库的构建、情报研究工具箱的开发。从技术角度分为大数据资源体系构建技术、知识图谱技术、情报智能分析技术。其中,情报研究工具箱主要分为扫描监测类、线索发现类、目标画像类、评估预测类、数据分析类和知识管理类六类工具。这些工具在科技情报研究实践中逐步得到了推广应用,初步发挥了提升科技情报研究效率、变革情报研究模式的作用。
情报研究智能化未来需在理念、定位、生态等方面采取措施。科技情报工作者理念要从“让我用”向“我要用”转变,对情报研究智能化的定位要从替代向嵌入转变,科技情报研究生态要从产学研分立向产学研融合转变。
交叉创新是指运用交叉思维进行的创新活动。人类社会现在面临的各类科学和工程问题大都涉及多个领域和学科,需要很多不同背景的科学家一起推进和解决。当前数智赋能的逻辑和思维正在不断地影响整个社会的发展,数智赋能带来的思维、技术条件等变革有效支撑了交叉创新的推进。
大跨度、高聚焦的交叉创新正在崛起。中国数智赋能发展环境良好,中国学者迎来了理论原创与交叉变革的机会窗口。对于图情档学科而言,交叉创新既是历史基因的继承,也是时代目标的融入。在数智技术支持下,图情档学科催生了诸多交叉研究方向,如数字人文、社会计算等。
在更加开放的数智赋能环境下,交叉创新正在经历包括战略思维、跨界思维、时空思维、抽象思维、三元世界(大数据)思维、工程思维等新的思维变革。孙建军教授从人文社科视角出发,提出了数智赋能的交叉创新研究前沿,即数据工程与知识服务、虚拟仿真与社会计算、数字人文创新与应用、社会经济数据融合与创新、网络空间安全与风险治理、学术创新评价与智库服务六个方向的交叉融合。
交叉创新是一个加速器,学科发展需要交叉创新。孙建军教授提出了四点思考:①积极地建构和发展以图情档学科为核心的交叉创新的话语体系,在交叉创新中凸显图情档话语。②图情档学科要走出舒适区、度过适应阶段。对图情档学科而言,做交叉创新必然会面临一些大学科、强势学科的介入;同时,图情档学科需要充分准备和谋划,度过适应阶段。③交叉学科、跨学科等并非“一跨了之”。学科交叉、跨学科需要围绕问题体系和“交叉点”进行解剖与对接,需要从面向国家战略需求、解决社会民生问题等方面进行研究。④技术理性与人文价值的融合。在数智赋能环境下,交叉创新研究的技术属性呈现增强化趋势,如何超越“唯技术论”,将其与社会治理的需求进行高度耦合,凸显人文价值,是一个关键问题。对于人文社科,尤其是图情档学科而言,技术理性生长过程需要科学伦理的道德约束,体现人文关怀,否则会成为一种“理性之蚀”。
李广建教授从国家战略、技术环境、科技人员三个角度,论述了对国家科研论文和科技信息高端交流平台(以下简称“高端交流平台”)的认识。首先,从国家战略角度,中国在全球科技创新链中的地位、中国国家科技创新发展的战略和定位发生了改变,因此,高端交流平台的构建是时代和历史背景下的中国科技创新发展的必然选择。其次,从技术环境角度,近年来,以数据挖掘和机器学习为代表的人工智能技术的发展,催生了数据科学,为科学家带来了强大的数据驱动发现能力。同时,人工智能在科学研究和科学发现领域的应用引发了科研活动的颠覆性变革。第三,用户理解的“高端”是有用、好用、权威。从科技人员角度来看,高端交流平台的科技信息服务是智慧化的服务,能够真正做到“想科学家之所想、急科学家之所急”。高端交流平台不仅是一个科技信息的服务平台,而且是一个读懂科学家的人机协作平台、学术研究的交流平台。
高端交流平台在指导思想上、功能上、定位上、效果上都是“全新”的平台,是在国家发展战略指导下,通过顶层设计思维自上而下对国家科技创新系统的重新设计和具体体现,是对科学交流、科学发现、知识创新范式的重新定义,以此使得我国的国家科技创新体系能够应对新时期全球科技创新中包括国家安全、生存环境、医疗卫生、生物安全、地缘政治在内的涉及国家发展、社会民生等诸多方面的重大挑战,从而增强国家的科技创新竞争力、提高国家的科技创新效率、提升国家的科技创新质量。
随着科学技术的不断发展,科学创新范式正在发生变化,从过去的单领域科学研究问题正在转向未来的多领域复杂科学问题,信息服务的创新体系、创新实体、创新写作、科学数据、科学知识都在发生由小到大的变化。当前,我们需要遵循实现科技自立自强的国家核心指导思想和“面向国家重大需求”的国家总体定位,面向不同学科,加强高端平台的理论研究、关键技术研究和系统生态建设。
综合以上结果,曹树金教授提出了四点建议:①构建中国特色的情报学学科体系、学术体系、话语体系,在新环境中加强而不是削弱对“情报”的实质性研究。在研究“信息”的同时,深化和扩展对“情报”的研究。②在情报学研究过程中,注意术语使用的严谨性,研究“情报”时尽量不要误用“信息”术语。③研究过程中,如果认为两类术语均可使用时,优先使用“情报”术语。④“信息”是很多学科的研究对象,在情报学研究中必须研究“信息”、使用“信息”术语时,建议尽可能突出情报学的视角、方法和目标。
语料库具有“某方面语料的集合”“一定规模”“以数字形态存在与存储”和“能作为计算机程序的计算与处理对象”四方面的属性。语料库与数据库有一定的区别与联系,具体包括:①语料库存储的是经过标注的某种形态的自然语言文本,而数据库存储的是一定格式的相互关联的各种数据的集合;②数据库只是语料库的一种存储方式,语料库还有数据库以外的其它存储方式;③从数据库角度看,语料库只是数据库的一个子集;④语料库只是知识库的一个子集。
国内语料库研究按研究内容大致可以分为两类:语料库的构建、语料库的应用。构建语料库的研究主要集中于规范语料库的构建流程、语料库构建中的数据标注问题、提升语料库标注质量的办法。而语料库的应用研究贯穿于整个信息的生产、组织、标注、检索、挖掘和展示过程,包括语言教学中的应用、领域词表和词典构建中的应用、信息检索和信息抽取中的应用、语言对比和翻译研究中的应用以及其他领域的应用。国内语料库研究呈现以下两方面的趋势:①研究对象从单一到多元的变化,由最开始的汉语单语语料库向汉英平行语料库、多语种平行语料库、小语种语料库、民族语言语料库以及一些基于领域知识建立的专用语料库发展。②研究技术与内容向条件随机场、词向量、情感词典等方法的应用发展,走向更加深化及细化。
在未来研究方面,新消费信息行为的研究可以聚焦以下三个方面:①以场景平台的差异化及场景拓展、不同平台中用户参与行为作为研究方向的关键场景研究;②以不同新消费主体用户信息行为画像、社群化新消费信息服务作为研究方向的关键人群的研究;③以新技术АΙ/VR/АR中用户体验、“人工智能+新消费”为研究方向的关键技术研究。
新消费发展中关键的人群、关键的场景和关键的技术会赋予学者新的研究机会。在这个过程中需要产学各方共同担负起数字经济发展中情报学科的“新使命”,在科学研究和人才培养中用“新作为”承担时代责任。
围绕“面向国家战略情报学研究”“数智时代的情报学创新发展”“数据分析与文本挖掘”“实体识别与知识图谱构建”“用户信息行为与服务创新”“政府大数据与数据治理”等主题,本次论坛特别邀请情报学领域专家举行了38场主题报告,在四个分论坛同时进行。
专家分论坛一共邀请九位情报学专家作主题报告,分别是天津师范大学王曰芬教授、武汉大学王晓光教授、杭州电子科技大学陈仕吉教授、武汉大学安璐教授、西安电子科技大学赵捧未教授、北京大学化柏林教授、南京农业大学王东波教授、南京农业大学何琳教授、南京大学裴雷教授。报告分四场进行,中国科学技术信息研究所赵筱媛研究员、南京大学叶鹰教授、华中师范大学卢新元教授、中山大学张靖教授分别担任主持人。
3.1.1王曰芬基金项目数据挖掘分析及其启示
学科领域国家科学基金汇聚了国家战略部署、科学技术演化与社会需求,反映了该国在政策制定与资金投入上对于该学科领域的重视程度、支持力度与持续长度的态势,具有鲜明的战略先导性、学术先进性和需求先行性。
情报学研究的本质即从情报视角,透过数据的表征与关联,发现所要研究对象的本来面目或新的变化。如何基于数据驱动思想,根据基金的数据源特性与研究对象的学科领域构建数据与分析的流程架构,是运用情报学工具全面系统地开展基金项目研究的关键。王曰芬教授认为,建立多维度的深度挖掘基金项目数据的框架,可以从科技计划全流程管理的过程中提取出众多有价值的信息,而这一部分数据资源则会在未来产生情报分析的巨大价值。
基金项目数据的深度挖掘研究在我国基金项目部署政策、学科倾斜力度、研究热点方向及项目资助强度调整的过程中,体现出情报学人在科技计划管理中做出的支撑贡献,体现情报学在科研管理工作中的研究价值。
3.1.2王晓光理解数据重用的概念与过程
王晓光教授通过梳理数据重用的概念及过程,探讨了数据重用在提高数据利用效率中发挥的重要作用。他认为,开放数据、用户意愿及疫情环境的背景共同推动了数据重用的发展。数据重用的推进工作可以最大化地实现数据资源的价值、提供大量的学术资源、采用低成本的方式促进创新和学术交流,在诸多方面带来新型价值。通过数据重用,可以提升已有的研究成果、进行荟萃分析、支撑数据基础设施建设、驱动数据共享政策制定。
推动数据重用,首先应确保数据可以被集中发现与访问;其次应对数据存储提供工具支撑,如数据仓储库的建立、关联实体出版物等;再次应增强数据的可读性。此外还可以利用新型的科研工具理解数据,提高数据的利用效率。
3.1.4安璐危机情境下的信息感知与情报分析
安璐教授从危机预警、危机响应、危机预测三个方面论述了危机情境下的信息感知与情报分析,并以疫情为例提出舆情分析与管理的应对方案。她认为,在重大突发疫情之下,我们可以开展面向预警与预案的信息收集与分析,提高应急处置的前瞻性,建立灵敏探测异常信息的快速响应机制,利用信息发送智慧调控公众行为,利用优质的信息来保持公众的健康情绪,实现基于情报分析的智慧应急。
3.1.5赵捧未面向决策支持的科技管理数据深度挖掘与服务
科学数据是国家科技创新的重要战略资源,随着我国科技创新活动的日益繁荣,政府部门、科技创新主体等对科技管理工作的目标和要求越来越高,因此对科技管理数据的深度分析需求日趋强烈。
目前科技管理数据的研究取得了一定进展,但在挖掘深度和内容服务中的研究仍有欠缺。赵教授指出,通过研究科技管理数据的用户需求和服务功能、提出科技管理数据的深度挖掘方法、构建面向决策的科技管理数据服务创新模式等,可以揭示不同类型的科技管理数据中隐藏的潜在规律和趋势、政府部门及各类科技创新主题,宏观把握研究的趋势和主题动态,为制定科技战略规划和辅助决策提供有益的参考。此外,创新服务模式有助于满足政府部门、科研管理机构对科技管理数据的智能、主动、多元化的服务需求,在一定程度上有利于推动科技创新。
3.1.6化柏林文本挖掘在科技情报分析中的应用
科技文本的信息分布类型众多,有着非结构化、篇幅长短不一、专业术语较多、异构数据难以映射的特点。大数据环境下,科技文本数据可以实现识别、跟踪、比较、评价、预测等功能,通过对文本数据进行分词、编码、机器学习、深度学习等操作可以实现如上功能。
3.1.7王东波基于深度学习的古代典籍跨语言自动翻译研究
古籍是国内数字人文研究的重点项目,翻译可以使古籍中包含的一些思想文化知识传播至全世界。然而,中国典籍跨语言研究资源较为匮乏,机器翻译的研究仍处于起步阶段,深度学习的崛起为自然语言处理的任务带来了新的研究突破点。
中国古代典籍跨语言的研究既涉及古文又涉及英文,给研究过程带来了一定障碍。然而,古文是一个有限的集合,在短时期内并不会产生大量的新词,因此,相对于现代汉语来说,古文更适宜做自然语言处理。通过制定古汉语分词与词性规范,引入深度学习模型中的注意力模块和神经网络模块以及迁移学习模型,可以大大改进机器翻译任务。语料规模的扩大、多层次对齐的形态可作为未来的研究重点。
3.1.8何琳古文本智能处理技术实践与应用
古文本智能处理是涉及多学科的一个研究问题,对计算机存储的数字化形式的古文本进行挖掘分析在字词、句法、语义、篇章等方面已取得了一定进展。文本处理技术主要包括基于规则的方法、机器学习的模型、知识工程的构建等,通过构建细粒度的标记语料库,给语言学的研究或自然语言处理技术提供了众多的特征和信息。
目前的文本处理主要面临着命名实体识别、断句、句子对齐等任务。国内外学者针对文本处理任务,主要进行了历史文本的空间化与可视化、典籍文本的知识关联、情感计算、引文分析、文体风格计算等工作。
目前研究聚焦于构建面向典籍内容的本体、构架古文触发动词数据集、抽取古文事件、分析文本主题等实践活动,以后的研究仍需解决深度标注数量较少、古汉语句法分析工具缺失、算法选择困难、研究结果评价标准构建等问题。
3.1.9裴雷集萃数据分析:图书情报服务循证方法与数据分析的融合应用
大规模数据介入的情报研究改变了数据与情报服务的关系,从而也使得情报工作发生了一定改变,主要包括情报内涵、情报对象、情报服务呈现形式的转变。面对此转变,裴教授将“集萃数据”(integrateddata)的概念引入情报学的研究中,即将提取出来的数据再集合后作为一种数据源去分析。在情报处理的过程中需要多元情报的支撑,多元情报的出现提出了集成模型和价值链模型两种新模型。
分析过程建构的基本逻辑为互证与循证。集萃数据分析方法延续了数据分析与循证分析的分析思维,是一种循证理论增强化的表现,也是互证理论的具体实践。此外,从实践方面来讲,数据决策能力及数据智库的建设也可以成为图情领域的研究重点。
专家分论坛二共邀请十位情报学专家作主题报告,他们是南开大学王芳教授、上海交通大学樊博教授、南京大学胡广伟教授、武汉大学吴丹教授、南京理工大学赵宇翔教授、中国人民大学钱明辉教授、武汉大学姜婷婷教授、中国人民大学闫慧教授、上海大学张云中副教授、湘潭大学张艳丰副教授。报告分四场进行,黑龙江大学马海群教授、华中师范大学段尧清教授、北京大学王延飞教授、安徽财经大学魏瑞斌教授分别担任主持人。
3.2.1王芳公共领域的数据治理:理论、方法与技术
数据治理是较为传统的研究领域,从企业组织的角度来看,数据是组织的一项重要资产,数据治理则是有效利用此种资产并提高其价值的过程。数据治理的目标在于提升数据质量、降低数据风险、增加数据价值、支持组织业务等。
3.2.2樊博组织资源对开放政府数据实施的影响研究
我国日益重视开放数据的研究,在多个省市已建立了开放数据平台。但是开放数据目前面临着许多问题,例如在同一地方政府不同政府部门的实施上存在巨大差异等。为了探索不同部门内部资源差异对开放政府数据实施效果的影响,樊教授以资源基础理论作为理论基础展开研究。
资源基础理论包括有形资源、无形资源和人力资源。有形资源包括组织的技术能力和规章制度,无形资源包括组织的认知,人力资源即可调动的人力。技术能力、组织认知、组织安排是开放数据实施的前提和必要条件,会对实施效果产生显著的影响;规章制度和技术能力作为调节项的交互能力较为显著,可以调节一个部门技术能力与开放数据指数之间的关系;技术能力水平也会影响政府部门调整方向。基于该理论创新可以对政府开放数据的利用提出具体实践对策。
3.2.3胡广伟政务大数据要素价值及开发利用
从经济学角度而言,数据属于一种结合的要素;从战略的角度而言,数据是一种高级生产要素,因此数据有超越生产要素的价值,例如可以用于国家博弈、智能制造,并且数据作为一种生产力在生产关系的革命中起到了很大的作用。政务数据价值的开发存在着一种价值链的关系,即基于数据的生命周期创造新的价值,在生命周期的各个环节都有对应的价值创造模式,可以为公开透明、科学决策和创新公共产品与服务提供新的价值。
3.2.4吴丹用户为本:人机交互视域下的人工智能
新时代人工智能技术的应用引发了一些复杂的社会问题,如何提升系统的效率和用户信任之间的平衡性应受到学界重视。吴教授指出,在人工智能的研究过程中应考虑到公平性、可说明性、透明度及道德规范。以机器为主体,人工智能的功能强化降低了透明性,人工智能应用领域的增加提升了系统决策风险;以人为主体,用户对人工智能的信任度、交互体验的要求提高;从人机关系的角度来看,目前更趋向于人机协作。算法的普遍性、隐蔽性、双向性特征要求在算法公平的研究中以用户为中心,重视算法的负面效应,探寻算法歧视问题的源头。而降低算法偏见,则需保证采集数据的代表性、感知用户需求,运用需求挖掘模式、设计调节模式、应用检验模式多方利益视角等将“以用户为中心”的理念贯穿整个算法开发流程。实现以人为本的人工智能,还应开发可解释的人工智能以提升透明度,实现途径包括以框架准则构建为指导、以算法模型设计为基石、以用户需求为桥梁、以可解释性评估为辅助等。
3.2.5赵宇翔信息行为研究中的示能性理论构建
信息行为研究在发展过程中体现出来一些变化,如信息行为更广泛、研究视角更开阔、研究方法的混用、研究情景的复杂化以及理论的多元化等。其中示能性理论在信息行为研究中的构建及应用便是一大体现。
示能性理论的引入可以为人类信息交互行为提供理论基础,缩小信息行为研究和信息实践的鸿沟,重新诠释以用户为中心的理念。在示能性的实践应用中,应重新审视和拓展示能性在信息行为中的研究,探索可解释与可计算的示能性,拓宽示能性行动体,重视示能性理论在神经生理信息行为研究中的应用。
3.2.6钱明辉如何发掘潜在竞争对手线索:基于在线招聘文本分析的发现
竞争对手识别是商业智能战略和实践中非常重要的基础,有助于完善商业决策,如今企业面临着激烈的竞争环境,这给传统的竞争理论与方法提出了新的挑战。
中小企业是整个经济社会发展中的重要力量,相较于大中型企业而言,中小企业面临着更大的竞争风险和竞争压力,更需要识别竞争对手。然而,目前中小企业能够获取的公开数据较少,且获取动态信息的难度较大,在线招聘平台所提供的文本数据可以帮助中小企业动态地识别其竞争对手。
通过文本挖掘技术、文本相似度计算、竞争力计算模型、聚类分析等技术对在线招聘数据进行分析,可以计算招聘信息的吸引力和招聘信息的相似度,从而构建起企业相对竞争力的分析模型,以识别企业的潜在竞争对手,为进一步丰富和发展经营情况分析方法提供一定思路。
3.2.7姜婷婷痕迹数据分析:信息行为的非介入性研究
信息搜寻行为中常采用介入性的方法进行调研,此种方法存在着观察者效应和观察者偏见的固有问题,导致被研究的现象受到了研究本身的干扰,影响到研究内部的效度。而利用痕迹数据去开展研究,可以很有效地弱化观察者效应和观察者偏见问题。
痕迹数据是人们在现实世界中自然地从事各种活动时产生的数据,与研究并没有直接的关系。用户在与网络交互的过程中可以产生点击流数据,即痕迹数据中的积累性痕迹。通过对点击流数据进行采集、处理和分析,以揭示用户的需求是否得到满足,从而确定网络媒体运营策略的短板,使用户需求得到满足。此外,通过采用非介入性的点击流数据进行定量和定性的结合研究,也有助于发现和解决问题,确定方法的适用性。
3.2.8闫慧助人与人助:数字化进程中的社会支持研究
数字化进程不只是信息技术革命和资本驱动的个体行为,更是社群的集体自助与互助行动。社群节点间的求助与施助,可能是解决数字化社会最后一公里的有效途径。
闫慧教授梳理和介绍了数字贫困背景下数字化进程中的社会支持研究,运用田野调查和行为实验相结合的方法对五大类研究对象进行了调查研究。人与人之间的关系可以分为弱关系(外部的社会资本)和强关系(内部的社会资本)两种,研究发现,对于数字化程度较低的人群来说,内部社会资本的价值更大,外部社会资本需要转换为内部资本才具有更大的价值。在数字化进程改变的研究中发现,内部社会资本更容易改变物质、素养、心理与努力维度的数字化程度,外部社会资本转化为内部社会资本才能形成持续稳定的施助和求助关系。
3.2.9张云中知识图谱的红色历史人物知识问答服务框架
红色文化资源内涵的充分挖掘在近几年的指导文件中受到重视,本体、关联数据、知识图谱等技术的发展也为红色档案资源中知识关联的重现和挖掘奠定基础。
历史人物的知识组织及知识服务的研究多集中于资料库的建设、数据库的拓展与演变、知识服务的提供三个层次。知识图谱的问答服务研究多以结构化数据居多,从多元数据融合视角上构建图谱的尝试较少,此外,知识图谱的设计、用户需求与图谱内容匹配也是知识图谱满足用户需求的关键。
张云中副教授以上海大学丰富的红色档案这一半结构化数据为基础,通过设计整体模型建构知识图谱,并以知识图谱为基础提供相应的知识问答服务,采用体验式的设计法设计知识库,运用模糊匹配和神经网络模型进行需求识别和知识推理,实现了较高的问答准确率。
3.2.10张艳丰社交媒体倦怠:要素、机理、画像
大数据时代的到来带来了社交媒体在全球范围内的爆发式增长,然而近年来人们正在减少对于社交媒体工具的使用,越来越多的用户开始经历由社交媒体沉迷到消极倦怠的行为转变过程,国内外主流媒体都出现了资深用户逃离的现象。
社交媒体倦怠与SSO模型具有较好的匹配关系。通过选取文献中提出的压力因素,运用问卷调查、结构方程模型等方法发现内生激励、外生激励在社会媒体倦怠过程中起到了相反的作用。错失焦虑可能通过强迫性社交媒体使用间接影响社交媒体倦怠意愿。高激励和低激励因素对社交媒体倦怠意愿与行为的调节作用差异与社交媒体倦怠意愿的强弱有关。此外,研究团队基于用户倦怠机理和新生态理论构建机理图,形成完整关联路径模型。通过对用户画像的类型划分发现不同用户类型具有不同的行为特征。
专家分论坛三共邀请九位情报学专家作主题报告,分别是中国人民大学周晓英教授、南京大学杨建林教授、北京大学申静教授、中国科学院大学韩涛研究员、中山大学韦景竹教授、武汉大学陆泉教授、合肥工业大学顾东晓教授、中南财经政法大学余传明教授和北京理工大学汪雪锋教授。会议分为四场进行,郑州大学臧国全教授、南京大学邓三鸿教授、华中师范大学曹高辉教授和湘潭大学龚蛟腾教授分别担任主持人。
3.3.1周晓英我们如何定义情报学
3.3.2杨建林“数智”背景下的情报思维及情报学教育
3.3.3申静基于系统动力学的智库知识服务发展机制研究
建设中国特色新型智库是党中央立足党和国家事业全局作出的重要部署。中国智库目前存在的问题是机构数量多,但影响力较小,综合实力较弱,知识服务质量和研究水平较低。探究智库的知识服务发展机制,可提高智库的知识服务质量和研究水平,从而推动智库知识服务可持续健康发展。
申静教授基于系统动力学构建了智库知识服务发展机制理论模型,并对模型进行了应用分析。该研究为智库知识服务发展的动因、模式、创新和趋势提供了理论参考,有助于指导智库知识服务发展机制建设,推动智库知识服务的可持续健康发展。
3.3.4韩涛科研智能化趋势下的科学知识自动发现研究前沿
近年来,人工智能技术日渐成熟,在科学研究中不断得到应用,极大提升了科研效率,破解了一些具有挑战性的科学问题,引发了科研模式变革。从自然科学到社会科学,从理论研究到应用研究,智能科研涌现了不少典型案例。
韩涛研究员对来自于生物学科、化学学科、物理学科和材料学科的12个典型案例进行解析,提出“科研智能化”的研究范式,并介绍了国内外知识自动发现的研究前沿。我国近年来在“利用АΙ技术加速科研发现”也有布局,但相对于国外,我国起步稍晚,布局不够系统。科学知识发现的突破,除了技术进步,还由科研范式变革和知识环境变化所推动。我们要面对技术迅速发展和环境迅速变化的挑战,未雨绸缪,开放地面对未来,勇敢地引领未来,保持科技创新持续发展的生命力和竞争力。
3.3.5韦景竹知识产权驱动创新发展的作用机制
知识产权为创新活动的技术扩散、资源流动、决策优化提供支撑,最终支持创新活动螺旋式上升。韦景竹教授运用扎根理论的方法对粤港澳大湾区知识产权政策文本进行深入挖掘,聚焦知识产权制度对创新的具体作用路径和作用机理问题。该研究构建了知识产权驱动创新发展模型,指明知识产权驱动创新发展的作用主要源于知识产权知识属性和权利属性的价值实现。知识产权政策制定和优化过程中应兼顾知识产权多重价值实现机制,从创新环境搭建、创新要素集聚、创新主体培育、创新动力激励、创新转换升级等多个角度切入,发挥知识产权对创新的积极作用,为落实知识产权驱动创新发展战略提供政策支持和制度保障。
3.3.6陆泉情报学视角下的数智赋能医疗健康
参与数智赋能医疗健康的专业行业众多,情报学应以“耳目、尖兵、参谋”为根本立足点,将信息收集、决策支持及方案策划作为根本抓手,围绕国家战略驱动视角展开研究,使智能技术研发、智慧数据建设及赋能管理服务相互融合,互相促进,协同发展。
情报学视角下开展数智赋能医疗健康要深入结合业务场景(健康管理、公共卫生、医疗服务、医科建设等),智慧数据在医疗健康领域呈现多源异构特征,目前医疗健康医学的理论体系、话语体系、术语体系还不完善。研究团队在智能技术方面进行了中文图书目次自动解析、药物相互作用预测等研究;赋能服务应用方面提供自动问答客服机器人、颅脑肿瘤大数据知识服务等。
3.3.7顾东晓医疗健康大数据驱动的知识发现与服务系统
我国目前优质医疗资源总量不足且分布不平衡,基层医疗服务水平不高,优质资源难以下沉,分级诊疗制度难以落地,亟待解决日益增长的优质医疗资源需求与医疗资源总量不足、分布不均之间的矛盾。学界已有研究成果为医疗健康知识服务模式创新奠定了坚实的基础,但在跨组织医疗健康数据资源开发利用、案例知识组织与动态更新、知识发现与推荐方案的情景约束等方面还存在许多研究空白,限制了医疗健康知识服务的准确性和能力。顾东晓教授研究团队按照“多源数据治理-知识深度聚合-动态知识挖掘-智能主动推荐”的总体思路,研究医疗健康大数据治理与融合、动态知识发现、主动知识服务方法,提出医疗健康大数据驱动的知识服务模式,以期推动医疗健康管理变革和分级诊疗政策落地。
3.3.8余传明大数据驱动的知识表示与融合模型
知识组织在大数据背景下面临从结构化到非结构化、数据多源化的挑战。数据的类型和结构更加复杂,对自然语言处理、文本分析等提出了更高的要求。该研究采用对比研究法、实证分析法、数据挖掘与机器学习及自然语言处理技术,基于词汇视角、知识图谱视角、知识网络视角和领域主题视角构建了知识表示与知识融合模型。
知识表示与融合能够有效提升各种知识驱动的应用效果。然而,各种知识表示与融合模型的效果存在较大差异,研究者有必要依据研究目的及研究条件,进行最优选择。如何基于大规模的非结构化数据自动构建知识图谱,使其具有较强的可拓展性,并付之于面向科技决策、科技安全和科技创新的科技服务实践还有待进一步研究。
3.3.9汪雪锋基于SАO语义分析的潜在研发方向识别:以癌症治疗领域为例
如何从海量数据中快速提取和挖掘有价值的信息,并进一步支撑技术创新工作的实际开展为技术创新管理研究带来新的挑战。该研究聚焦癌症治疗领域,从技术创新管理视角提出了基于SАO语义分析的潜在研发方向识别模型,通过采用文本挖掘技术与关联规则挖掘算法揭示技术之间的关联关系,从而判断企业未来研发方向。
汪雪锋教授的研究运用概念层级实体来表征技术,使其更加细化又兼具系统性,且考虑了概念实体间语义关系,可有效避免无意义结果的干扰;通过关联规则挖掘算法能够揭示技术之间的隐藏规律,方法通用性较强;通过构建技术增长性、技术适用性(技术自身水平)、企业自身技术布局(企业技术基础)三个指标从定量层面对识别出的研发方向进行评估,一定程度上可避免人为主观性。
专家分论坛四共邀请十位情报学专家作主题报告,分别是武汉大学吴江教授、四川大学李桂华教授、吉林大学李贺教授、天津师范大学刘冰教授、南京理工大学吴鹏教授、武汉大学周力虹教授、华中师范大学易明教授、大连理工大学王贤文教授、东北师范大学滕广青教授和南京大学康乐乐教授。报告分四场进行,黑龙江大学黄丽霞教授、华中师范大学熊回香教授、东北师范大学魏来教授、河北大学金胜勇教授分别担任主持人。
3.4.1吴江仿真模拟在情报学研究中的应用
仿真模拟是复杂性科学应用的主要方法,即通过构建有生命的个体,在人工社会中做复杂性研究。吴江教授以谢林隔离模型、社会仿真模拟研究、数字孪生世界和元宇宙为例,解释仿真模拟构建人工社会对理解复杂适应系统起到的作用。
在图情领域,仿真模拟可以用来解决社会中的建模问题、实验问题、决策问题和计算问题,与图情学科有很多契合点,但在学科应用中也存在一些关键难点。在大数据时代,情报分析、图书馆研究呈现计算化、系统化的发展趋势,将仿真模拟方法引入图情学科研究中,能够满足大数据驱动情景下图情学科研究范式的转变,会对未来图情学科的研究产生极大的启发。
3.4.2李桂华面向智慧社会的情报学价值建构
3.4.3李贺应对理论视角下互联网用户信息披露行为研究
3.4.4刘冰基于信息聚合和知识发现的重大突发公共卫生事件风险研判与决策协同机制研究
“人类社会与危机共存”已是国际社会达成的普遍共识。人类重大公共卫生事件的频发暴露了在风险防控与应对中的短板;高效协同的研判与决策机制是重大突发公共卫生事件风险防控体系的核心,是全面化解重大风险的基础。
基于以上背景,刘冰教授的研究主要从重大突发公共卫生事件风险研判与决策基本框架、面向风险研判与决策的信息聚合机制与知识发现系统模型、重大突发公共卫生事件风险研判与决策协同模型三方面展开。在重大突发公共卫生事件风险研判与决策的过程中,信息聚合和知识发现发挥了桥梁、动力、驱动、牵引和协同的作用;研究实现了动态发展演进中风险研判与决策机制的动态性和柔性,也实现了由行政驱动、制度驱动、经验驱动向信息驱动、知识驱动的转变。
3.4.5吴鹏基于多模态联合注意力机制的网民情感分析研究
当研究问题或数据集包括多种情境时,其特征为多模态。多模态数据是不同单一模态的组合,多模态机器学习是未来人工智能的发展方向;其难点在于如何有效进行模态内交互建模以及如何有效捕获模态间的交互。
文本和图片是相互抑制的,但在内部特征中是相互关联的,如何捕获这种交互关系是多模态情感分析的关键。现有的研究忽略了不同模态之间的交互关系,因此,针对当前网民情感分析的不足,吴教授提出构建一种基于多模态联合注意力的网民情感分析模型:通过联合词引导的注意力机制和图引导的注意力机制来动态捕捉不同模态间的关联关系,并生成预测的情感标签。研究团队未来将对该模型进行测试以验证模型性能;同时,如何更好地捕捉不同模态间的关联和交互也将是未来研究的重点。
3.4.6周力虹图书情报学研究中的定性视角
根据本体论、认知论和研究途径三个基本的逻辑与原则可以判断出定性研究方法或定量研究方法的选择方式:如果采用客观主义本体论、实证主义认知论、演绎途径为研究途径,倾向于采用定量研究方法;如果采用构成主义本体论、阐释主义认知论、归纳途径为研究途径,则倾向于采用定性研究方法。
在选择研究方法时,应根据研究问题和现状来选择研究方法,而不应从研究方法本身判断优劣;本体论、认知论及研究途径是选择研究方法的主要依据;定性研究方法尤其适合理论探索,可解释社会现象、行为和思想变化,也适用于解答以探索为目的的研究问题,并可以与定量研究方法搭配使用。
具体地,以双重加工过程模型——启发-系统式模型为理论基础,提出了有关启发式信息线索和系统式信息线索对初始有用性投票(ΙH)和累积有用性投票(CH)两个阶段投票结果的影响机制的假设,实证分析结果表明:上述两阶段模型确实存在;对于聚合过程的ΙH阶段,启发式信息线索更具影响力,几乎不需要系统式信息线索的辅助;而系统式信息线索更能影响CH阶段,且系统式信息线索在CH阶段的影响力受到启发式信息线索的辅助。
3.4.8王贤文科学计量学的挑战与机遇
科学计量学始于科学学,贝尔纳《科学的社会功能》成为科学学的奠基之作;普赖斯沿着贝尔纳开创的科学学范式,用“科学的方法研究科学自身”,促使了科学计量学的诞生。目前,从期刊收录情况上可看出,科学计量学已在全世界范围内产生影响。
科学计量学面临的挑战与机遇并存。虽然面临许多挑战,如:数据问题多、方法突破少、经典理论在数字化时代或网络时代是否适用等,但数据对象的广度与深度、数据处理能力的加强、数据分析和挖掘技术的应用以及多学科与其融合发展都是科学计量学目前的机遇。科学计量学正迎来蓬勃发展的时代,多学科交叉融合也使得科学计量学更有前景,我们应该把握机遇,迎接挑战,打造更广阔的前景。
3.4.9滕广青科研内卷化还要不要十年磨一剑
滕广青教授将科研人员研究主题转换特征分为不同学科和不同阶段两个维度,前者包括自然、社会、人文与艺术三类学科,后者包括高峰期前、高峰期后。在WebofScience核心库分别选择了真菌学、图书情报学和哲学来代表自然、社会、人文与艺术学科,并进行主题建模与测度以及界定职业高峰。研究发现,主题迁移跨度中,真菌学最大,其次是图书情报学,最后是哲学;在经历了职业高峰期之后,研究主题转换更频繁的科研人员更多。进一步地,研究团队在科研人员研究主题转换特征中增加了一个维度:不同层次,包括人员总体与精英学者。研究发现,在经历职业高峰之后科研人员总体的主题转换比精英学者更频繁;精英学者在经历了职业高峰之后其研究主题会更加专一。
3.4.10康乐乐基于更新文本的移动应用创新模式研究
本次中国情报学年会&情报学与情报工作发展论坛暨情报学博士生学术论坛共收到论文和案例投稿389篇,评选出年会优秀论文89篇,博士生学术论坛获奖论文48篇,优秀案例15篇,142篇论文被22部学术期刊选中拟录用。