科技文献问答式智能检索总体设计与关键技术
探析
陈博立鲜国建赵瑞雪黄永文李娇曹雨晴孙坦
摘要科技文献是人类记录、学习、传承知识的重要手段。大数据时代,传统的基于字符匹配的关键词检索方
式无法承载用户检索需求中丰富的语义信息,也无法满足高效、精准、智能检索海量科技文献的要求。本文分析
科技文献问答式智能检索的场景需求,提出设计问答式智能检索应当遵循通用性、模块化、可移植三项基本原则,
设计总体技术方案,包括掌握问答语言特征、构建知识图谱、研究问答式智能检索交互技术三大步骤。在此基础
上,从科技文献知识图谱构建、检索意图理解与识别、检索意图形式化转换、人机自然语言对话管理、检索结果呈
现与交互等方面论述实现科技文献问答式智能检索需要重点突破的关键技术,并提出可行的技术选代方案。本
文提出的科技文献问答式智能检索,结合了科技文献知识图谱和自然语言处理等人工智能技术,更加智能精准地
互、智能检索效率等方面具有优势。图6。表2。参考文献37。
关键词科技文献检索智能问答知识图谱语义检索任务型对话
分类号G254.9
OverallDesignandKeyTechnologyofQAStyleIntelligentRe-
trievalforScientificandTechnicalLiterature
CHENBoli,XIANGuojian,ZHAORuixue,HUANGYongwen,LIJiao,CAOYuqing
SUNTan
ABSTRACT
Scientificandtechnicalliteratureisthemostimportantmeansforhumanbeingstorecord,learnandinherit
knowledge.Intheeraofbigdata,thetraditionalkeywordsearchmethodbasedonstringmatchingcannot
carrytherichsemanticinformationinuserscomplexsearchrequirements,whichleadstochallengesin
achievingefficientandaccuratetrackinganddiscoveryfrommassivescientificandtechnicalliterature.
Therefore,basedontheresearchprogressofscientificandtechnicalliteratureretrievalservicesand
naturallanguageQA,thispaperputsforwardtheconceptofQAstyleintelligentretrievalfor
scientificandtechnicalliterature.Firstly,weanalyzetheusersdemandofQAstyleintelligent
retrievalscenesforscientificandtechnicalliterature,includingliterature,author,fund,subject,
institution,journal,time,etc.Anditisproposedthatgenerality,modularity,andportabilityarethe
threebasicprinciplestobefollowedinthedesignofQAintelligentretrieval.Then,wegiveathree-
steptechnicalsolutionformasteringthelanguagecharacteristicsofquestionandanswering,designing