第四章检索式编制

第四章检索式编制【知识框架】什么是检索式?指搜索引擎理解和运算的查词串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。

主要逻辑算符布尔逻辑算符:与或非优先算符邻接算符字段算符截词算符加权算符词组或短语如何构建合理的检索式?常用检索方法与策略【补充教材2.4-4章】【主要内容】1、检索式和运算符检索式:用运算符将检索词连接起来构成的能让计算机识别的式子。

运算符:又称逻辑算符,是表达检索词之间逻辑关系和限制关系的运算符号,它是复合检索式中必不可缺的构件。

2、布尔逻辑算符1)逻辑“与”逻辑“与”可用“AND”或“*”表示,检索词用“AND”或“*”相连,含义是检出的记录中同时含有所有检索词。

逻辑“与”运算符的基本作用是对检索词加以限定,逐步缩小检索范围,减少命中文献量,提高检索结果的查准率,适用于不同概念组面之间以及同一组面内不同含义的词之间的组配。

2)逻辑“或”逻辑“或”可用“OR”或“+”表示,检索词用“OR”或“+”相连,含义是检出的记录中,至少含有检索词中的一个。

逻辑“或”算符的基本作用是扩大检索范围,增加命中文献量,防止漏检,提高检索结果的查全率。

适用于同义词或同族概念的组配,如同义词、近义词等。

3)逻辑“非”逻辑“非”可用“NOT”或“-”表示,检索词用“NOT”或“-”相连,表示排除“NOT”或“-”算符后的词语,检出含有算符前检索词的所有记录。

逻辑“非”算符的基本作用是缩小检索范围,减少文献输出量的作用,但不一定能提高文献命中的准确率。

同时应注意在有两个以上运算符的复杂逻辑式中,“NOT”出现次数不能太多,否则检出结果极少,影响检出效果。

使用布尔检索需要注意问题:(1)布尔检索执行顺序:布尔检索运算执行顺序通常是NOT、AND、OR。

有括号时,先执行括号内的逻辑运算。

有多层括号时,先执行最内层括号中的运算。

(2)绝大部分网络信息检索工具都支持布尔检索功能,但不同的检索工具之间有差别。

编制检索式的基本方法黄筱玲检索式的定义百度百科定义:指搜索引擎理解和运算的查词串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。

关键词是检索式的主体,逻辑运算符和搜索指令根据具体的查询要求从不同的角度对关键词进行搜索限定。

逻辑运算符是表达检索词之间逻辑关系和限制关系的运算符号,它是复合检索式中必不可少的构件。

如何制定检索式1.检索词的选择2.运算符的类型3.编制检索式1.检索词的选择检索词定义和类型:表达信息需求和检索课题内容的基本单元,也是与系统中有关数据库进行匹配运算的基本单元,检索词选择洽当与否,直接影响检索效果。

常用的检索词包括:表示主题的检索词主题词关键词标题词叙词表示作者的检索词表示分类的检索词和表示特殊意义的检索词ISBN、ISSN、引文标引词等.关键词与主题词◆关键词即是“自由词”,是信息的提供者各自采用的不经过一定规范化限定的词。

检索操作方便,但其专指度差,常需用较高的逻辑匹配、截词符等技能。

◆主题词即指以自然语言中优选出的,经过规范化处理后的名词术语。

检索操作一般需将习惯使用的自然语言与各数据库自编的主题词表对照后方能使用,但专指度较高。

检索词的选择技巧1.勿忘检索词的全称、简称、俗称与英文缩写项目名称:乙型病毒性肝炎的中医药研究篇名乙型病毒性肝炎中医药中药乙型病毒性肝炎的同义词:乙型肝炎乙肝HB篇名乙型病毒性肝炎乙型肝炎乙肝HB中医药中药项目名称:耐高温粘接剂的研究篇名高温粘接剂粘接剂的同义词:胶粘剂、粘固剂、粘合剂、胶结剂、粘结剂、粘胶剂、粘接剂、粘着剂、黏合剂、胶合剂篇名高温粘接剂胶粘剂粘固剂粘合剂胶结剂粘结剂粘胶剂粘接剂粘着剂黏合剂胶合剂初级检索高级检索搜索同义词方法(1)利用数据库的同义词选择功能(2)利用搜索引擎寻找同义词(3)从数据库检索结果中寻找同义词(4)利用自己的专业知识(5)利用自己平时积累的知识2.注意检索词的上下位类扩展项目名称:电阻焊在汽车生产中的应用篇名电阻焊汽车生产电阻焊F点焊缝焊凸焊对焊篇名电阻焊点焊缝焊凸焊对焊汽车机动车客车轿车生产项目名称:苯胺的烷基化反应催化剂研究文摘苯胺烷基化催化剂烷基化——AlkylationF甲基化Methylation乙基化Ethylation文摘苯胺烷基化甲基化乙基化催化剂●课题(1)“加氢裂化防污垢的开发与应用研究”,将“加氢裂化”与“防污垢”组配,结果不理想。

第一,不同的检索工具表示布尔逻辑关系时使用的符号不同,有的用“&”、“︳”和“!”分别表示布尔关系的AND、OR和NOT,有的用+、-分别表示布尔关系的AND、OR,有的则用表格、文字、空格或菜单来体现不同的布尔关系。

使用的时候要注意使用帮助系统了解代表某种逻辑关系的符号。

第二,有的检索工具检索词之间默认关系为AND,有的检索工具检索词之间默认关系为OR。

第三,支持布尔逻辑的程度不同,有的完全支持三种运算,如Infoseek;有的仅在高级检索中完全支持,而简单检索中则部分支持,如Lycos;而Yahoo则不支持布尔关系NOT。

3、优先处理算符优先处理算符用“()”表示,含义是优先对()内的算符进行逻辑运算,在实际检索中,有时要调整逻辑运算符的运算顺序,使某些算符优先进行逻辑匹配,或者是简化逻辑算式,在这些情况下,将使用算符“()”。

4、邻接算符邻接算符又称词位置逻辑检索符、全文查找逻辑算符,相邻度检索算符,原文检索符。

在检索中,会遇到如下一些情况:某个概念需用词组形式表达;两个或两个以上的词要紧密相邻;在这些情况下,需要用邻接算符限定检索词之间的间隔距离或是词语出现的顺序。

1)(W)W的含义是“With”,其用法为A(W)B,表示(W)前后所连接的A、B两个检索词在检出结果中必须紧密相邻,且词序不能颠倒。

2)(nW)W的含义是“Word”,n代表单词个数,用法为A(nW)B,表示A、B两词之间允许插入最多为n个的其他词语,插入词可以是实词或系统禁用词,同时A、B两词的前后顺序保持不变。

3)(N)N的含义是“Near”,用法为A(N)B,表示在检出结果中A、B两词必须紧密相邻,并允许词序发生颠倒。

4)(nN)N的含义仍是“Near”,用法为A(nN)B,表示A、B两词之间允许插入最多为n个的其他词语,插入词可以是实词或系统禁用词,两词的前后顺序可以颠倒。

5、(X),这是无间隔有序检索符。

检索式为A(X)B,表示这个算符两边的检索词必须完全一致,并以指定的顺序相邻,中间不允许插入任何单词或字母。

6、(nX),这是有间隔有序检索符。

检索式为A(nX)B,表示两个检索词之间最多可以插入n个单元词,两边的检索词必须完全一致。

5、字段限制在联机数据库或光盘数据库检索系统中,都提供字段限制的检索功能,其作用是检索范围限定在某一字段内如题目、作者等。

以DIALOG检索系统,基本字段限制为四个:题目(TI)、叙词(DE)、标引词(ID)、文摘(AB)。

例8:检索式COMPUTER/TI表示在题目中查找含有COMPUTER一词的文献。

除了基本字段以外,检索系统中的其它字段都可称为辅助字段,其表达方式与基本字段有所不同,它是在检索词前面加上字段代码和运算符“=”,例9:检索式CS=BEIJINGUNIBERSITY表示检索著者单位为北京大学的所有文献。

网络检索的字段限制字段“site:”表示检索应该在一定的站点上进行,“url:”表示检索词应该是网址的一部分,“title:”表示检索词应在网页标题中出现,“alt:”表示检索词应在图像替代文字中。

在搜索引擎Google的检索框键入link:可以得到所有链接到Google主页的网页。

6、截词算法截词检索是利用检索词的词干或不完整的词形查找信息的一种检索方法。

用户可以在检索式中用截词符号(如“*”、“?”或“$”等等)表示检索词的某一部分允许有一定的词形变化,而不必输入完整的检索词。

检索时,检索工具将用户输入的检索式到数据库中进行查找,凡是与检索式相匹配的字符,不论其后或其前是什么字符都属命中内容。

截词检索可以降低输入次数,简化检索程序,扩大检索范围,提高查全率。

一般情况下,“?”代表一个字符,而“﹡”表示通配所有字符。

1)按截断的字符数量划分截词检索可以分为有限截词和无限截词。

有限截词,又称有限截断,指对词干以外可以出现的字母数量进行限定。

如:studen,截词符“”表示检索含有studen和studen后只跟有两个字母的检索词的文献。

无限截词,又称无限截断,指对词干前后出现的字母数量不作限定,一切与输入的词干相匹配的字符串,不论词干后或词干前是什么字符串、有多少字符串都属于要检索的信息。

2)按截断的位置划分截词检索可以分为前截词、后截词、前后截词和中间截词。

前截词,又称左截词,前截断允许检索词的前端有一定形式的变化。

检索时将截词符放在一个字符串的左方,表示其右的有限或无限个字符不影响该字符串的检索。

这实际上是一种后方一致的检索,对汉语中的复合词组的检索非常方便。

后截词,又称右截词,后截断允许检索词的尾部有若干形式的变化。

检索时将截词符号放在一个字符串的右方,凡是有截词符左方所有字符串的文献都符合检索要求。

这实际上是一种前方一致的检索。

目前大多数网络检索工具都支持截词检索,但与联机和光盘数据库检索系统的截词功能相比仍存在一定距离,数据库支持全部截词功能,而在网络检索工具中,较多支持右截词,部分支持中间截词,左截词较少。

7、词组或短语检索词组或短语检索是一般数据库中最常用的方法。

在网络信息检索工具中,如在检索框中输入两个或两个以上的检索词,这两个检索词之间又不加任何符号,那么检索工具会将这两个检索词之间的关系设为默认值(有的默认值为AND,有的默认值为OR)。

如要将这两个或多个检索词作为一个词组或短语进行检索,中间不允许插入任何字符,就必须使用一定的符号来表明这是词组或短语,最常用的符号是双引号“”或括号()。

8、加权检索加权检索的基本方法是:在每个检索词后面给定一个数值,表示其重要性程度,这个数值称为权值。

通过加权明确了各检索词的重要程度,使检索更有针对性,并且能依据权值的大小,对命中记录的重要性进行排序。

检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值之和。

只有当数据库记录的权值之和达到或超过预先给定的阈值时,该记录才算命中。

最先支持加权检索的网络信息检索工具是Excite,它用符号“∧”表示给某个检索词指定了权值。

现在大多数网络信息检索工具采用“+”、“-”来表示检索词在检索提问中的分量。

9、构造检索提问式在检索中,有两个最为关键的步骤,一是概括检索提问,选择精确的检索词;二是正确构造检索提问式,达到检出目的。

(一)灵活运用各种运算符号要考虑检索提问中的关键词是否有同义词、近义词,以及词形的各种变化,灵活运用各种运算符号,如逻辑“或”算符、截词符号、邻接算符等,扩大词语的检索范围,降低漏检的可能性,提高检出效果。

(二)准确构造检索式构造步骤:1、分析检索词之间的逻辑关系,形成“子逻辑式”2、根据检索提问中涉及的主要主题概念,构造检索提问式3、尽量选专指词、特定概念或专业术语作关键词,避免普通词和太泛指的词语。

4、用双引号提高查找精度。

5、用截词符扩检。

对于英语,有不同的单复数形式和时态变换,可使用截词符号扩大检索范围,但有些搜索引擎不支持该功能,如Google。

6、使用邻接算符可以提高检索的准确性和灵活性,例如,Lycos用adj、near、far或before来限定词与词之间的关系7、利用符号“+”、“-”。

2、引擎一般提供简单检索和高级检索,在高级检索中,大多数都支持布尔逻辑检索。

准确使用布尔逻辑检索可提高信息检索效果。

一般同义词或近义词之间用“OR”连接,可避免漏检;当信息需求包含几个不同组面的概念时,一般用“AND”连接,可精确查出所需内容;当不需要检出某些关键词时,用“NOT”。

3、许多搜索引擎还提供了限定字段、限定网页深度(即网页层次)、限定日期、限定地区或域名等限定检索的功能,这些检索功能可以缩小检索范围,减少无关信息的输出,提高检索精确度。

(四)修改检索策略要想达到搜索目的,正确的方法是从第一次搜索结果中不断进行修正,可以尝试着使用其它含义相近的关键词,或者在原关键词前添加各种符号如“+”、“-”,修改检索式(即布尔逻辑式)等等,还可以换其它搜索引擎再进行搜索,这样重复多次以后,就能搜索到满意的结果。

补充:教材第二章信息检索的基本知识1.常用检索方法广度优先法:从提供信息总目的网页开始浏览,沿着专题链接层层查找。

THE END
1.2025年中国数字图书馆市场调研:政策产业链现状与前景数字图书馆是数字化技术处理与存储图文并茂文献的图书馆形式,实质为多媒体制作的分布式信息系统,它跨越区域限制,实现信息资源的网络查询与传播。相较于传统图书馆,数字图书馆以其虚拟性、无围墙性、可扩展性、超大规模、分布式、易用性、无时空限制及跨库无缝链接与智能检索等优势,成为现代知识传播的重要平台。 https://www.168report.com/news/7856/digital-library
2.图书馆数字资源试用指南中文会议论文库、中文学位论文库、中文专利论文库、个人对比(自建库)、互联网库等庞大的主流的元数据,且更新及时,从毕业论文和期刊论文两种类型的写作流程进行充分的场景研究,从论文选题到查重交稿和与老师的互动,构建了一个完整的论文写作环节,以数据加服务的形式,同时链接图书馆https://mp.weixin.qq.com/s?__biz=MzU0MzU0MTU0Nw==&mid=2247514916&idx=1&sn=d358032f9508812ffac3301fa96bf4a5&chksm=fb0b2b60cc7ca276f8d8a4482770b360087341ce117fad509468998045b610005ceec021485d&scene=27
3.RFID智能档案管理系统——图书馆智慧升级的得力助手读者古籍随着信息技术的飞速发展,图书馆的管理模式也在不断变革,RFID 智能档案管理系统成为图书馆智慧升级的关键因素之一。 在一所综合性大学图书馆中,馆藏丰富,涵盖了各类学术书籍、期刊杂志、学位论文以及珍贵的古籍文献等。以往,图书馆采用传统的条形码管理方式,读者借阅和归还图书时,工作人员需要手动扫描条形码,效率较低,尤其https://www.163.com/dy/article/JJ7LPLOK053869PA.html
4.智研咨询发布《中国数字图书馆行业市场分析及投资前景研究报告》在当下高度信息化的社会背景下,精准的数据分析与深入的行业研究已成为企业战略规划、市场拓展以及投资决策不可或缺的指南针。智研咨询研究团队经过长期的市场调研与数据分析,重磅推出《2025-2031年中国数字图书馆行业市场竞争态势及发展趋向研判报告》,以期为业界提供一份高质量、专业化的行业分析。本研究报告基于智研https://baijiahao.baidu.com/s?id=1818108309360482607&wfr=spider&for=pc
5.信息组织数字图书馆信息组织skos数字对象的信息结构决定着进一步的信息组织、处理和利用方式。 1.2 数字图书馆的中观结构一一分布式资源库组织结构 ■资源库 是多种资源的集合体,是一种资源与另一种资源 发生关联的组织。 ■资源库组织主要关注以下关系: 元数据与数字对象的关系; https://blog.csdn.net/YuvalNoah/article/details/105986885
6.Scribd是什么如何使用这个数字图书馆六、优缺点分析 优点: 缺点: 七、常见问题Q&A Scribd作为一个数字图书馆,近年来受到了越来越多用户的关注。其主要功能和特点包括:1. 提供丰富的电子书籍、杂志和有声书;2. 支持多种设备访问,方便用户随时随地阅读;3. 采用订阅制,让用户以较低的成本获取大量内容;4. 提供个性化推荐,帮助用户发现新书。本文将详细https://www.jingsailian.com/meiguo/975612.html
7.开源软件在数字图书馆中的应用探讨由于各种与数字图书馆相关的开源软件各有优缺点, 因此在一些数字图书馆的构建中采用了把多种开源软件结合起来使用的方法。通过各种兼容的组件形成一个个彼此有关联的模块可以实现很多个性化的服务。图书馆按比例出资组建一个基金, 并形成开源社区, 共同维护开源软件在数字图书馆中的应用开发, 如条件允许可形成产品出售给https://www.360wenmi.com/f/jnvaz1964vim.html
8.数字图书馆但无论是保守派或急进派,都似乎并未对儒家或儒学的根基、内容和形式真正做出多少深刻的研究,并没有客观地分析它的各个主要方面、特征、优缺点及其可能的前途;也就是说,对民族传统缺乏真正的自我意识的反思。”①反思的维度当然重要,但如果仅仅停留于文化反思的立场而不能真正领会保守的意义,就是说,反思不以保守为https://www.enaea.edu.cn/sztsg/wenhuakejisuyang/zx/118369.html
9.传统图书馆与电子图书馆各有什么优缺点2、图书馆的开放和利用受限制。3、信息传递慢。4、资源共享困难电子图书馆的优点:1、电子图书馆的资源丰富、文献信息密度大、体积小2、电子图书馆的利用不受时空限制3、电子图书馆信息传递速度快4、资源共享性好5、资源利用率高电子图书馆的缺点:1、文献信息受知识产权的保护限制。2、数字图书馆的利用受一定条件https://www.ximalaya.com/ask/q2638775
10.虚拟数字图书馆10篇(全文)根据主机、存储设备和存储网络所处的位置, 虚拟存储可以分为三个层次:基于服务器主机的虚拟存储、基于存储设备的虚拟存储、基于网络的虚拟存储。三种方式有各自的优缺点, 不同条件的图书馆可根据实际选用。目前, 使用较多的是基于网络的虚拟存储方式。 4 虚拟化存储技术在图书馆数字资源建设中应用 https://www.99xueshu.com/w/ikey6d5tc1aq.html
11.盲人数字图书馆,digitallibraryfortheblind,音标,读音,翻译通过对国内外个人数字图书馆的概念、特征、服务功能、管理软件、构建过程等进行分析比较,总结出国内外个人数字图书馆的优缺点,指出个人数字图书馆是信息社会发展的产物,两种类型的个人数字图书馆是相互促进、不可偏废的。 2. This paper introduces the concept of individual digital library, points out that constructihttp://www.dictall.com/indu59/71/59714037D2E.htm
12.国家科技数字图书馆的成员单位不包括()查看完整题目与答案 参考解析: 中国社会科学院图书馆 AI解析 重新生成最新题目 【单选题】如果将人眼比作照相机的话,则相当于暗盒的是( )。 查看完整题目与答案 【单选题】道德是人类社会生活中依据社会舆论、( )和内心信念,以善恶评价为标准的意识、规范、行为和活动的总称。 查看完整题目与答案 【单选题】https://www.shuashuati.com/ti/48323dcd6a1044018c6198e3f0fec31e.html?fm=bd874948281cbe3a7929cbd981bd7a3107
13.榆林市数字图书馆而我们很多父母,孩子在玩着积木,他们在一旁刷着手机。 父母这种低质量的陪伴,反而会让孩子觉得不受重视,产生自我怀疑,还不如不陪他。 有人曾说,所谓的“高质量的陪伴”: “是父母参与孩子的游戏,全程有互动。 最重要的是有眼神、语言、情感交流,让孩子感受到爱。” https://2021.ylebook.com/app/index.php?i=1&c=entry&id=12274&do=detail&m=tech_superarticle
14.汉王数字图书馆解决方案建设中国数字图书馆工程不仅将扭转互连网上中文信息匮乏的状况,而且将极大促进国民经济新的增长,推动我国信息技术的发展和信息化的建设,同时,图书馆 的工作方式和服务模式将得到跟本性的改变,全面实现自动化、网络化和信息化。目前,我国各级政府对数字化图书馆工程非常重视,国家专门成立了“863”计划数字化图书馆战略小组http://www.360doc.com/content/12/0121/07/3651847_116139722.shtml
15.图书馆2.0环境下用户参与数字参考咨询的路径选择认为图书馆2.0的核心是以用户为中心,强调人的参与。通过对比传统型数字参考咨询模式和用户参与型数字参考咨询模式的优缺点,分析图书馆2.0环境下图书馆用户参与数字化参考服务(DRS)的理论依据和现实动因,并从用户参与的形式选择、内容选择、激励机制、引导监督等四个方面探讨其路径选择,以期形成和培育一种既方便用户提出咨https://www.lis.ac.cn/CN/abstract/abstract11845.shtml
16.三个外文数据库的优缺点分析怎么写比较好帆软数字化转型知识库一、IEEE XPLORE的优缺点分析 IEEE Xplore是由电气电子工程师学会(IEEE)提供的数字图书馆,主要涵盖工程、计算机科学和电子技术领域的文献。优点包括:1.广泛的数据覆盖范围,IEEE Xplore收录了大量的会议论文、期刊文章、技术标准等,特别是在电气工程和计算机科学领域,具有很高的权威性和完整性。2.强大的检索功能,IEEE Xphttps://www.fanruan.com/blog/article/493865/
17.2024最全国内外免费电子书资源网站汇总Library Genesis是世界一流的搜索引擎和数字图书馆,可免费访问超过200万本有关各种主题的书籍,文章,论文和期刊,特别是科学,学术和虚构类图书。它具有PDF,EPUB, MOBI和DJVU等免费内容。Library Library Genesis上有5个作为PDF电子书资源的镜像,这意味着你可以轻松地从本网站找到并下载PDF电子书。 3.Bookboon 网站地址https://www.extrabux.cn/chs/guide/6812927
18.贺丰盈:大数据时代,我们如何精准地获取想要的知识?随着互联网技术的不断发展,数字时代已经对人们的生活带来了革命性的变化。人们在日常生活中使用互联网进行信息获取已经成为一种主流方式,数字化知识的获取也因此变得更为方便快捷。本文将探讨数字时代下的知识获取方式,并分析其优缺点。 一、网络搜寻引擎 网络搜寻引擎,如百度、Google等已经成为知识获取中的重要途径。在https://m.sohu.com/a/731443973_121832564/
19.南京图书馆2023年“缤纷的冬日”活动指南在南图讲解馆员的带领下,实地了解特色阅览室,学习图书馆图书检索、查找、借阅、归还等相关图书馆图书利用知识。开展以“书海寻宝”的游戏竞赛方式实践操作,引导参与者快速找出指定书籍,并诵读该书籍部分内容,获胜者赠送特别小礼品。 活动对象:7-10岁持少儿证小读者http://www.jslib.org.cn/zx/tzgg/202212/t20221230_248714.html
20.数字媒体技术导论呼和浩特市赛罕区图书馆荐购此图书,助力图书馆优先采购 (0 人荐购) 立即荐购 > 在线试读 下载 注:如果您的电脑尚未安装PC客户端,请先 安装客户端 后再下载阅读!手机扫描阅读此书 支持(Android/Iphone) 简介 目录 评论 简介 本书共14章,主要内容包括:艺术家和计算机;数字媒体技术概论;数字音频媒体技术;数字图像处理技术;数字视频媒体https://cxstar.com/Book/Detail?ruid=256e86a9000001XXXX