第四章检索式编制

第四章检索式编制【知识框架】什么是检索式?指搜索引擎理解和运算的查词串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。

主要逻辑算符布尔逻辑算符:与或非优先算符邻接算符字段算符截词算符加权算符词组或短语如何构建合理的检索式?常用检索方法与策略【补充教材2.4-4章】【主要内容】1、检索式和运算符检索式:用运算符将检索词连接起来构成的能让计算机识别的式子。

运算符:又称逻辑算符,是表达检索词之间逻辑关系和限制关系的运算符号,它是复合检索式中必不可缺的构件。

2、布尔逻辑算符1)逻辑“与”逻辑“与”可用“AND”或“*”表示,检索词用“AND”或“*”相连,含义是检出的记录中同时含有所有检索词。

逻辑“与”运算符的基本作用是对检索词加以限定,逐步缩小检索范围,减少命中文献量,提高检索结果的查准率,适用于不同概念组面之间以及同一组面内不同含义的词之间的组配。

2)逻辑“或”逻辑“或”可用“OR”或“+”表示,检索词用“OR”或“+”相连,含义是检出的记录中,至少含有检索词中的一个。

逻辑“或”算符的基本作用是扩大检索范围,增加命中文献量,防止漏检,提高检索结果的查全率。

适用于同义词或同族概念的组配,如同义词、近义词等。

3)逻辑“非”逻辑“非”可用“NOT”或“-”表示,检索词用“NOT”或“-”相连,表示排除“NOT”或“-”算符后的词语,检出含有算符前检索词的所有记录。

逻辑“非”算符的基本作用是缩小检索范围,减少文献输出量的作用,但不一定能提高文献命中的准确率。

同时应注意在有两个以上运算符的复杂逻辑式中,“NOT”出现次数不能太多,否则检出结果极少,影响检出效果。

使用布尔检索需要注意问题:(1)布尔检索执行顺序:布尔检索运算执行顺序通常是NOT、AND、OR。

有括号时,先执行括号内的逻辑运算。

有多层括号时,先执行最内层括号中的运算。

(2)绝大部分网络信息检索工具都支持布尔检索功能,但不同的检索工具之间有差别。

编制检索式的基本方法黄筱玲检索式的定义百度百科定义:指搜索引擎理解和运算的查词串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。

关键词是检索式的主体,逻辑运算符和搜索指令根据具体的查询要求从不同的角度对关键词进行搜索限定。

逻辑运算符是表达检索词之间逻辑关系和限制关系的运算符号,它是复合检索式中必不可少的构件。

如何制定检索式1.检索词的选择2.运算符的类型3.编制检索式1.检索词的选择检索词定义和类型:表达信息需求和检索课题内容的基本单元,也是与系统中有关数据库进行匹配运算的基本单元,检索词选择洽当与否,直接影响检索效果。

常用的检索词包括:表示主题的检索词主题词关键词标题词叙词表示作者的检索词表示分类的检索词和表示特殊意义的检索词ISBN、ISSN、引文标引词等.关键词与主题词◆关键词即是“自由词”,是信息的提供者各自采用的不经过一定规范化限定的词。

检索操作方便,但其专指度差,常需用较高的逻辑匹配、截词符等技能。

◆主题词即指以自然语言中优选出的,经过规范化处理后的名词术语。

检索操作一般需将习惯使用的自然语言与各数据库自编的主题词表对照后方能使用,但专指度较高。

检索词的选择技巧1.勿忘检索词的全称、简称、俗称与英文缩写项目名称:乙型病毒性肝炎的中医药研究篇名乙型病毒性肝炎中医药中药乙型病毒性肝炎的同义词:乙型肝炎乙肝HB篇名乙型病毒性肝炎乙型肝炎乙肝HB中医药中药项目名称:耐高温粘接剂的研究篇名高温粘接剂粘接剂的同义词:胶粘剂、粘固剂、粘合剂、胶结剂、粘结剂、粘胶剂、粘接剂、粘着剂、黏合剂、胶合剂篇名高温粘接剂胶粘剂粘固剂粘合剂胶结剂粘结剂粘胶剂粘接剂粘着剂黏合剂胶合剂初级检索高级检索搜索同义词方法(1)利用数据库的同义词选择功能(2)利用搜索引擎寻找同义词(3)从数据库检索结果中寻找同义词(4)利用自己的专业知识(5)利用自己平时积累的知识2.注意检索词的上下位类扩展项目名称:电阻焊在汽车生产中的应用篇名电阻焊汽车生产电阻焊F点焊缝焊凸焊对焊篇名电阻焊点焊缝焊凸焊对焊汽车机动车客车轿车生产项目名称:苯胺的烷基化反应催化剂研究文摘苯胺烷基化催化剂烷基化——AlkylationF甲基化Methylation乙基化Ethylation文摘苯胺烷基化甲基化乙基化催化剂●课题(1)“加氢裂化防污垢的开发与应用研究”,将“加氢裂化”与“防污垢”组配,结果不理想。

第一,不同的检索工具表示布尔逻辑关系时使用的符号不同,有的用“&”、“︳”和“!”分别表示布尔关系的AND、OR和NOT,有的用+、-分别表示布尔关系的AND、OR,有的则用表格、文字、空格或菜单来体现不同的布尔关系。

使用的时候要注意使用帮助系统了解代表某种逻辑关系的符号。

第二,有的检索工具检索词之间默认关系为AND,有的检索工具检索词之间默认关系为OR。

第三,支持布尔逻辑的程度不同,有的完全支持三种运算,如Infoseek;有的仅在高级检索中完全支持,而简单检索中则部分支持,如Lycos;而Yahoo则不支持布尔关系NOT。

3、优先处理算符优先处理算符用“()”表示,含义是优先对()内的算符进行逻辑运算,在实际检索中,有时要调整逻辑运算符的运算顺序,使某些算符优先进行逻辑匹配,或者是简化逻辑算式,在这些情况下,将使用算符“()”。

4、邻接算符邻接算符又称词位置逻辑检索符、全文查找逻辑算符,相邻度检索算符,原文检索符。

在检索中,会遇到如下一些情况:某个概念需用词组形式表达;两个或两个以上的词要紧密相邻;在这些情况下,需要用邻接算符限定检索词之间的间隔距离或是词语出现的顺序。

1)(W)W的含义是“With”,其用法为A(W)B,表示(W)前后所连接的A、B两个检索词在检出结果中必须紧密相邻,且词序不能颠倒。

2)(nW)W的含义是“Word”,n代表单词个数,用法为A(nW)B,表示A、B两词之间允许插入最多为n个的其他词语,插入词可以是实词或系统禁用词,同时A、B两词的前后顺序保持不变。

3)(N)N的含义是“Near”,用法为A(N)B,表示在检出结果中A、B两词必须紧密相邻,并允许词序发生颠倒。

4)(nN)N的含义仍是“Near”,用法为A(nN)B,表示A、B两词之间允许插入最多为n个的其他词语,插入词可以是实词或系统禁用词,两词的前后顺序可以颠倒。

5、(X),这是无间隔有序检索符。

检索式为A(X)B,表示这个算符两边的检索词必须完全一致,并以指定的顺序相邻,中间不允许插入任何单词或字母。

6、(nX),这是有间隔有序检索符。

检索式为A(nX)B,表示两个检索词之间最多可以插入n个单元词,两边的检索词必须完全一致。

5、字段限制在联机数据库或光盘数据库检索系统中,都提供字段限制的检索功能,其作用是检索范围限定在某一字段内如题目、作者等。

以DIALOG检索系统,基本字段限制为四个:题目(TI)、叙词(DE)、标引词(ID)、文摘(AB)。

例8:检索式COMPUTER/TI表示在题目中查找含有COMPUTER一词的文献。

除了基本字段以外,检索系统中的其它字段都可称为辅助字段,其表达方式与基本字段有所不同,它是在检索词前面加上字段代码和运算符“=”,例9:检索式CS=BEIJINGUNIBERSITY表示检索著者单位为北京大学的所有文献。

网络检索的字段限制字段“site:”表示检索应该在一定的站点上进行,“url:”表示检索词应该是网址的一部分,“title:”表示检索词应在网页标题中出现,“alt:”表示检索词应在图像替代文字中。

在搜索引擎Google的检索框键入link:可以得到所有链接到Google主页的网页。

6、截词算法截词检索是利用检索词的词干或不完整的词形查找信息的一种检索方法。

用户可以在检索式中用截词符号(如“*”、“?”或“$”等等)表示检索词的某一部分允许有一定的词形变化,而不必输入完整的检索词。

检索时,检索工具将用户输入的检索式到数据库中进行查找,凡是与检索式相匹配的字符,不论其后或其前是什么字符都属命中内容。

截词检索可以降低输入次数,简化检索程序,扩大检索范围,提高查全率。

一般情况下,“?”代表一个字符,而“﹡”表示通配所有字符。

1)按截断的字符数量划分截词检索可以分为有限截词和无限截词。

有限截词,又称有限截断,指对词干以外可以出现的字母数量进行限定。

如:studen,截词符“”表示检索含有studen和studen后只跟有两个字母的检索词的文献。

无限截词,又称无限截断,指对词干前后出现的字母数量不作限定,一切与输入的词干相匹配的字符串,不论词干后或词干前是什么字符串、有多少字符串都属于要检索的信息。

2)按截断的位置划分截词检索可以分为前截词、后截词、前后截词和中间截词。

前截词,又称左截词,前截断允许检索词的前端有一定形式的变化。

检索时将截词符放在一个字符串的左方,表示其右的有限或无限个字符不影响该字符串的检索。

这实际上是一种后方一致的检索,对汉语中的复合词组的检索非常方便。

后截词,又称右截词,后截断允许检索词的尾部有若干形式的变化。

检索时将截词符号放在一个字符串的右方,凡是有截词符左方所有字符串的文献都符合检索要求。

这实际上是一种前方一致的检索。

目前大多数网络检索工具都支持截词检索,但与联机和光盘数据库检索系统的截词功能相比仍存在一定距离,数据库支持全部截词功能,而在网络检索工具中,较多支持右截词,部分支持中间截词,左截词较少。

7、词组或短语检索词组或短语检索是一般数据库中最常用的方法。

在网络信息检索工具中,如在检索框中输入两个或两个以上的检索词,这两个检索词之间又不加任何符号,那么检索工具会将这两个检索词之间的关系设为默认值(有的默认值为AND,有的默认值为OR)。

如要将这两个或多个检索词作为一个词组或短语进行检索,中间不允许插入任何字符,就必须使用一定的符号来表明这是词组或短语,最常用的符号是双引号“”或括号()。

8、加权检索加权检索的基本方法是:在每个检索词后面给定一个数值,表示其重要性程度,这个数值称为权值。

通过加权明确了各检索词的重要程度,使检索更有针对性,并且能依据权值的大小,对命中记录的重要性进行排序。

检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值之和。

只有当数据库记录的权值之和达到或超过预先给定的阈值时,该记录才算命中。

最先支持加权检索的网络信息检索工具是Excite,它用符号“∧”表示给某个检索词指定了权值。

现在大多数网络信息检索工具采用“+”、“-”来表示检索词在检索提问中的分量。

9、构造检索提问式在检索中,有两个最为关键的步骤,一是概括检索提问,选择精确的检索词;二是正确构造检索提问式,达到检出目的。

(一)灵活运用各种运算符号要考虑检索提问中的关键词是否有同义词、近义词,以及词形的各种变化,灵活运用各种运算符号,如逻辑“或”算符、截词符号、邻接算符等,扩大词语的检索范围,降低漏检的可能性,提高检出效果。

(二)准确构造检索式构造步骤:1、分析检索词之间的逻辑关系,形成“子逻辑式”2、根据检索提问中涉及的主要主题概念,构造检索提问式3、尽量选专指词、特定概念或专业术语作关键词,避免普通词和太泛指的词语。

4、用双引号提高查找精度。

5、用截词符扩检。

对于英语,有不同的单复数形式和时态变换,可使用截词符号扩大检索范围,但有些搜索引擎不支持该功能,如Google。

6、使用邻接算符可以提高检索的准确性和灵活性,例如,Lycos用adj、near、far或before来限定词与词之间的关系7、利用符号“+”、“-”。

2、引擎一般提供简单检索和高级检索,在高级检索中,大多数都支持布尔逻辑检索。

准确使用布尔逻辑检索可提高信息检索效果。

一般同义词或近义词之间用“OR”连接,可避免漏检;当信息需求包含几个不同组面的概念时,一般用“AND”连接,可精确查出所需内容;当不需要检出某些关键词时,用“NOT”。

3、许多搜索引擎还提供了限定字段、限定网页深度(即网页层次)、限定日期、限定地区或域名等限定检索的功能,这些检索功能可以缩小检索范围,减少无关信息的输出,提高检索精确度。

(四)修改检索策略要想达到搜索目的,正确的方法是从第一次搜索结果中不断进行修正,可以尝试着使用其它含义相近的关键词,或者在原关键词前添加各种符号如“+”、“-”,修改检索式(即布尔逻辑式)等等,还可以换其它搜索引擎再进行搜索,这样重复多次以后,就能搜索到满意的结果。

补充:教材第二章信息检索的基本知识1.常用检索方法广度优先法:从提供信息总目的网页开始浏览,沿着专题链接层层查找。

THE END
1.荐书同心护珍宝聚力续华章“字节跳动古籍保护专项基金”公益项目的圆满完成,离不开文化和旅游部、国家文物局各级领导的关心和指导,离不开中国文物保护基金会、字节跳动公益的大力支持,也离不开各古籍收藏单位,特别是10家国家级古籍修复中心同仁的鼎力配合,社会各界对古籍保护事业的热心关注和积极参与。https://mp.weixin.qq.com/s?__biz=MzAxMDk1NDA4MQ==&mid=2247525993&idx=1&sn=934aa0806d3f1539495bd2a8c6a64056&chksm=9a97297e2dc499472c0f25479ab71f5e2463687b3f352fe2538bba95be043845620250bfcffc&scene=27
2.国家图书馆揭晓第十九届文津图书奖国家图书馆揭晓第十九届文津图书奖 为迎接第29个世界读书日,“天雨流芳 共谱华章——第十九届文津图书奖发布暨文津阅新首场活动”4月19日在国家图书馆举行。活动现场揭晓了第十九届文津图书奖结果,并推荐社科类、科普类和少儿类年度佳作。《寻找缭绫:白居易<缭绫>诗与唐代丝绸》《计算》《长江!长江!》等61种https://baijiahao.baidu.com/s?id=1796767435480461414&wfr=spider&for=pc
3.6本被国家图书馆收藏的爽文小说文化娱乐大家好,我是喜欢看小说的猪爸爸,喜欢和大家分享各种好价,各种优惠活动,有志同道合的道友可以一键三连,张大妈会优先推送哦。 什么样的爽文能被国家图书馆看上?今天分享的这6本爽文已经全都被国家图书馆永久收藏,大家看看有没有你喜欢的? 商品 阿木莎 书架桌上置物架宿舍书房电脑桌面双层收纳铁艺洞洞板悬挂架 书架(https://post.m.smzdm.com/p/al8n5dze/
4.www.topcheersoftware.com/newxr55078374/202410性一交一乱一能一八一片 激情小说 校园春色 国产精品秘 入口久久蜜桃 缅甸砍头3分19秒 白丝少女被操到高潮迭起 HDsex18极品国产麻豆 域名停靠app大全免费下载小说 原神甘雨被史莱姆附身是什么意思 图书馆的女友 いづみ宏翔Twitter做零 精品小视频 搡老熟女 婷婷色狠狠 无内白丝裤袜露裆喷水 6080午夜AAhttp://www.topcheersoftware.com/newxr55078374/2024-10-27/77973171.htm
5.国家图书馆永久典藏的100部网络小说百部网文作品被国家图书馆收藏 2020年8月31日,阅文集团与拥有百年底蕴的国家图书馆携手合作——成为“国家图书馆互联网信息战略保存基地”。 阅文的首批100部优秀网络文学作品也被典藏入… 玄缈缈发表于玄派说网文 旧小说-商务印书馆(二) 【旧小说】11 商务印书馆.pdf【旧小说】12 商务印书馆.pdf【旧小说】13https://zhuanlan.zhihu.com/p/215675154
6.这100部被国家图书馆永久典藏的网络小说,你看过其中的哪些?今天在起点看小说的时候,发现起点推送了一个“百部网文荣获国家图书馆永久典藏”的消息。就很好奇是哪百部作品,能收获这样的殊荣。 点进页面,一百部小说都在,男女频都有,我简单按照分类给做了一下整理。大家一起来看看这些作品。 男频:68本 一、玄幻17本: http://www.360doc.com/content/21/0218/21/2005632_962639534.shtml
7.国家图书馆少年儿童馆“四季童读”项目秋季书单,收藏国家图书馆少年儿童馆“四季童读”项目秋季书单分享,覆盖学前(0-6岁)、小学初段(7-9岁)、小学高段(10-12岁)、初中(13-15岁),详情查看正文。 转眼已经开学一个多月了,除了课堂上好好学习之外,同学们有认真的在课后阅读充实自己吗?经典名著相信大家已经读过不少了,今天小编为大家分享一些宝藏童书,由国图少https://www.xschu.com/xiaoshengchu/08/49365.html
8.玄幻小说哪些被收入国家图书馆玄幻小说哪些被收入国家图书馆 1、玄幻小说史 最近刚好写这方面的论文和小说 网络玄幻写作则是特指在起点、17K、幻剑、潇湘、逐浪、清新等原创网络书站发表与玄幻、表现和发泄非理性欲望的一种写作。玄幻写作多属于网络商业写作,以通俗和商业价值为其最终的追求目的。http://www.zzzyq.net/rank_1578543
9.红与黑法文直译无删减版法国国家图书馆藏本现代小说之父司汤达红与黑 法文直译无删减版 法国国家图书馆藏本 现代小说之父司汤达文集 (法)司汤达(Stendhal)著罗新璋译 著天津人民出版社 分享 收藏 降价通知 已选 1个 送至 北京朝阳区三环到四环之间 评价 *** 商品介绍 售后保障 包装清单 商品参数 服务承诺 京东商城向您保证所售商品均为正品行货,京东自营商http://item.m.jd.com/ware/view.action?wareId=11999092918&appCode=ms0ca95114
10.收藏文史数据库大全(分类归纳版)国家清史工程数字资源总库 由清史工程而建立的数字图书馆,文献非常丰富。现已上传的数据有: 1、中央档案一库:起居注(全文数字化,前四朝);史料旬刊(全文数字化,全部);雨雪粮价单(目录图片,全部);录副奏折(目录图片,部分)。 2、中央档案三库(将在三月底正式启用),包括以下所有内容: ①档案件数总计:875077件 https://card.weibo.com/article/m/show/id/2309634740159047599763?id=2309634740159047599763
11.《贞观政要国家图书馆出版社》简介书评在线阅读图书>小说>中国古典小说>贞观政要 国家图书馆出版社 分享 收藏商品 贞观政要 国家图书馆出版社 新华书店正版,关注店铺成为会员可享店铺专属优惠,团购客户请咨询在线客服! 作者:[唐]吴兢出版社:国家图书馆出版社出版时间:2019年06月 手机专享价 ¥ 当当价 降价通知 ¥34.56 定价 ¥54.00 http://product.dangdang.com/11176992150.html
12.[渝粤教育]浙江师范大学敦煌文学艺术参考资料8、【多选题】敦煌遗书目前主要保存于哪些国家? A、英国 B、法国 C、俄罗斯 D、中国 E、日本 参考资料【 】 第二章简答题 第二章测试题 1、【单选题】藏经洞发现的最早有明确日期的印刷品《金刚经》目前收藏于: A、甘肃省图书馆 B、英国国家图书馆 https://blog.csdn.net/m0_53223332/article/details/123497428
13.被国家图书馆永久典藏.意味着什么被国家图书馆永久典藏,意味着该书籍或资料的质量非常高,被认为具有长期保存价值,并可能成为重要的研究、教育、和参考资源。 能够被国家图书馆永久典藏的书籍或资料,都是非常珍贵和有意义的被肯定。 这是一种激励!年代历史资料,被引起典藏,已经让人热泪盈眶。 https://www.meipian.cn/4zvwvfhv
14.第五届国家图书馆文津图书奖获奖图书光明日报总评一年一度的文津图书奖到今年已经五周年了。逢五逢十是大庆,是应该大大庆祝一番的。 为学术津梁,做文化使者,作为图书的收藏者和管理者,国家图书馆通过文津图书奖在写书人,出书人,读书人这三者之间建立了联系的纽带,架起了沟通的桥梁,实在是做了一件大好事。 https://www.gmw.cn/01gmrb/2009-12/23/content_1026730.htm