信息检索1、常规检索2、文献检索、信息平台检索基础项目4.1善用搜索引擎——成为一名掌舵手项目4.2巧用资源专用平台——玩转掌中的罗盘项目4.3活用公共信息平台——抬起手中的望远镜项目4.4知识讲解信息检索——穿过茫茫信息海洋勇登彼岸想象一下,你在马路上走着,某个陌生人刚与你擦肩而过,最多通过六个人你就能够认识ta,奇妙吗?这就是小世界理论(也叫作六度空间理论):你和任何一个陌生人之间所间隔的人不会超过六个,世界上所有的人其实都是相互认识的,只是可能需要通过或多或少的中间人。图4-1小世界理论项目4.1善用搜索引擎——成为一名掌舵手4.1.1任务:自定义搜索——规划最适用的航道任务描述
①本任务以百度这个搜索引擎为例,通过“搜索设置”对搜索列表的显示进行设置。②按高级搜索不同的筛选条件,让搜索引擎对搜索结果进一步检索。示例演练
(2)不包含指定关键词的搜索,是通过一个减号(-)来实现的,它的使用语法是前一个关键词与后一个关键词之间用减号连接,且减号的左边是空格,例如:我爱花-朵,如图所示:图4-7包含指定关键词的搜索图4-6不包含指定关键词的搜索(3)包含指定关键词的搜索,是通过一个加号(+)来实现的,它的使用语法是前一个关键词与后一个关键词之间用加号连接,且加号的左边是空格,例子:我爱花+朵,如图所示:项目4.1善用搜索引擎——成为一名掌舵手
(4)查询指定的文件格式,支持的文件格式可以是pdf/txt/doc等;例子:花朵filetype:pdf。如图所示:图4-9并行搜索图4-8查询指定的文件格式(5)并行搜索,是通过符号(|)连接关键词的,使用语法是A|B,搜索的结果显示是A或B,例子:花|草项目4.1善用搜索引擎——成为一名掌舵手能力拓展--搜索引擎的隐私设置
以百度为例,在官网右上角“设置”,出现下拉菜单,单击“隐私设置”,我们可以:1)对用户的搜索行为日志(可以理解为“记录”)进行开启或关闭,如果关闭,搜索引擎将不再记录我们的搜索行为,虽然可以提高网络安全性,但不利于用户重复搜索,降低搜索效率。2)是否展现搜索下拉框中的搜索历史词汇,我们搜过什么,下拉框便会记录并显示历史搜索词。3)查看或清理历史词。4)设置手机号搜索展现保护,开启后,搜索绑定的手机号时,结果中将不再展示用户的个人信息。5)身份证号搜索展现保护,开启后,搜索绑定的身份证号时,结果中将不再展示个人信息。图4-10搜索引擎的隐私设置项目4.1善用搜索引擎——成为一名掌舵手4.1.2任务:布尔逻辑搜索——选择最缜密的工具任务描述
在为搜索引擎进行了自定义设置以后,我们还能运用布尔逻辑来对搜索范围进行进一步的限定,缩小搜索范围,从而在海量信息量中获取到目标信息,实现更精确的检索效果。示例演练
不同的系统所用的截词符也不同,常用的有、$、*等。本节将以“百度”搜索引擎常用的截词符“*”和空格截词符为例,讲解常用搜索引擎中的截词检索技巧。(活页:截词检索的分类)示例演练
在“百度”搜索界面搜索框中输入截词表达式“欢迎*学生*入学”,由于运用了“*”截词符,所有包含了“欢迎”、“学生”、“入学”3个关键字的链接都会被显示出来,如图4-14所示。图4-14截词搜索图4-15截词搜索在“百度”搜索界面搜索框中输入截词表达式“欢迎你们到来”,由于运用了空格截词符,所有包含了“欢迎”、“你们”、“到来”3个关键字的链接都会被显示出来,如图4-15所示。项目4.1善用搜索引擎——成为一名掌舵手4.1.4任务:位置检索——锁定最理想的彼岸任务描述
在检索时,通过一些特定算符来表达检索词之间位置关系的过程叫做位置检索。常用的算符有NEAR、WITH等。在这些算符后面加上数字,表示间隔几个词的位置。一般情况下词之间没有先后顺序,表示两个词之间位置。本节将重点学习NEAR算符。NEAR,一般也可以用“~”来表示。它用于寻找在一定区域范围内同时出现的检索单词的文档,但这些单词可能并不相邻,间隔越小的排列位置越靠前。其语法为“词一NEAR/N词二”,词一和词二这2个参数的间距可以通过“/N”来控制,N是大于1的整数,表示检索单词的间距最大不超过N个单词。举个例子,“人工智能/NEAR10推荐算法”,表示检索全文某个句子中同时出现“人工智能”和“推荐算法”,且两个词间隔不超过10个字词。示例演练
1.在“百度”搜索界面搜索框中输入截词表达式“前端开发/NEAR5思政”,由于运用了“NEAR/N”位置算符,所有包含了“前端开发”和“思政”且间隔不超过5个字符的结果都会被显示出来,如图4-16所示。图4-16位置搜索图4-17指定网页搜索
如果页面因网络故障等原因打开失败,可以利用“网页快照”的功能来重新查看。(活页:网页快照)网页快照,即为引擎对搜索结果的自动缓存,所以进入界面的速度相较于直接打开网页要快许多。它还有一个好处就是:搜索关键词用亮色标记,因此用户可以快速定位关键词,提高搜索效率。以“祖国最美”为例,在百度搜索框输入检索词(图4-18),点击第二个红框的“百度快照”字眼,打开搜索结果的网页快照如图4-19所示:图4-18网页快照搜索图4-19网页快照搜索结果项目4.1善用搜索引擎——成为一名掌舵手4.1.5任务:限制搜索——聚焦最关键的海域任务描述
①运用限制检索查找一天内在百度网站中出现的标题包含“祖国最美”的目标信息。②运用限制检索查找自2011-12-12以来,在新浪网站中出现的标题包含“祖国”的目标信息。项目4.1善用搜索引擎——成为一名掌舵手任务实现
1.一天内在百度网站中出现的标题包含“祖国最美”的目标信息
如果要注册公司,一般需要注册商标,下面就以查询儿童服装商标为例,查询已被注册的近似商标。首先在百度搜索“商标局官网”,选择带有“官方”字样的搜索项,进入后选择“商标网上查询”选项,如图4-32所示,进入商标查询页面,选择“商标近似查询”。利用字段检索,直接搜索“服装”,结果显示出服装属于“25第二十五类服装,鞋,帽”,如图4-33所示。限制检索是通过限制检索范围,达到优化检索结果的方法。在搜索框输入汉字“头号”,单击“搜索”按钮,此时会跳出验证码,按提示输入后,如图4-34左所示,是已被申请过的包含“头号”字样的商标;再在搜索框输入“小精灵”,如图4-34右所示,无任何显示,表示该命名商标没被注册过,可申请注册“小精灵”商标。图4-32国家商标局官方网站图4-33搜索作者的结果图4-34搜索“头号”和“小精灵”的字段搜索结果项目4.3活用公共信息平台——抬起手中的望远镜4.3.1任务:位置检索——凝望远方的彼岸任务描述
在“出发地”文本框输入并选择长沙,在“到达地”文本框输入并选择深圳,在“出发日期”中选择“2021-10-07”,单击“查询”按钮。如图4-37所示,10月7日从长沙到深圳的车次将立即出现在该搜索框的下方。
图4-39搜索结果图4-40限制搜索结果项目4.3活用公共信息平台——抬起手中的望远镜2.使用“天眼查”查询公司信息①进入天眼查官网等招聘网站后,一般会有提供岗位的主体信息选择项,如公司名称、老板姓名、品牌名称等,以“华为”为例,搜索后会弹出限制词帮助人们进一步筛选等,如图4-41所示。图4-41搜索“华为”结果图4-42限制搜索结果②如果公司在全国各省份都有分公司或子公司,此时可以限制搜索某些省份以查询感兴趣的省市地区的分公司信息,如图4-42所示。项目4.3活用公共信息平台——抬起手中的望远镜能力拓展—打开新的标签页
当我们在某网站搜索答案时,大多数情况我们不仅仅只浏览一个页面的内容,而且多次点击“后退”的重复操作也会大大降低我们的搜索效率。此时,我们可以使用“打开新的标签页”的功能,具体操作方法:按住Ctrl键,点击搜索结果,页面就会在新的标签打开,方便页面间的内容对比。项目4.3活用公共信息平台——抬起手中的望远镜4.3.3任务:桌面搜索——擦亮千里眼,勇登彼岸任务描述
当某个文件放在某个多级子文件夹下时,如果没有养成对资料分类命名存放的习惯,往往一时很难找到文件路径,而在硬盘内直接全局搜索文件时,有常搜索缓慢,此时可以通过桌面搜索软件快速搜索。①通过快捷菜单打开“搜索”栏,搜索“everything”,搜索该款桌面搜索软件。选择“搜索”界面的文本框上方“everything官网”,如图4-43所示。图4-43搜索结果项目4.3活用公共信息平台——抬起手中的望远镜②在官网软件下载模块中,根据电脑配置,选择相应版本下载安装,启动后界面如图4-44所示。图4-44everything官网下载页面及软件安装后主界面项目4.3活用公共信息平台——抬起手中的望远镜任务实现
在“everything”搜索框中搜索指定文件并打开该文件路径:
在Office中,我们可以通过快捷键“Ctrl+F”来快速查找目标文本内容,而在网页中,此快捷键同样适用,只不过它的功能变成了查找页面功能,这可以让我们的搜索事半功倍。具体操作方法是:在页面键入输入“Ctrl+”F,弹出搜索框,键入关键词,结果会高亮显示,能够使我们更快定位到需要的地方。同学们,快来试试吧!项目4.4知识讲解什么是信息?
利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或、逻辑与、逻辑非。布尔逻辑“与”搜索,简单理解为交集,找并集。布尔逻辑“与”搜索可以协助我们缩小检索范围并提高检准率。布尔逻辑“与”搜索用AND或“*”连接检索词。使用布尔逻辑“与”搜索时,只有同时含有两个检索词时的内容才能被筛选出来。布尔逻辑“或”搜索,表示平行、并列,用运算符号“OR”或“+”连接检索词。使用布尔逻辑“或”搜索时,含有其中一个检索词或同时含有两个搜索词的内容都将被筛选出来。布尔逻辑“非”搜索,表示排除某关键词之外进行检索,用运算符号“-”连接检索词。使用布尔逻辑“非”搜索时,筛选出来的结果不包含“-”后面的关键词。项目4.4知识讲解截词检索
截词检索是当前预防漏检,提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数量,又可达到较高的查全率。尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。我们以英文为例,由于西方语言各地不同的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等,此时使用截词法便能帮助我们快速检索。按截断的位置来分,截词可有后截断、前截断、中截断三种类型。以无限截词和“?”截词符来举例说明:(1)后截断,前方一致。如“comput”表示computer、computers、computing等。(2)前截断,后方一致。如“?computer”表示minicomputer、microcomputer等。(3)中截断,中间一致。如“?comput?”表示minicomputer、microco