1.从信息利用的角度考察,互联网信息资源由哪三方面构成?从信息利用的角度考察,互联网信息资源由连接在网上的计算机中的无数信息、网上的各种信息工具以及网络通信渠道三方面构成。
2.简述网络信息资源的特点网络信息资源的特点是数量庞大、增长迅速;更新频繁、变化无常、分布散乱;良莠混杂。
3.如何正确认识网络信息与印刷性出版物在出版类型上的对应关系?按照出版类型区分,网络信息资源有着和印刷型出版物类似的对应关系。
例如,印刷型的期刊有网络期刊与其相对应,印刷型的图书有网络图书与其相对应,印刷型的报告有网络报告与其相对应,如此等等。
这种对应关系,仅限于我们对网络文献信息类型的认识,不能应用于具体的文献。
例如,早期的印刷型文献一般不会有网络形式,多数的当前印刷型学术文献也不太可能找到对应的网上电子版本。
4.何谓原创性网络信息和二次网络信息?按照内容是否具有原创性,网络信息资源有一次资源和二次资源的区分。
一次资源是指首次发表的原创性信息,二次资源是转载已有的信息。
5.何谓可见网络信息和不可见网络信息?按照是否属于搜索引擎检索范围,网络信息资源可分为可见资源和不可见资源两类。
6.简述网络可见信息的两个条件。
可见资源是搜索引擎可搜索到的资源。
这种资源要满足两个条件:一是必须含有HTML超链接,二是没有设置口令,7.简述网站和网页的关系。
网页是用HTML或DHTML、XML等语言写成的文本文件。
按照微软公司的比喻,如果把WWW当作是Internet上的大型图书馆,则每个Web站点就是一本书,每个Web页面就是书的一页。
8.为什么说网络学术信息不能唾手可得?原因主要有三:一是查找主页信息通常要通过查找搜索引擎之类的中介数据库才能进行。
而使用这些工具需要一些专门的技术,希望高效率地查找网络信息时尤其如此。
二是一般情况下只使用一两种搜索引擎所得的结果往往是沧海一粟。
三是互联网上学术类与非学术类信息的比例是1﹕10。
再则,网上学术信息很多是以不可见资源形式存在着。
因此查找网上信息的难度更大一些。
9.按工作方式区分的搜索引擎有哪三类搜索引擎?按照工作方式的不同,搜索引擎可以分为主题引擎、目录引擎和多元引擎。
10.简述主题引擎的三个组成部分主题引擎由三个主要部分构成:Robot、Index和搜索软件。
11.请举出典型的国外和国内主题引擎各一个国外主题引擎的代表是Google,国内代表为百度。
12.为什么主题引擎的分类途径不如目录指南型引擎?主题搜索引擎提供的分类途径或者为自动分类的结果,或是借用其他目录引擎的分类数据(例如Google利用网景公司的OpenDirectory分类),因而分类检索效果不如由人工仔细分类的目录指南型搜索引擎。
13.简述主题引擎与目录指南型引擎的主要区别(1)信息处理深度,目录指南型引擎为网站,主题型引擎为网页;(2)信息处理方式,目录指南型引擎为有人工参与,主题型引擎为全自动化;(3)信息的质量和数量,目录指南型引擎质量上相对较高,主题型引擎数量上相对较多。
14.为什么目录指南型引擎的主题查找效果不如主题型引擎?目录指南型引擎的主题检索只在对站点人工描述语言中进行,查找范围有限,所得结果通常是分类类名和网站名称,结果数量远不如主题引擎。
15.举出国内外目录指南型引擎典型代表各一个。
目录引擎的国外代表是Yahoo!,国内代表有新浪网。
16.什么是多元搜索引擎?简述其工作原理多元引擎是一种起检索中介作用的搜索引擎。
多元引擎本身没有存放网页信息的数据库。
当用户查询一个关键词时,它把查询请求转换成其他数个搜索引擎能够接受的命令格式,并行地或者有选择性地访问这些搜索引擎并查询这个关键词,处理这些搜索引擎返回的结果,然后再返回给用户。
17.举出国内外多元引擎典型代表各一个国外多元搜索引擎的代表是Dogpile,国内的代表是万纬等。
18.简述中外问搜索引擎的主要区别中文引擎可以使用英语等外文查找信息,外文引擎也可以使用中文;因而这两种引擎的区别不在于使用的语言,而在于收集和处理信息的侧重点。
中文引擎主要收集和处理的信息是中文网页,查找中文资料的效果通常胜过外文引擎。
反之,如果需要查找英文信息,直接使用境外英文引擎效果更好。
19.百度引擎的网页快照可以起什么作用?百度服务器通过程序收集网页时,在缓存器中保留了网页备份。
“网页快照”即是网页备份的链接。
当点击检索结果标题没有结果时,“网页快照”可以用于帮助获取某些“消失”了的网页信息。
20.分别给出百度引擎限制于URL字段、标题字段和网站字段的检索命令他们分别是inurl,intitle和site.21.简述百度引擎的三种逻辑运算符逻辑与为空格,逻辑或为“|”,逻辑非为“-”.22.什么是虚拟图书馆?虚拟图书馆是一种网络信息利用工具。
它针对某一学科或领域的研究者的需要,将互联网上与之有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URL,进行系统地收集、核实并加以组织,以网站、网页或数据库形式提供给用户浏览或者检索。
24.能否以网上信息资源完全代替印刷型文献哪一些文献的全文更适合从网上获得?目前,网上信息资源不能完全代替印刷型文献,尤其是学术型文献。
近几年的国内学术期刊文献、部分国外学术期刊文献和部分专利文献,比较适合于通过网络获取。
25.通过搜索引擎获得的未经审查的各种非正式出版物称为什么文献?通过搜索引擎获得的未经审查的各种非正式出版物称为灰色文献。
26.请比较手工检索和计算机检索的优缺点和适用范围计算机信息检索的优点在于速度快,耗时少,查阅范围广,甚至可以查到国外刚刚出版的期刊论文的信息。
计算机信息检索主要适用于已经数字化的近期文献信息和动态性信息的查找。
手工检索的优缺点差不多正好与计算机信息检索的相反。
但是手工检索耗时多,效率低,检索入口少,因此查找效果往往不如计算机信息检索的好。
手工检索主要适用于纸质印刷书刊文献,特别是早期文献信息的查找。
27.什么是数据库,它的结构由哪几部分组成?按照国际标准组织标准ISO/DIS5127规定,数据库是指至少由一种文档(file)组成,能满足特定目的或特定功能数据处理系统需要的数据集合。
从使用者观点观察,数据库主要由“文档——记录——字段”三个层次构成。
28.什么是文档?数据库包含哪几种类型的文档?从数据库的内部结构来看,文档的概念是指数据库内容的组织形式。
一般地说,一个数据库至少包括一个顺排文档和一个倒排文档。
顺排文档是将数据库的全部记录按照记录号的大小排列而成的文献集合,它构成了数据库的主体内容。
在倒排文档中,记录的特征标识作为排列依据,其后列出含有此标识的记录号,使用倒排文档可以大大提高检索的效率。
29.什么是记录?记录是文档的基本单元。
它是对某一实体的全部属性进行描述的结果。
30.字段有几种类型?字段是记录的基本单元。
它是对实体的具体属性进行描述的结果。
32.如何使用基于同一概念的方法扩展检索概念?基于同一概念的检索词的扩展法,可以寻找同一事物的学名和俗名等,寻找同一事物的简称、全称、音译意译以及反义词。
如果是英语,可以寻找同一事物名词的单复数、不同词性、英美语的不同形式等。
33.以基于内容分析方法扩展检索概念具体有哪几种方法?基于内容分析的概念扩展法分为上位概念扩展法、下位概念扩展法和隐含概念扩展法。
上位概念扩展法是分析检索对象的学科归属。
下位概念扩展法是分析检索对象的学科分支。
隐含概念扩展法是指文献或课题中,未用显而易见的方式表达,因而需要认真进行由表及里、由此及彼的深入分析才能找出的主题。
35.什么场合可以使用截词方法?当某些英语检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词符,或称通配符扩展检索词。
截词检索可以扩大检索结果。
36.使用截词检索应注意的哪些问题?使用截词方法时需注意四个问题:一是截词符要紧接在词干后面,截词符和词干之间不能有空格。
二是避免将检索词的词干截得过短,一般应在三个字母以上。
三是截词应该合理使用。
一般不可能出现词尾变化的单词其后不必再使用截词。
四是从希望出现的单词中取尽可能多的公共字母作为词干,以提高查准率。
37.什么是布尔逻辑算符?布尔逻辑算符一般有哪几种?规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。
布尔逻辑算符包括逻辑或(OR)、逻辑与(AND)和逻辑非(NOT)。
38.简述布尔算符(OR)的作用布尔算符或(OR),是用来组配具有并列关系、概念相同或相近的词。
OR算符的基本作用是扩大检索范围,增加命中文献量,提高检索结果的查全率,OR运算符还有一个去重的功能。
在实际检索中,同一概念组面中含义相同或者相近的词,相互之间都使用OR运算符。
39.简述布尔算符(AND)的含义和作用与(AND)运算符用来组配具有相互交叉限定关系的检索概念。
其含义是检出的记录必须同时含有前后两个检索词。
AND算符的基本作用是缩小检索范围,减少命中文献量,提高检索结果的查准率。
40.简述布尔算符(NOT)的作用非(NOT)运算符是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。
NOT算符的基本作用是缩小检索范围,提高检索结果的查准率。
17优先算符“()”有什么作用?优先算符“()”的作用是在多个逻辑符号混合使用时,改变它们的运算顺序。
41.什么是位置算符?它在文献检索中起什么作用?位置算符又称邻接算符,适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。
位置算符是提高检索查准率的一种重要手段。
42.字段限制有什么作用?适用于什么场合?字段限制是调整检索策略的一种重要的手段。
多数检索系统对不指定字段的检索词,通常在基本字段中进行搜索,如果想指定在题目等字段中查找所希望的检索词,就需要使用字段限制。
字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率的场合。
45.信息检索原理是什么?信息检索的原理可以表述为将检索提问标识与存贮在检索工具中的标引标识进行比较,含有两者一致或信息标引的标识包含着检索提问标识的信息就是检索命中的信息。
46.什么是文献的内容特征和外表特征?这两者有何区别?与文献信息主题内容没有关系或关系不大的信息称为文献信息的外表特征,例如,著者、著者单位、期刊名称、专利说明书的专利号、政府报告的报告号等。
文献信息内容特征主要有各种形式的主题词和分类号。
文献的标题因常常能够反映文献的主题,常被归入内容特征的范畴。
内容特征和外表特征的区别是:与文献信息内容特征的关系密切的是内容特征,反之是外表特征。
47.什么是检索语言?它在信息检索中起到什么作用?检索语言是用来描述文献的内容特征、外表特征和表达情报提问的一种人工语言。
它是沟通信息处理人员和检索人员的桥梁。
48.检索语言的种类有几种?检索语言主要有以代码语言为特征的分类语言和以事物名称术语为特征的主题语言两大类。
49.什么是分类语言?分类语言是在一定的哲学思想指导下,根据科学学科之间的逻辑归属关系,采用层次型或树杈型结构,列举人类所有的知识类别,并对每一知识分别标以相对固定的码,从而形成的类表。
50.国内通用的分类法有哪两种?它们的类号设置有什么主要区别?国内通用两种分类法是《中国图书馆分类法》和《中国科学院图书分类法》。
它们的类号设置的区别是《中国图书馆分类法》混合使用字母和数字,而《中国科学院图书分类法》使用纯数字作为类号。
51.什么是分类法中的上位类、下位类和同位类?在《中图法》以及任何类似的分类表中,被区分的类称为上位类。
相对地说,区分出来的类就是下位类。
处于同一上位类下的同一层次的下位类称为同位类。
在相应的检索工具中用该类号检索所需的文献,再根据所需要的文摘提供的出处查找原文。
53.多概念主题的文献如何确定分类号?给多概念课题确定分类号的方法,首先需要应用单概念课题分类方法,其次要区分属于并列概念课题还是应用性课题。
如果是并列概念课题,凡是有主次者,应取其重点或主要研究对象归类;凡是无主次的,课题所涉及的类别都应该查找。
如果属于应用性课题,应用于一个领域的应在所应用或受影响的类目中查找。
应用于多个领域的则在该理论、方法、工艺等本身所属的类目中查找。
54.什么是关键词语言?简述它的特征和适用场合关键词是一种自然语言性质的主题语言。
关键词法因直接以作者在文献中的用词作检索词,基本上不对词语加以控制。
它适合于检索新近出现的信息。
55.什么是叙词语言?简述它的特征和适用场合。
叙词语言是以规范化科学名词为基础的一种主题法检索语言。
叙词语言的两个最主要的特征是名词术语经过规范化,叙词与叙词可以组配。
叙词语言适用于需要比较全面地查找以往的文献信息。
56.简述二次文献的类型。
二次文献分为目录、题录、文摘三种。
题录是将图书、报刊等文献中论文的篇目按照一定的排检方法编排而成的,供人们查找篇目出处的工具。
文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。
57.文献检索有哪几个步骤?共有六个检索步骤:明确课题要求、了解课题的知识背景、分析课题涉及的概念、选择使用的检索刊物、实施检索以及索取原文。
58.手工文献检索主要有哪两种方法?文献检索的常用方法有直接检索法和间接检索法两种:直接检索法即直接从报刊杂志中通过浏览的方法从中获取所需信息的一种方法。
间接检索法即通过检索工具的指引进行查找,获取所需信息的一种方法。
59.什么是追溯法?它有什么优缺点?追溯法又称回溯法,它是从已有的文献后面所附的参考文献入手,逐一追查原文的方法。
其优点是:在没有检索工具或检查工具不齐全的情况下,借助此种方法,也可以查得一批有关文献信息。
其缺点是:原文作者引用的参考文献是有限的,不可能列出全部有关文献,而且有的引用文献又与原文关系并不密切,参考价值不大。
因此用此法查找文献比较费时,漏检和误检的可能性较大。
16.什么是常用法?常用法是利用目录、题录、文摘或数据库等各种检索工具来查找文献的方法。
60.什么是综合法?综合法因综合使用追溯法和常用法两种方法而得名。
具体方法是:先利用检索工具查出一定时期内的一批有用文献。
然后利用这些文献后面所列的参考文献,再以追溯法查出前一时期内的文献,如此循环交替地使用上述两种两种查找方法,直到满足要求为止。
61.简述学习文献检索课的意义(1)文献信息检索是获取知识的捷径。
(2)文献信息检索是科学研究的向导。
(3)文献信息检索是终身教育的基础。
科技的迅速发展使知识的总量呈指数增长,而知识的陈旧速度也明显加快,这就要求人们具有终身教育的能力,这种能力在很大程度上就是获取新知识的能力,就是对新知识的敏感力和接受力,因而必须掌握文献信息检索的方法。
终身学习的需要,是知识创新的需要.62.当代文献具有的特点哪些?(1)数量多、增长快(2)出版形式多、文种多(3)文献异常分散(4)文献失效加快(5)报道内容重复交叉(6)文献总体质量下降63.什么是零次文献、一次文献、二次文献和三次文献,它们之间的关系如何?(1)零次文献非文献形式社科文献源通常指没有物质载体的文献源,未经记录或公开于社会的最原始的文献。
(2)一次文献也称原始文献,一次文献它是以作者本人的研究或研制成果为依据而创作的原始文献。
(3)二次文献又称检索工具。
它是对一次文献进行加工提炼、压缩,按一定的系统和方式组织起来而产生的一类文献。
(4)三次文献是利用二次文献所提供的线索,选用一次文献的内容加以分析综合而编写出来的文献。
一般来说,零次文献是一次文献的基础和素材,一次文献是经常使用的最基本的文献,是检索的对象,二次文献是对一次文献的简化和整理,是检索的主要手段和工具。
三次文献是对零次文献和一次文献的高度浓缩,是情报研究的成果。
如核心期刊等。
65.什么是文献?构成文献的有哪四个要素文献的定义是记录有知识的一切载体称为文献。
构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。
67.文献信息的交流方式有哪两种?直接交流是以个人接触为基础的信息交流方式,又称“非正式交流”。
其主要方式有交流式、集会式、观摩式和零次文献交换式。
间接交流是以社会文献信息机构为媒介的信息交流方式,又称“正式交流”,包括文献的编辑、出版、印刷、发行、收藏与提供以及分析研究与开发利用。
除了学位论文以外,会议、报告和专利速度最快。
期刊次之,而且品种多,容量大,出版速度也很快,从而成为多数论文的发表渠道。
例如,查找当前最新的信息(一、两个月之内的信息),应该通过互联网以及当前最新的报纸杂志、广播电视这些媒体;两个月之前到十年之内的信息应主要通过网上图书期刊类的数据库解决;5~20年前的信息应除了期刊之外,还可以通过印刷版的图书和手册性工具书来查找。