第一章1、情报定义:情报室人们用来解决特定问题所需要的,经过激活过程活化了的,具有使用价值的知识或信息。
2、文献定义:文献是记录知识的一切载体,即用文字、图形、符号或者声频等技术手段记录知识的物质载体。
或固化在物质载体上的知识。
文献具有三个属性即文献的知识性、记录性、物质性。
3、信息、知识、情报和文献的关系信息是物质存在的方式、形态和运动规律的表征,人脑对物质属性的感知形成信息,信息是起源,是基础;文献是信息、知识、情报的存储载体和重要的传播工具,信息知识和情报的内容只有记录在物质载体上才能构成文献;文献通过传递、应用于理论和实践又会产生新信息。
4、文献信息源文献信息也称文献资源,是用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。
5、文献信息源类型按照信息源的载体类型划分:印刷型缩微型声像型电子型按照信息源的加工程度划分:1)零次文献:零次文献是指尚未经过系统整理形成正式文献的零散资料或最原始的记录,如书信、手稿、笔记等。
2)一次文献:一次文献又称原始文献,是作者对自己研究的成果或创造性活动成果的直接记录。
一般是指公开出版的著作,期刊论文、科技报告、会议文献、学位论文、专利文献等。
3)二次文献:二次文献是将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。
二次文献包括目录、文摘、索引等,它们是二次文献的核心。
4)三次文献:三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献,包括素萍,百科全书、报告、年鉴、手册、字典等。
6、信息检索:广义上说信息检索是指将信息按照一定的方式组织和储蓄起来。
7、著录:是根据一定的规则,对文献的内容和形式特征进行分析、选择和记录的过程。
8、标引:1)按照标引的的工作方式分类:分为人工标引、计算机辅助标引、自动标引。
2)按照标引使用的语言分类:分为主体标引、分类标引。
9、信息检索的类型按照检索对象的内容划分:1)文献检索:文献检索包含全文信息检索、目录、题录、索引、文摘等二次文献信息索引。
2)数据检索:是指以特定的数值型数据为对象的检索。
3)事实检索:是指以特定的事实为目标的检索。
2)回溯检索按照检索对象的信息表现形式划分:1)文本检索2)多媒体检索:多媒体检索式根据用户的需求,对文字、声音、图像、图形等多种媒体信息进行组织、储存,从而识别、查找并获取有关信息的过程。
多媒体信息检索包括两层含义:其一是对离散媒体的检索;其二是对连续媒体的检索。
10、手工信息检索系统是一种以印刷型检索工具为主体的系统。
11、印刷型检索工具主要以文献信息、事实和数据信息为检索对象,因此又可细分为文献检索工具和事实数据检索工具。
12、文献检索工具可以进一步细分为目录、题录、文摘和索引四种检索工具。
13、事实与数据检索工具书包括百科全书、年鉴、传记、资料、手册、地理资料、机构指南、统计资料、字词典等多种类型。
14、信息检索语言的功能:1)用于对信息内容以及外部特征加以规范化的标引,保证不同标引人员表征信息概念的一致性。
2)用于对检索系统中信息特征标识和检索提问标识的规范和控制,便于标引用语和检索用语进行相符性比较,将信息存储与信息检索联系起来。
4)为检索系统提供多种检索途径,是各类检索系统的重要组成部分。
15、信息检索语言的类型按照结构原理划分1)分类语言是以学科体系为基础,分类语言的使用和规范工具是分类表。
2)主体语言又称主题法,主题语言又分为标题词语言、单元词语言、叙词语言、关键词语言和引文语言。
3)叙词语言4)关键词语言关键词可分为单纯关键词、题内关键词和题外关键词三种,题内关键词是在每条款目中保留了非关键词,如冠词、介词、连词等。
(出判断题)按照组配方式划分1)先组式语言是指在检索前检索词已被预先用固定关系组配好并编制在词表中。
2)后组式语言按照规范化程度划分1)自然语言2)人工语言16、传统的信息检索技术布尔逻辑检索1)常用的布尔逻辑运算符有三种,分别是逻辑“或”(OR)逻辑“与”(AND)和逻辑“非”(NOT)逻辑“或”(OR)是用来表示并列关系的一种组配,用OR或者“+”算符表示。
逻辑“与”(AND)是用于表示交叉关系或者限定关系的一种组配,用AND或者“*”算符表示逻辑“非”(NOT)是用于在检索范围中排除不需要的概念或排除影响检索结果的概念,用NOT或者“-”表示。
截词检索1)后截断例如输入“educat*”,则前6个字符为educat的所有的词均满足条件;而输入“educat??”,表示被截断的字符只有两个,可检索出含有educator、educated两次的文献。
2)中截断3)前截断位置检索(考实践题)(N)算符与(nN)算符例如:“control(1N)system”不仅可以检测出含有controlsystem、controlofsystem和controlinsystem的文献,还可检测出含有systemofcontrol、systemwithoutcontrol等的文献。
限制检索数据库中提供的可供检索的字段通常分为基本字段和辅助字段两大类。
基本字段表示文献内容的特征,包括提名(TL)文摘(AB)、叙词(DE)等字段;辅助字段表示文献的外部特征,包括作者(AU)、刊名(JN)、语种(LA)、专利号(PN)、年代(PY)等字段。
例:检索式“(macroeconomic/DE,T1,AB)ANDPY=2004AND(LA=ENORFR)ANDDT=Serial”所表达的检索要求是:查找2004年出版的英文或者是法文关于宏观经济学方面的期刊,并要求macroeconomic一次在命中文献的文献(AB)篇名(T1)或叙词(DE)字段中出现。
加权检索:就是在检索时赋给每个检索词一个表示其重要程度的数值,即“权值”。
17、信息资源检索方法常规法1)顺查法2)倒查法3)抽查法(应用条件:熟知学科发展为前提)18、信息资源检索途径内容特征检索途径1)分类途径实施分类途径基本过程分为:首先分析提问的主题概念,选择能够表达这些概念的分类类目(包括类名和类号),然后按照分类类目的类号或字顺从分类体系中进行查找,进而得到所需的文献信息。
分类途径一般是以科学体系为入口进行检索,能够体现学科的系统性,使同一学科有关内容集中在一起,使相邻学科的内容相对集中,能够更好地满足族性检索的需要,泛指性强,查全率较高,但一般只能满足单维概念的检索。
2)主体途径实施主体途径的基本过程为:首先分析提问的主题概念,选择能够表达这些概念的主题词,然后按照主题词的字顺从主题词索引中进行查找,进而得到所需要的文献信息。
19、文献提名是指书名、篇名、刊名、出版物名称、会议名称等。
(判断题)20、国际标准书号(ISBN)和国际标准刊号(ISSN)是检索图书和期刊时常用到的两个号码。
22、信息检索策咯的制定与实施(论述题)1)信息检索策略2)手工信息检索策略一般包括分析检索课题,选择检索工具,确定检索标识,选择检索途径,确定检索方法,实施检索以及索取原始信息等过程。
23、计算机信息检索策略的制定与实施1)分析检索课题明确检索课题的主要内容明确检索课题所涉及的学科、专业范围明确所需要文献的类型、语种、年代以及数量的要求明确用户对查新、查全、查准的指标要求及其侧重2)选择检索系统和数据数据库的内容数据库的覆盖范围数据库的成本3)确定检索词4)构造检索提问表达方式由检索词和运算符组成检索提问表达式的构造应记住以下几点:根据检索系统和数据路的特性和要求求编制检索提问表达式应遵守概念组配的原则,避免使用组配结果产生多重含义检索提问表达式应尽量简洁、清楚地表达逻辑关系,尽可能地提高计算机的检索,速度和检索效率。
5)试验性检索和修改检索策略不断了解反馈信息,反复分析,消除不确定因素,及时跳帧检索策略。
24、检索效果的评价1)检索效果是指检索服务的有效程度。
采用严谨的科学态度,认真祖训检索操作的内容,预防操作失误,最大限度地发挥检索系统的作用根据不同检索课题的需要,合理兼顾和调整对查全率的要求25、信息检索的意义1)信息检索是信息素质教育的重要手段2)信息检索是创新人才必备的基本技能3)信息检索是科学研究的重要环节4)信息检索是开发信息资源的有效途径5)信息检索式科学决策的前提第二章1、WWW(WordWideWeb)信息资源也成为Web信息资源,是一种典型的基于超文本传输协议(HTTP)的网络信息资源。
2、FTP信息资源文件传输协议ftp的主要功能是利用网络在本地与远程计算机之间建立起连接,从而实现运行不同操作系统的计算机之间的文件传送。
3、Yahoo!是一个综合性的目录型网络资源检索工具。
4、Google是一个典型的索引型网络资源检索工具。
5、网络信息资源检索工具的工作原理:通过数据采集子系统的人工采集或自动跟踪索引程序来广泛收集各类网络信息资源,经过一系列的判断、选择、标引、加工、分类、组织等处理、利用数据库管理系统来组织并形成供检索使用的数据库,创建目录索引,并大多以Web网页的形式向用户提供有关的资源导航、目录索引以及检索界面。
2)检索功能判断检索方式是单一还是多样判断采用的检索技术是否先进、多样判断是否对检索的信息资源拥有选择和限定的权利。
3)检索效率4)用户界面设计5)检索结果处理和显示第三章1、目录型搜索引擎:也被称为分类索引或网络资源指南,是一种网站级的浏览式搜索引擎,它是由专业信息人员以人工方式或半自动的方式搜集网络资源的站点信息,且采取人工方式对搜集到的网站加以描述,并按照一定的主题分类体系编制成一种可供浏览、检索的等级结构式目录(网站链接列表)。
2、索引型搜索引擎基于关键词检索的索引型搜索引擎是名副其实的搜索引擎。
索引型搜索也被成为机器人搜索或者关键词搜索引擎,是一种网页级搜索引擎。
它主要使用一个叫做“网络机器人”、“网络蜘蛛”或者“网络爬虫”的自动跟踪索引软件。
3、搜索引擎使用方法和技巧:1)选用适当的搜索引擎:如果要查找特殊性的内容或文件,可以使用索引型搜索引擎,如GOOGLE和Baidu等,它们是通过网页的完全索引来搜索信息的。
如果想从总体上或比较全面的了解一个主题,可以使用网站分类目录,Yahoo!和Sina等。
如果想查找一些特殊类型的信息,可以考虑使用特殊的搜索工具,例如要查找人物或者地点,可以使用专业的寻人引擎或者地图、位置搜索网站。
3)准确提炼搜索关键词:首先要避免写错别字,而不要总是寄希望于某些搜索引擎提供的容错查询支持。
4)小心使用逻辑运算符:①布尔逻辑运算在不同的搜索引擎中的使用是略有不同的。
②用户在使用布尔逻辑运算符时,可能错过了许多其他的影响因素。
5)掌握一些小的技巧①使用双引号(“”)进行名词、词组、短语等的精确查找。
②区分字母大小写③限制查询范围④尽量少使用空格6)培养有效的搜索习惯:网络信息资源检索式一种需要大量实践才能发展的技能。
真正的搜索者不会一搜索到满意的结果就会离开搜索引擎,他们会思考、会回顾,并通过不断学习,不断总结来培养自己快速有效地找到所需的内容的良好的搜索习惯。
4、Yahoo!主要提供主题分类目录浏览检索和关键词检索两种检索方式。
5、百度提供基于关键词的简单检索和高级搜索两种检索方式(检索实践题见书P76、77)(检索实践题见书P81、82)6、DogpileDogpile早期只是提供晨报新闻检索,后来逐步发展成为网上最受更欢迎的元搜索引擎之一,也是唯一一个与所有主要搜索站点签署搜索服务协议的搜索引擎。
7、Dogpile商务搜索技术十分先进,即使是高级运算符和连接符,它也是将其转换为符合每个引擎的语法,既可以使用“*”,作为通配符,也支持逻辑运算符NOT、AND、OR和括号。
8、CBIR基于内容的图像检索(ContentBasedImageRetrieval)CBIR主要内容有:颜色、纹理、形状、对象CBIR的常见检索方式如下:选择颜色的比例,层次以及纹理图案的图形进行查询使用画图工具生成表示物体和物体间空间关系的符号图像或者样本图像进行查询浏览检索界面所陈列的全部图像,从中选择接近自己意愿的图像进行基于某项图像特殊的检索,反复多次直至找到满意的图像位置为止。
第四章中文网络数据库的检索(实践重点)1、CNKI中国知识基础设施工程(ChinaNationalKnowledgeInfrastructure)是以实现全社会只是信息资源共享与增值利用为目标的国家信息化重点工程,被国家科技部等五部委确认为“国家级重点新产品重中之重”项目。
2、CNKI数据库有网上包库、镜像站点、全文光盘3种用户服务模式。
3、CAJViewer是中国期刊网数据库资源的全文格式阅读器。
4、数据库的特点:1)集题录、文摘、全文信息为一体,实现了海量数据的高度整合和一站式(One-stop-Access)文献信息检索。
2)参照国内外通行的知识体系组织知识内容,数据库具有知识分类导航功能。
5)全文信息完全的数字化,通过免费下载最先进的阅读器软件,可以实现期刊论文原始版面结构与样式不失真的显示和打印。
8)遍布全国和海外的数据库交换服务中心,配上常年的用户培训和高校的技术支持。
5、数据库的检索分为:初级检索、高级检索、专业检索、经典检索。
1)专业检索常用的符号有:精确检索符号(“”)如果检索词中含有空格、括号和其他特殊符号(*、+、^、$),或者以数字符号开始的检索词,必须用双引号(“”)括起来。
以免产生错误,例如:检索词为:中国$,其中“$”为截词符,输入时必须加入引号“中国$”,否则会出现语法错误。
2)布尔逻辑算符3)字段限制符4)关系运算符和关系修饰符①关系运算符(=)。
“=”既相当于模糊匹配,用于查找匹配一定条件的记录,也可以精确等于某一个值。
②关系运算符(Exact)。
Exact可以精确匹配一串字符串。
③关系运算符(ALL)。
ALL表示当检索词中包含多重分类时,它们可以被拓展成布尔运算符“AND”的表达式。
④关系修饰符(*)表示匹配任意0个或多个字符;如果表示单个字符,可以用转义字符“\*”来表示。
⑤关系运算符(Any)“Any”表示当检索词中包含有多重分类时,他们分别可以被拓展成布尔运算符“OR”的表达式。
9)经典检索万方数据知识服务平台的经典检索是从标题、作者、作者单位、中图分类、关键词和摘要等方面实施多个字段的逻辑组配检索。
10)中国高等教育文献保障系统英文简称CALIS数据资源主要有外文数据资源和中文资源两大类。
11)人大复印报刊资料网络版数据库包括:全文数据库、数字期刊库、报刊数据库、目录数据库和专题研究库等部分。
12)数据库的特点:具有查全功能、具有学术性和权威性、具有新颖性和创新性。
13)书目,即图书的目录,是指通过著录独立出版单元文献的各个特征,并按照一定的可检顺序编排而成的一种揭示和报道文献的工具。
14)联机图书馆公共检索目录OPAC由开放的公共查询目录演化而来。
15)现行的OPAC的特征:①数据资源更加丰富②用户界面更加友好③检索技术灵活多样④联机服务更加周到16)OPAC的检索(实践题见书P149P150上海外国语大学OPAC简单检索页面)17)电子图书(ElectronicBook,e-Book)又称数字图书,是指以数字形式加工,通过计算机网络进行传播,并借助于计算机或类似设备来阅读的图书,是电子出版物中最常见的文献形式。
18)电子图书的特点:①出版个体的宽泛性②形式的虚拟性③流通和使用的便捷性④信息结构的多样性⑤易于检索行第五章英文网络数据库的检索1)英文学术性数据库可以分为文献型、数值型、事实型、图像型和多媒体型等数据库类型,其中文献型数据库又分为全文数据库和书目数据库。
目前常用的综合性英文全文数据库有EBSCOhost、ProQuest系统全文数据库、AST、Elservier、ASP、BSP、KLUWER、IEJ、JSTOR、WorldScientific等;书目数据库主要有CSA、INSPEC、EIVillage、WebofScience、ISTP、CC等。
3)实践题(书P203高级检索)4)检索示例见书P207第六章核心检索评价系统1)世界上比较著名的联机系统有美国Thomsom公司的Dialog系统、美国联机图书馆中心的OCLCFirstSearch系统。
Dialog系统的常用指令以及其功能如下:Dialog系统的常用索引字段代码表:4)俄亥俄大学图书馆中心(OhioCollegeLibraryCenter,OCLC)创建于1967年,是由美国俄亥俄州的54所大学联合建立的一个计算机联合编目网络。
5)OCLCFirstSearch系统的主要特色:①强大的检索手段和检索功能②推荐最佳数据库功能③易于获取联机全文④包含丰富的馆藏信息⑤配置了Web界面的管理模块⑥信息量大,主题广泛6)专家检索:检索式由各种布尔逻辑算符、位置算符、截词算符、检索词、字段标识符号等构成。
检索式分为单位标识检索式,多标识符检索式、精确短语检索式和组合检索式等几种。
7)组合检索式。
在组合检索式中,使用逻辑运算符AND\NOT、OR把检索词或检索式组合起来,使用检索更精确。
12)EiEngineeringVillage2的核心数据库是EiCompenfdexWeb。
14)叙词检索是利用系统的控制词表(叙词表)检索某一主题的文献。
15)中国科学引文数据库(CSCD)为我国科研水平和绩效的定量评价以及社会科学术文献的查找提供了便捷的检索工具。
16)CSSCI数据库概述:中国社会科学引文索引(CSSCI)数2南京大学中国社会科学研究评价中心研制、开发的数据库,用来检索中文社会科学领域的论文收录和文献被引用情况。
17)CSSCI数据库的特点:①CSSCI是人文社科文献计量统计分析的重要工具②利用CSSCI开展人文社会科学研究③利用CSSCI进行社会科学研究评价与管理④利用CSSCI进行社会科学期刊的评价与管理⑤CSSCI拥有独特的技术功能。