导语:如何才能写好一篇信息检索,这就需要搜集整理更多的资料和文献,欢迎阅读由公务员之家整理的十篇范文,供你借鉴。
3、选择信息检索系统的方法:(1)在信息检索系统齐全的情况下,首先使用信息检索工具指南来指导选择;(2)在没有信息检索工具指南的情况下,可以采用浏览图书馆、信息所的信息检索工具室所陈列的信息检索工具的方式进行选择;(3)从所熟悉的信息检索工具中选择;(4)主动向工作人员请教;(5)通过网络在线帮助选择。
5、选择检索词。确定检索词的基本方法:选择规范化的检索词;使用各学科在国际上通用的、国外文献中出现过的术语作检索词;找出课题涉及的隐性主题概念作检索词;选择课题核心概念作检索词;注意检索词的缩写词、词形变化以及英美的不同拼法;联机方式确定检索词。
桶排序法,先把被排数据所分布的区间[Dmin,Dmax](在这里Dmax,Dmin分别为被排数据的最大,最小值)划分成N个大小相等的子区间,称子为“桶”,然后将N个数据根据其大小分配入相应的“桶”内(桶[1],桶[2],…,桶[N])。借签桶排序中将数据根据其大小分配入相应“桶”的思想,我们在检索时将已排好序的数据也根据其大小将其分配入相应的“桶”内,然后再在“桶”内进行二分检索。假设按升序排列的N个数据已存放在data数组的元素data[0]~data[N-1]中,构造一个HASH函数为:
(式中Dmax=data[N-1],Dmin=data[0],N为数据个数)
二、基于HASH函数的二分检索算法HS
算法HS使用二个数组,data数组的元素data[0]~data[N-1]中存放按升序排列的N个数据,address数组的元素address[1]~address[N]中用来存贮经HASH函数转换后得到相同地址的数据个数。
算法HS
HS1[清address数组]将ddress[1]~address[N]都置0
HS2[Dmax中置最大值、Dmin中置最小值]Dmaxdata[N-1],Dmindata[0]
HS3[i置初始值]i0
HS4[求数据data[i]的HASH变换后的地址ad]ad
HS5[地址“碰撞”记数器address[ad]加1]address[ad]address[ad]+1
HS6[修改i]ii+1
HS7[比较i与N-1]若i<=N-1,则转HS4,否则转HS8。
HS8[address[0]置初值1]address[0]1
HS9[j置初始值]j1
HS10[求地址发生“碰撞”的数据在DATA数组中的首地址]address[j]=address[j]+address[j-1]
HS11[修改j]jj+1
HS12[比较j与N]若j<=N则转HS10,否则转HS13。
HS13[输入一个被检索的数据X]
HS14[对被检索数据X用HASH函数得地址ad]
HS15[确定“块”的下界low,上界high的值]lowaddress[ad-1],highaddress[ad]-1
HS16[在“块”内进行二分检索]在给定的下界与上界之间进行二分检索,若找到,则返“检索成功”信息,否则返加回“检索失败”信息。
HS17[本算法结束]
三、平均检索长度的分析
在本检索算法中,首先将被检索数据X经HASH函数转换出一个地址,根据这个地址将被检索的数据直接定位到相应的“块”中,然后在“块”中进行二分检索。因此通过对所有“块”内二分检索法的平均检索长度的计算就可求出本算法的平均检索长度。二分检索法的平均检索长度为:
下面我们来求本算法的平均检索长度。假设在N个数据均匀分布的情况下,经过本检索算法中HASH函数转换,每一个地址出现的概率相同,都等于1/N,因此,有m个数据转换得到相同地址的概率为:
(m=1,2,…,N)
参考文献[1]的附录中已证明:(1)
所以本检索算法的平均检索长度为(2)
由上式(1)和式(2)两个公式即可求得本算法的平均检索长度,其平均检索长度小于1.352(当N>100时)。
四、算法分析与实验结果
1.本算法的创新之处在于通过HASH函数可将被检索的数据X直接位置定位到相应的“块”(通过HASH函数转换后的地址相同的数据区间)中,再在“块”中进行二分检索。从而不再需要建立索引顺索表检索算法中的索引表,也就省去了索引顺索表检索算法中查找索引表确定所在“块”的平均检索长度。
2.此方法突破了HASH表的平均检索长度是装填因子(=(表中填人的记录数)/(哈希表的长度)的函数,而不是N的函数的弱点。
3.在理想情况下,即数据完全是均匀分布的情况下,本算法的平均检索长度可达理论极限值ASL=1。即使是在最坏的情况下,当N个数据经HASH函数转换后的地址均相同,所有数据均落在同一个“块”中,其平均检索长度ASL也只会下降到二分检索法时的平均检索长度。
4.本算法对于均匀分布的数据是极为有效的,通过计算得出其平均检索长度小于1.352(N>100时),因此检索效率很高。
5.本算法中的步骤HS1~HS12仅仅是为检索作的准备工作,相当于初始化的工作,只需在检索开始时做一次即可。
6.实验结果。为了对本检索算法的检索效率进行验证,我们用VB6.0编写了本算法以及二分检索法的程序,将二种检索算法的平均检索长度进行实际测定,实验中所用的数据由VB6.0的随时函数产生,数据的范围为(0~10000),实验结果如下表所示:
VB6.0程序二种检索算法平均检索长度对比表
我们在实验中测定平均检索长度时,通过程序对所有数据逐个检索,统计出检索完所有数据需进行比较的总次数再除以数据总数后得出。上表中当N=100时,本算法实际测定的值(1.38)与理论计算(1.352)略有误差,原因是我们用VB6.0中的随机函数产生的随机数在数据量较小时分布不一定很均匀。从表1中可以看到:当数据量稍大一些(N>100),本算法的平均检索长度的实测结果完全与理论分析一对致,并且远小于二分检索法的平均检索长度。本算法的平均检索长度随着数据量N的增加几乎不变。
科学文化素质,它是指个体学习和掌握系统的科学文化基础知识,尤其是现代科学文化的最新成果,形成合理的知识结构;获得基本技能、发展智能和能力(具备观察能力、记忆能力、想象能力、思维能力、自学能力、表达能力、组织协调能力,尤其是创造能力和动手操作能力),不仅乐于学习,而且形成会学习,具有求知欲望和勇于探索的精神。通过信息检索课程教育,授予“鱼”与“渔”,使其具有独立的思考能力与创新能力。努力全面培养受教育者的科学精神与人文精神,使二者密切结合,相互促进。[5]在着眼于基本素质的整体培养和发展,立足于更加综合、多元、全面的教育因素的同时注重共性和个性的辩证统一。
我国在2010年的《国家中长期教育与改革发展纲要(2010-2020年)》中强调了因材施教,鼓励个性发展,不拘一格培养人才,强调素质教育。提高受教育者的个性素质是素质教育的重要内容,培养个性素质的最佳途径是实施主体性教育,开展个别化教学。通过信息检索课程教学的差别化引导,促使个性由量变到质变的突破,与思想道德素质、科学文化素质并举。
图书馆信息检索课是获取和培养全面的信息素养的重要途径。使信息检索课程教育从辅、零重视到普遍性、基础刚性需求地位的转变;以教师为主到以学生自主、教师为辅的教学互动的模式的转变;从枯燥的技术技能教学向多元的教学内容转变;力争使接受教育者从被动学习到主动学习、创造性学习的态度的转变。受教育者每个人都是独立的个体,在身体和心理素质、遗传、兴趣等方面都各不相同,所表现出来的接受能力、学习能力也不尽相同,因此要注意学生间的个体差异。在教学中,应坚持“以人为本,因材施教”,避免“一刀切”的传统教育模式,进而引导受教育者的兴趣、激发学习和创造热情,从而充分发挥各自潜在能力与特长。
2检索用信息源选择
对于基础理论、工艺研发类化工科技查新项目,可以选择以期刊、专利文献数据库为主的检索系统。因为理论研究、工艺技术研究成果大多于期刊论文、会议论文、专利说明书上。笔者近日受理了一项题为“2-氯烟酸闭环法生产工艺”的科技查新委托项目。通过咨询项目委托人、阅读项目研制报告书、检索《化工辞典》等数据库后,分析判定,该项目是属于化工领域的工艺技术研发项目,并了解到项目产品属医药和农药中间体。可以初步选择CNKI、维普、万方期刊文献型数据库,会议论文数据库,专利文献数据库,科技成果类数据库等信息源。
3检索策略制定
#1.(2-氯烟酸+2-氯尼酸+2-氯-3-吡啶甲酸)
#2.#1*烟酸*闭环法
#3.#1*闭环催化剂
#4.#1*(废水零排放+废水封闭循环)
检索结果表明,河北亚诺化工有限公司等生产厂家、大学研究机构进行了2-氯烟酸合成工艺研究。其中,河北亚诺化工有限公司以2-氯-3-甲基吡啶为原料,通过高锰酸钾的氧化来制备2-氯烟酸,产率提高到65%。西安近代化学研究所、陕西师范大学用烟酸经双氧水氧化后再用POCl3/PCl5氯化得到2-氯烟酸。氯化时不加水,先加入POCl3,于100℃~110℃反应1h后再加入PCl5回流反应,收率95%,总收率87.5%。
在化工产品类项目的科技查新中,除了使用期刊、专利文献数据库外,还要重点使用Web搜索引擎等检索系统。譬如,笔者在接受查新委托项目“电子级异氰脲酸三缩水甘油酯(TGIC)”时,首先考虑项目产品属性,是强调工艺方法还是产品技术参数,具体的查新点,以及国内有无专利等问题。因此首先选用文献型数据库,设计检索式:
#1.(异氰脲酸三缩水甘油酯+异氰尿酸三缩水甘油酯+异氰酸三甘油脂二聚物+三异氰尿酸酯+TGIC)
#2.#1*(电子级+99%纯度+超细+氯含量)
#3.#1*(粉末超细比+深冷粉碎)
总之,国内有生产厂家研制生产出异氰脲酸三缩水甘油酯,但多为普通级TGIC。而本项目通过改进合成、环化工艺,采用深冷粉碎、无水工艺分离盐等技术,实现了电子级TGIC;产品纯度提高到99%以上,氯含量小于650ppm,粉末超细比≤10μm。目前,除本项目产品外,国内尚未见有生产厂家研制生产出电子级异氰脲酸三缩水甘油酯产品的文献报道。
4结语
综上所述,制定化工科技查新信息检索策略,需要对化工科技查新项目进行技术分析,理解项目主要概念、分类归属、技术特点、技术创新等。据此,考量选择相应信息检索系统,进而统筹考虑检索步骤,应用所掌握的检索技巧,设计出科学合理的一系列检索式,并不断在信息检索过程中加以调整,直至查询获取满意的检索结果为止。
参考文献
[1]谢新洲,等.科技查新手册[M].科学技术文献出版社,2004.
【关键词】GPU信息检索CUDA
前言
多媒体技术与多媒体网络,为当前信息时代提供文字、数据、语音、图形、图像和音乐等多种信息方式,计算机在处理信息时所面临的主要问题是如何合理提高检索速度,实现多媒体信息流的结构化,方便检索。人们曾经将图形、视频等需要大量运算的功能都交与CPU完成,但用户对图形计算方面的需求不断的超出了CPU在计算能力方面的发展速度,需要一个专门的图形的核心处理器。GPU的出现填补这一空缺,它是相对于CPU的一个概念,GPU英文全称GraphicProcessingUnit,“图形处理器”。GPU是显示卡的“大脑”,GPU具有强大的计算能力,它将能处理的问题由图形领域扩展到了通用计算领域[1]。使可编程图像处理器发展成为计算技术领域的主力,与CPU上的串行算法相比,采用基于GPU平台检索算法最高可获得百倍以上的性能提升。已经冲击并超越CPU独霸的地位。
1.GPU的计算方法
2.基于关键词的Web图像搜索
3.基于GPU平台的检索方法
GPU作为一种加速工具不但应用到高性能通用计算领域,也可应用于Web图像搜索领域。在文本索引中两有个关键算法:排序和查找。GPU上都能实现。对于排序算法,首先通过CPU的快速排序方法把等待排序的数据分成多个子序列,然后根据文本索引中数据结构的特点,在GPU上对子序列进行局部排序。完成在共享存储器和显存上的归并过程。GPU上的查询主要利用GPU的SIMT的特点实现多数据并行查询。基于GPU平台的信息检索过程为:一通过分析图像搜索系统中模块的执行流程,在CPU-GPU集群服务器上可以构建基于内容的图像搜索系统。二利用GPU上的图像文本语义抽取功能把信息分成多个块,利用信息子块的视觉局部特征和属性提示来进一步精确提取图像的文本语义信息。三对GPU上数据处理流程及编程模型在显存中构建层次型数据。四以数据流控制降低CPU相对GPU的数据处理速度的落差。五利用GPU的优化特性,采用自适应线程分配的方法完成由线程到数据的映射。基于GPU的信息抽取算法方法,能够使图像的文本语义信息描述更加细致完整,系统的功能和性能获得很大提升。
4.结论与展望
GPU已经突破了很多技术屏障,在信息检索、数据挖掘计算机病毒码匹配和生物基因技术领域中都有应用。相对于CPU,以同样的市场价格选用更高计算能力的GPU是可行的。支持CUDA的GPU可以成为是由若干个向量处理器组成的超级计算机。GPU的架构还会不断优化,被越来越多的大型计算采用,在以后的研究中还要对GPU的分支预测能力进行分析,建立简单的GPU性能模型,对于复杂的分支预测、控制流、数据流等方面,开发适合GPU的算法,以此来充分发挥GPU在图像搜索领域的检索能力。
基金项目:吉林省教育厅“十二五”科学技术研究基金资助项目(吉教科合字[2012]第371号)
参考文献:
[1]MacedoniaM.TheGPUEntersComputing'sMainstream[C].IEEEComputer.MichaelMacedonia,2003,36(10):106~108.
[2]吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504.
[3]MarkWR,GlanvilleRS,AkeleyK.AsystemforProgrammingGraphicsHardwareinaC-likeLanguage[J].ACMTransGraph,2003,22(3):896-907.
[4]JohnD.Owens1,DavidLuebke,etal.ASurveyofGeneral-PurposeComputationonGraphicsHardware[J].ComputerGraphics,2007,26(2):80-113.
一、前言
计算机的日益普及和计算机技术日益成熟,使得计算机在工业控制监测中的应用渐渐深入。但工业应用不同于其它方面,它要求有较强的实时性。现在有很多的DOS软件在运行过程中通过挂接外部中断方式实现DOS应用软件与外设的实时通信,这种方法实现起来十分简单。而在Windows中应用程序能否也能够利用外部硬中断实现外设与Windows应用程序的实时通信呢答案是肯定的。这里的关键是要解决好中断代码与Windows应用程序相互之间交换信息的问题。
实现Windows应用程序响应外部中断的方法有很多,如Microsoft公司自己开发的SDK、DDK软件包,使用嵌入式汇编等等。本文将介绍一种在BC++3.1的基础上利用Windows3.1拥有的一些功能实现Windows实时通信的实例。
二、中断代码的位置
在Windows中,几乎所有的异步事件都是由中断处理程序来管理的。中断处理程序包含在设备驱动程序中,由Windows在环境初始化中安装。例如,KEYBOARD.DRV、MOUSE.DRV和COMM.DRV均含有中断处理程序,以处理相应的键盘、鼠标和串行口的异步中断。可以仿照标准设备驱动程序,编写中断处理代码,以响应外设的通信请求,从而完成一次实时通信。
中断代码既可以包含在应用程序的可执行代码中,也可以包含在动态连接库(DLL)中。包含在应用程序中的代码只能在一个程序中使用,而在动态连接库中的代码则可以在Windows系统中所有的应用程序所共享。这样不仅在整个Windows系统中只有一个中断代码的副本,提高了内存的使用效率,更重要的是可以防止由于同时存在多个中断代码的副本而发生冲突。本文将在DLL中编制中断处理程序。
当动态连接库被装入时,要调用DLL库的入口点LibMain(),利用这一点可以执行一些初始化工作,可以分配一些内存块,可以初始化一些全局变量或者静态变量,可以安装中断服务程序的代码等等。例如:
voidinterrupt(oldIsr)(--CPPARGS)
/*旧的中断服务程序地址*/
LibMain(HANDLEhInstance,WORDwDataSeg,WORDcbHeapSize,L
PSTR
lpszCmdLine)
{
…
oldIsr=getvect(IRQNum);
/*IRQNum指中断号*/
setvect(IRQNum,newIsr);
/*newIsr指新中断服务程序代码*/
return(1);
}
函数setvect()既可在实模式下,也可在保护模式下设置中断处理向量。
上述代码也可以放在一个由用户设置的引出(export)函数中,在应用程序中用户可以调用此引出函数来安装中断服务程序代码。
由于中断可以在任何时刻发生,中断代码必须驻留在内存中,并且在应用程序运行的过程中一直处于某一固定内存中。这一点无论是在实模式还是在保护模式下都是一致的。
在DLL的模块定义文件中应注意:
1.CODE语句为固定代码段,即FIXED;
2.EXPORTS语句要引出被应用程序和其它DLL用作入口点的函数。
三、通信机制
编写实时通信例程关键在于必须认识到,异步事件对应用程序的触发是异步发生的,不在Windows的消息处理机制和多任务范围内。为了使通信例程能够正确地工作,通信例程必须通知Windows有异步事件发生,且不能打断应用程序的任务管理或消息流。要作到这一点,通信例程必须通过调用PostMessage或PostAppMessage函数向应用程序的消息队列中加入一条消息。
需要注意的是,在DLL中调用PostMessage(HWNDhwnd,…)时,必须先确定hwnd的实际值,可以通过使用引出函数的办法来实现,如下所示:
staticHWNDhWndApp;
voidFARPASCALSetIsrWin(HWNDhwnd)
hWndApp=hwnd;
然后在应用程序的窗口函数中,对WM-CREATE消息进行处理时调用此函数来初始化DLL中的静态变量hWndApp:
CASEWM-CREATE:
SetIsrWin(hwnd);/*hwnd指应用程序窗口句柄*/
定义一个在应用程序中使用的消息:
#defineISRM-RUPTWM-USER+255最后在DLL中的中断服务程序代码中,调用PostMessage即可完成Windows应用程序和中断服务程序代码相互的信息交流:
voidinterruptnewIsr(--CPPARGS)
PostMessage(hWndApp,WM-RUPT,wParam,lParam);
四、程序实例
关键词:高校图书馆信息检索检索服务
0引言
随着网络技术的迅猛发展,通过互联网提供的数据库及种类日渐增多。使得人们对于文献信息的查询、加工、存储、利用等方面有了更新的要求。作为高校图书馆以组织加工数字化信息及技术为广大读者提供有效信息服务,信息检索服务一向是高校图书馆重要工作的组成部分,尤以为教学科研课题的检索服务尤其显得重要,提供的文献信息对保障科研工作顺利进行起到不可忽视的作用。信息检索服务就是把图书馆的馆藏资源和网络资源通过整合和有序化,进行全方位、多途径为教学科研及广大读者提供快、精、准的信息服务和信息导航服务,来满足广大用户的信息需求。
1信息检索服务对教学科研的保障作用
图书馆作为教学科研的重要基地以及文献信息中心,是高校办学的重要支柱。高校图书馆信息检索的服务对象是教师和学生两大用户群。而高校图书馆的文献资源建设要依据高校的教学任务、教师和学生的信息需求,以及设置的专业学科和所承担的教学科研任务相适应,满足特色专业、教学科研建设的需要。信息检索是科研创新的基础。科研工作者要想进行某项科学研究,必须了解国内外科技发展水平的新技术、新动向。随着科学技术的高度发展,学科之间出现的交叉渗透越来越多,只有深入了解研究科学发展规律与相互作用,才能提高科研工作的知识创新点,才能更好得为教学科研提供保障服务。
2信息检索的基本方法
高校图书馆信息检索的服务对象是教师和学生两大用户群。要为用户提供高效、准确、权威的信息资源,图书馆馆员需要充分利用自已的专业知识和长期积累的实践经验,依靠丰富的信息资源和强大的搜索引擎,灵活运用各种检索方式、技巧,来满足用户对信息的需求。针对用户需求进行分析是开展信息检索服务的基础。当图书馆馆员接到检索课题时,首先要和课题人进行交流探讨,对检索课题的主题结构、专业范围进行全面、正确的分析,弄清课题的内容实质及所涉及的主要概念及用户需要信息的具体内容。如用户需要的是文摘、索引还是全文等,以此来确定检索的范围。在掌握基本信息需求以后,还要对检索信息进行深度确定,只有这样才能确保检索信息的质量精准、到位。同时也是检索信息服务能否取得成功的关键。只有真正理解和把握用户的需求,信息检索服务与用户需求才能达到完整同一。
3提高检索技术向知识服务发展
总之,高校图书馆作为高校教学科研和读者服务的部门,必须进一步明确自身的定位,加强服务意识和创新服务举措,凭借自身在文献信息资源特有的行业优势,充分利用图书馆丰富的馆藏文献信息资源、特色数据库等资源,为教学科研工作提供优质、周到的服务,推动高校教学科研工作进一步的向前发展。
[1]杨玛萍.数字图书馆服务质量初探[J].科技情报开发与经济.2006(16).
[2]杨晓红.高校图书馆文献信息资源开发与服务创新[J].科技情报开发与经济.2005(21).
[3]刘芳兰.高校图书馆服务创新的探讨[J].湘潭师范学院学报.社会科学版.2005.(2).
[4]张玉峰.论知识检索与信息检索[J].中国图书馆学报.2003(5).
关键词:计算机;信息检索;应用;研究
1计算机信息检索特点分析
随着信息社会的到来,计算机的检索在各方面得到了有效的应用,信息服务行业已成为推动经济发展的重要行业和主要的组成部分,信息检索作为利用信息资源的有效手段,为管理和决策提供了有效的依据,与传统的手工检索相比,计算机信息检索:
1)查找迅速,反馈及时,资源共享。计算机的信息检索过程中,联机系统中的中央主机采用分时技术,系统对用户的响应只需要几秒。检索反馈较快,响应的系统还能根据反馈信息,进行检索策略的调整,网络检索实现了信息资源的共享,用户能通过互联网与各种文献信息进行连接,从而获取所需要的信息资料。
2)检索全面,主题广泛,实时性强。计算机的联机检索一般能提供数十个到数百个数据库的检索,涉及的范围较广,覆盖了人们社会生活的各个领域和各方面。而互联网的信息检索则能通过数量庞大的、且处于不断更新状态下的信息资源的检索获得自身所需要的信息。计算机联机系统的信息查询中,大多数数据库的更新为数周,而金融、科研、社会动态等方面的数据库则能实现实时更新,从而满足用户多样化的信息需求。
2计算机信息检索的途径
2.1联机信息检索
联机检索服务是当前信息产业的重要组成部分,目前已形成了新兴发展的产业,也就是联机检索工业。联机检索是指用户通过终端设备的利用,实现信息需求按照一定的规范上的查询语言和检索语句进行组织并投入信息检索,并实现了检索信息的有效反馈。实现人机之间的实时对话,从计算机系统的数据库中查找出用户所需要信息的过程。连接检索系统通常由中央主机、数据库和国际通讯网络等部分构成。联机检索系统开发与之配套的联机检索软件,并利用中央主机对信息进行储存、处理和检索,以及整个系统的运行和管理。计算机的联机系统具有多台主机,从而保障信息检索的稳定性。联机数据库则以特定的方式实现了信息是搜集、整理加工和存储,并数据库则以某一特定的方式对信息进行收集、整理、加工和存储,含有多种纪录类型的数据组合,是联机检索操作的直接使用对象,联机检索系统是通过为用户提供数据库进行信息的搜索服务。数据库中的数据信息包括数据的记录、聚合与数据项之间的关系。具有以下几个特点:
首先,存储的数据之间存在着一定的逻辑关系,首先,联机检索中的数据库之间的数据是相互关联的,各数据集或数据项支架存在不同层次的逻辑联系,由此,数据库在信息的存储过程中,不仅仅存储了信息数据本身,同时记录了各数据项之间的逻辑关系。其次,联机系统中的数据具有独立性,联机检索中的数据库存储了大量数据及其具有复杂逻辑关系的数据集合体,然而其存储方式与应用程序相比是独立的。当对数据库中的数据进行修改时,不会对应用程序造成影响。第三,数据实现了集中化控制。数据库可对数据的增加、删除、修改、检索进行集中控制和管理,去掉重复数据,提供多种保密性能。如可设置不同级别的通行字,使机密数据库或私人数据库受到严格保护。联机的检索系统建立了与外界体系相隔的防护体系,从而在各企业的发展过程中起到了重要的作用。
2.2网络信息检索
随着计算机技术和网络技术的迅速发展和广泛推广应用,世界范围内的信息交流和知识资源共享成为了可能,同时也给图书馆信息组织、信息检索以及信息的获取方式造成了较大的冲击和影响。计算机互联网成为了最大的信息获取基地。互联网不仅为人们提供了数量巨大且处于不断更新发展中的信息资源,同时也提供了信息资源的搜索和服务的工具。据统计,全世界已有186个国家和地区与互联网相联,网上有数亿网站和主页,联结了数千个大型图书馆、学术数据库、100万个信息网和几千万主机,上网人数达1亿。计算机互联网信息共享模式也为电子商务的发展创造了良好的平台,数字认证、基于Web的语言翻译等技术的发展致使计算机互联网上的网民迅速增加。相应技术的发展为信息的检索和发展模式提供了有效的技术支撑,为用户提供可靠、简单而快捷的信息服务。网络信息资源的利用和检索能有效地提高信息的利用和共享程度,通过多种方式的检索实现了信息资源的有效交流和发展。
互联网的发展在很大程度上改变了信息检索、信息获取的方式。网上动态信息,也就是结构化信息,已成为互联网上最为常见以及应用最为广泛的信息资源。用户通过信息搜索,建立了满足自身发展需要的信息资源。新的网络信息检索工具便应运而生。互联网上信息检索方法有几种:
1)浏览,即在日常的网络阅读、漫游过程中,意外发现有用信息。浏览方式的信息获取不具有较强的目的性,由此也难以获得有效的信息检索模式。
3)网络资源指南,专业人员对网络信息资源进行采集、整理、过滤控制等手段,开发出可供浏览检索的网络资源主题指南,尤其是针对各学科专业的网络信息资源的指南。
2.3网络信息检索特点
网络信息检索有如下特点:
1)扩宽了信息检索的空间。检索范围得到了有效的扩展,网络信息检索以互联网上是所有网络资源为检索范围。具备了其他信息检索方式不具有的优势。
2)实施交换式的作业方式。所有网络信息检索工具都具有交互式作业的特点,能够通过对用户命令的分析中了解用户的信息需求,反馈给用户需要的信息,计算机的网络检索还具有良好的信息反馈的功能,用户可以在检索过程中及时调整检索策略以获得更好的检索结果。
3)具有良好的用户界面友好和便利的信息检索和操作方式,网络检索采用交互式作业,系统透明、通用的Windows界面和符合大多数用户检索习惯的用户接口都使检索变得简单易行,网络用户不需要太多培训就能上手操作,使用自己熟悉的方式输入查询提问,就可以实现对各种系统数据库的访问、检索。而联机检索则需要学习和记忆一系列检索指令和规则,一般用户只能借助专业人员的帮助才能使用。
3结束语
计算机信息检索与传统的手工检索相比,具有良好的适应性,实现了高效的信息检索和利用模式,从而在企业、教育、政府的电子政务建设、电子商务的兴起和发展过程中奠定了有效的发展基础。计算机信息检索在各方面的应用反映了用户的多样化信息需求,而相应计算机检索的应用则在一定程度上反映了政府、企业以及各行业的发展需求,计算机检索体系为其发展创造了良好的技术支撑。
[1]魏海霞.计算机信息检索的方法、策略与技巧[J].情报探索,2009(5).
[2]蔡妍.当前高职院校图书馆读者工作的问题与对策[J].桂林航天工业高等专科学校学报,2010(2).
[3]朱宁贤.计算机信息检索技术与学生信息素养培养[J].科技信息:科学教研,2007(22).
[关键词]多语言信息检索信息可视化界面设计
[分类号]G354.4
1引言
2多语言信息可视化研究综述
多语言检索也能藉由用户友好的界面设计来满足用户需要,Petrelli设计了一个以用户为中心的多语言信息检索系统(cross-lingualinformationretrievalsys-ten)模型,并要求用户对模型提出更改建议,然后根据用户的建议将检索系统重新设计一次。通过这样的使用测试他发现用户的一些偏好,包括:①虽然显示翻译过程可以让用户更容易修改查询词,但是他们还是比较希望能直接看到检索结果;②不同文化背景的用户会用不同的检索词,对结果也有不一样的期待;③对语言的了解可以增进检索结果的精确度。这个系统在设计时与用户互动,透过结果可知道了解用户需求对系统设计者来说是很重要的,而且除了文化背景、语言程度及用户的其他特性之外,界面设计也能影响系统的好用与否。Petrelli的研究突显出了解用户意见的重要性,在没计系统界面的同时也必须收集用户资料、了解用户习惯,并且在设计用户界面时考虑这些信息,此外,其他研究者整理出的用户需求也能作为系统设计的参考。下面总结以上几种多语言搜索研究的成果,如表1所示:
3多语言信息检索系统可视化设计
本研究的系统设计结合信息可视化和多语言检索。研究之中所运用的理论包括信息可视化概念以及满足不同语言检索界面的设计需求。本研究的目标包括:信息可视化;设计合适的用户交互界面;支持双语的呈现。
列式的排序方式而分散在大量的检索结果之中,或是因为不同语言检索结果交互出现而产生混乱。以谷歌检索为例,就算在语言偏好处设定检索结果的语言,和检索词相同语言的检索结果还是会自动排序在靠前位置。如果将语言也当做检索结果排序或呈现的一种选项,应该能更符合用户的需求。此外,对于不同语言的支持也是影响检索结果的另一个重点。
本文的研究将检索界面的设计加入信息可视化技术,让检索结果能够更有组织地呈现出来,也更能够满足多语言检索的需要。而要达到这个目标需要满足下面三个要点:①在界面设计上必须同时满足多种语言的使用习惯,并且考虑到多种语言不同的使用特性。例如英文是一个词一个词分开,中文却是每个字都有自己的意思,而且中文字的构造比英文相对复杂,如果字型太小会难以辨识。②要提供翻译或是语言选项来支援多语言服务,让用户可以选择查询词的语言和检索结果的语言。③将检索与合适的信息可视化系统结合,但要考虑到使用的便利性,不要过于复杂。此外,系统的信息检索与分类功能也是很重要的一环。要完成这样的研究必须将检索引擎的多语言检索结果使用图形化展示,让用户能够自行调整检索结果,并且使简洁的界面产生最大的功能。此外,未来也可在这样的系统里结合翻译以及检索优化的功能。
4多语言信息检索系统可视化界面原型
综合以前学者所做的研究分析,并且依据多语言检索和信息可视化的概念,多语言检索要具备多语言使用的翻译与协助功能,并结合图像与资料,本文设计了一个多语言检索可视化界面见图1。
这个设计是以容易理解与使用便利性为优先考量的界面,且拥有以下的特点:①将不同语言的检索结果呈现在同一个界面上;②能将检索范围依据检索结果延伸或是缩小;③将检索结果做简易的整理;④引导用户做进阶检索。
4.1将不同语言的检索结果呈现在同一个界面上
4.2能将检索范围依据检索结果延伸或是缩小
4.3将检索结果做简易的整理
多语言检索的结果资料笔数会更多,种类也会更繁杂,因此界面的简洁与容易了解是很重要的。本界面设计不仅能清楚地列出中文和英文的检索结果,也将检索结果做了概略的分类,增加用户浏览时的效率。
4.4引导用户做进阶检索
在界面上可以看到关键字的翻译,例如输入检索词“春天”时也会同时显示英语翻译(spring)的检索结果,因此用户能够把关键字修正得更符合他们的想法。例如用户其实想知道关于春天酒店或是春天旅游的资料,也可以藉由可视化显示看到各个检索结果之间的关联性,用户可以借此让检索更符合他们的需求。
5未来发展方向
本研究为用户设计了一个可以简易整理与探索多语言检索结果的界面,也提供用户更多可以自行更改的选项。在将来的检索系统界面以及信息可视化设计中,研究者还可以将此系统界面设计朝以下几个方向发展:①将双语可视化技巧应用于不同检索结果中;②与翻译或是摘要功能相结合;③依据用户研究结果改进设计等。
5.1将双语可视化技巧应用于不同检索结果中
目前只将同一个检索系统中的中英文检索结果在同一个界面整合,并且使用信息可视化技巧呈现。这种做法不但可以帮助用户整合检索结果,也便于比较和深入了解检索结果。未来更先进的系统设计可以提供更多的语言选项,也能与更多检索系统合作,让用户能自订检索引擎,将多语言检索界面应用到符合他们需求的检索结果之中。如此,不但可以扩大多语言检索界面的应用范围,让检索结果更符合用户需求,也让此设计的使用更具灵活性。
5.2与翻译或是摘要功能结合
将多语言检索结果展示在同一个界面上之后,用户能借此机会对比双语检索结果并修正关键字,不过对于非母语的多语言检索不只需要展示和简易的分类功能,更需要翻译和语言方面的协助。此外,翻译功能也能协助用户了解不同语言的网页内容,进而将检索范围做适当的延伸或缩小。多语言检索在信息爆炸的现在是一种趋势,然而用户对于其他语言的了解可能无法满足他们对于多语言信息的需求。因此翻译或是简易的摘要功能都会有所帮助。
3因特网上查找医学信息的其他途径
通用搜索引擎提供的是包罗万象的查询,为了快速、准备的获得所需的医学信息,需要选择适当的检索策略。如选择合适的关键词,缩小或扩大检索范围等。
网络信息的多样性、分散和无序,影响了网络信息的检索质量。2001年出台的MPEG-7国际标准解决了多媒体信息描述的标准问题,实现了快速有效的搜索。标准化是网络信息检索的根本性技术保证。[1]智能检索是基于自然语言的检索形式,它把现代人工智能的技术与方法引入信息检索系统,机器根据用户提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,使信息检索系统具有一定程度的智能特征,在更高的层次上完成其功能。[2]因此,网络医学信息检索将向着规范化、智能化的方向发展。
网络与数据库的应用与发展,为医学的快速发展提供了条件。在网络时代,充分利用信息资源是实现医学事业快速发展,提高医疗水平的关键因素之一。了解现存的信息获得途径,并掌握合适的医学信息检索方法,对医务工作者具有重要意义。