(白城师范学院计算机科学学院,吉林白城137000)
关键词关系数据库;数据仓库;数据挖掘;关
0引言
关系数据库是20世纪70年代初提出来,经过数据库专家几十年的努力,理论和实践都取得了显著成果,标志着数据库技术的日益成熟。但它仍然难以实现对关系数据库中数据的分析,不能很好地支持决策,因此在80年代,产生了数据仓库的思想,90年代,数据仓库的基本原理、架构形式和使用原则都已确定。主要技术包括对数据库中数据访问、网络、C/S结构和图形界面,一些大公司已经开始构建数据仓库。针对数据仓库中迅速增长的海量数据的收集、存放,用人力已经不能解决,那么数据仓库中有用的知识的提取就需要数据挖掘来实现。数据挖掘与统计学子领域“试探性数据分析”及人工智能子领域“知识发现”和机器学有关,是一门综合性的技术学科。了解关系数据库、数据仓库与数据挖掘三者之间的区别与联系,使之更好的使用这3种技术,处理各种信息需求是非常必要和重要的。
1关系数据库、数据仓库和数据挖掘之间的关系
1.1关系数据库和数据仓库之间的联系与区别
关系数据库是面向事务的设计,数据仓库是一个面向主题的设计;关系数据库存储在线事务数据,数据仓库通常存储历史数据,关系数据库的设计将尽量避免冗余,但数据仓库是倾向于引入冗余;关系数据库设计用于捕获数据,数据仓库设计用于分析数据。传统的关系数据库面向以事务处理为主的系统应用,所以它无法满足决策支持系统的分析要求。事务处理和分析处理有非常不同的性质,他们有不同的需求数据。
1.2数据仓库与数据挖掘之间的联系与区别
数据挖掘是基于数据仓库和多维数据库中的数据,找到数据的潜在模式进行预测,它可以对数据进行复杂处理。大多数情况下,数据挖掘是让数据从数据仓库到数据挖掘数据库中。从数据仓库中直接得到进行数据挖掘的数据有许多优点,因为数据仓库中数据的清理和数据挖掘中几乎是相同的,如果数据在数据仓库中已被清除,数据挖掘中不再被清除,并且数据不一致也得到了解决。数据仓库是数据挖掘的先期步骤,通过数据仓库的构建,提高了数据挖掘的效率和能力,保证了数据挖掘中的数据的宽广性和完整性。
1.3关系数据库与数据挖掘之间的联系与区别
数据挖掘的数据源不一定是数据仓库。也可以是一个关系数据库中的数据,但要事先进行数据预处理,才能用于数据挖掘。数据预处理是数据挖掘的关键步骤,并且是数据挖掘过程中的主要工作部分。因此,数据仓库和数据挖掘没有必然的联系,有些人简单地认为,数据仓库是数据挖掘的准备,这种理解是不全面的,也可以使用关系数据库中的数据作为数据挖掘的数据源。
2三种技术的应用
2.1应用价值
2.1.1关系数据库
关系数据库的主要价值体现在事务处理。关系数据库已经渗透到各行各业的日常事务,该事务管理离不开关系数据库的应用系统,这是对传统事务管理的一个重大突破,是社会甚至家庭不可或缺的工具,它对社会的应用价值是100%。
2.1.2数据仓库
2.1.3数据挖掘
面对日益激烈的市场竞争,客户对迅速应答各种业务问题的能力要求越来越高,对过量数据的及时处理要求越来越高,带来的挑战一方面大规模、复杂数据系统让用户感觉漫无头绪,无法开始;另一方面,这些大量数据背后隐藏很多有意义的有价值的决策信息。如计算机界都熟知的“啤酒与尿布”的故事,就是零售业巨头“沃尔玛”从大量销售数据中分析出来的规律:美国的男士在下班要去超市买婴儿尿布,同时他们还会买啤酒。“沃尔玛”就把这两种“毫不相干”的商品摆放在靠近的货架上,并且还摆放一些下洒小菜,使这些商品销量大增。所以应用数据挖掘从大量数据中发现规律,具有具体的指导意义。
2.2应用领域
2.2.1关系数据库
关系数据库应用领域非常广泛,如:证券行业、医院、银行、销售部门、公司或企业,以及政府、国防工业,科学和技术发展领域等等,这些领域都需要使用数据库来存储数据。例如:人事管理系统、工资管理系统,xxx部门信息管理系统,手机话费管理系统等,都需要关系数据库作为后台提供数据源。
2.2.2数据仓库
数据仓库应用领域主要有两个方面:一是全局应用。因为数据仓库获得来自多方面的数据,所以在把数据向数据仓库输入时,要进行转换、计算和综合等集成处理。通过处理把来自不同地方的数据源转换成统一的格式,以促进全局应用。二是复杂系统。信息处理的要求越来越复杂,除了数据处理操作,如添加、删除、修改、和统计汇总,高级管理层也希望对历史的和现在的数据进行各种复杂性分析,以支持决策。数据仓库中就是存储了旧的历史数据,方便复杂分析、应用,为高层决策服务。
2.2.3数据挖掘
数据挖掘的应用领域主要表现在特定应用问题和应用背景。数据挖掘技术已经应用于各行各业,如电信,保险,交通,学校、银行、超级市场等。例如:数据挖掘技术应用在大学。高校扩招,学生增加到几万人,但是学生的学习积极性不高,成绩不好,因此引入数据挖掘技术找出影响学生学习积极性和学习成绩的原因,制定措施,提高教育和教学质量。分析的数据源是考试成绩和成绩之外的影响因素,分析的方法是采用关联规则、模型库、去“噪”处理、粗糙集等进行数据挖掘,得出的结论是:传统的学习方法不能完全满足需要,改进教学方法和教学模式,从而调动学生学习的积极性,提高教学质量。
3关系数据库、数据仓库与数据挖掘的融合
参考文献
[1]华冠萍.数据仓库、数据挖掘及OLAP之两两关系[J].福建电脑,2007,8.
[2]牛承珍.马季兰.浅谈数据挖掘应用[J].山西科,2008.5.20.
目前世界上许多跨国信息技术行业的公司都在开发基于SaaS的产品和服务,为未来互联网的发展提供技术平台,而电子商务是近年来互联网应用最受瞩目的领域。因此SaaS模式的普及必将对电子商务的发展产生深刻的影响。
正如10Gen工程副总裁GeirMagnusson所指出那样,在未来我们将很难找到关系数据库的影子,这是因为关系数据库不适用于分布式环境。SaaS的普及要求我们必须重新审视我们做事的方式。
时下的许多新型数据库,包括Google的Bigtable,Amazon的SimpleDB,10Gen的Mongo,AppJet的AppJet数据库以及甲骨文开源BerkelyDB。这些数据库没有一个是关系型的。而这些数据库具有一些共同特征,就是都特别适用于服务云计算式的应用。它们中的大多数可以在分布式环境中运行,这意味着他们可以分布在多个地点的多台服务器上。它们本质上都不是事务性的,并且都牺牲了一些高级查询能力以换取更好的性能。在很多情况下,这些数据库可以通过对象调用来检索,而不用SQL。
关键词:对象关系数据库;面向对象;AMOSII
ANewGenerationofObject-RelationalDatabase:AMOSII
LIUYan-hong1,2
(1.NanjingInstituteofIndustryTechnologyInformationEngineering,Nanjing210046,China;2.NanjingUniversityofAeronauticsandAstronauticsCollegeofInformationScienceandTechnology,Nanjing210016,China)
Abstract:Object-relationaldatabasecanbecombinedwithasinglerelationaldatabasesystemandasingleobject-orienteddatabasesystem.Itovercomestheirlimitationsandisanewdirectionforresearchanddiscussion.AMOSIIisthelatestgenerationofobject-relationaldatabaseandhaspowerfulobject-orientedfeatures.Itprovidesthefeaturesandfunctionsthatalargenumberofnext-generationdatabaseshouldhave.ThecaseofAMOSIIfullyreflectstheadvancednatureoftherelationaldatabase.
Keywords:object-relationaldatabase;objectoriented;AMOSII
1引言
随着数据库技术的发展,原有的数据库系统很难适应新的应用领域中的复杂对象和这些对象的复杂行为的需求。新的应用需求推动了数据库技术的研究,其中最重要的研究方向之一就是使用一种与人们认识客观事物的过程一致的方法,这就是面向对象的方法。这种方法大大提高软件开发的效率。对象关系数据库是面向对象技术与数据库技术相结合的产物。
2对象-关系数据库
对象关系数据库兼有关系数据库和面向对象的数据库两方面的特征。即它除了具有原来关系数据库的种种特点外,还应该提供以下特点:
1)允许用户扩充基本数据类型。即允许用户根据应用需求自己定义数据类型、函数和操作符,而且一经定义,这些新的数据类型、函数和操作符将存放在数据库管理系统核心中,可供所有用户公用。
2)能够在SQL中支持复杂对象。由多种基本类型或用户定义的类型构成的对象。能够支持子类对超类的各种特性的继承,支持数据继承和函数继承,支持多重继承,支持函数重载。能够提供功能强大的通用规则系统,而且规则系统与其他的对象-关系能力是集成为一体的。
3新一代对象关系数据库的优势
3.1传统的关系数据库的缺陷
传统的关系数据库局限性为:
1)面向机器的语法数据结构,数据模型单一,数据类型简单、固定。
2)不能依据某一类型的数据类型来扩展数据类型。
3)结构与行为完全分离。
4)存储管理的对象有限,事物处理能力较差。
3.2新一代对象关系数据库的特征和功能
1)数据库应支持复杂的数据类型,并能存储和处理复杂对象。还要具备支持用户自定类型和可扩展能力。
2)数据库必须对其它系统开放。
3)系统必须具有可移植性,可连接性,可扩展性和可互操作性。实现程序设计语言和数据库语言的无缝的集成。
4AMOSII应用案例分析
AMOSII是最新一代的对象关系数据库,它充分体现了对象关系数据库的强大功能。
4.1学生课程成绩查询案例
4.2案例设计与分析
1)AMOSII具有面向对象数据库的特点。
在OODB中,用类来描述对象的结构特征和行为特征。它有下面的定义形式:
class<类名>[(参数表)]properties
{类的特征}
在本案例中课程和学生类设计如下:
createtypekechengproperties(
sidcharstring,//课程号//
snamecharstring,//课程名//
scoreinteger//期末成绩//
);
createtypestudentproperties(
tidcharstring,//学生号//
tnamecharstring,//学生姓名//
banjicharstring//班级//
创建kecheng的对象并且赋值用以下命令:
createkecheng(sid,sname,score)instances
:s1("01","Chinese",91),:s2("02","English",90),
…;
创建student的对象并且赋值用以下命令:
createstudent(tid,tname,banji)instances
:t1("08001","zhangsan","3ban"),
:t2("08002","lisi","4ban"),
函数设计举例如下:
createfunctiono_derect(studentnonkey)->asstored;
//输入参数student类,返回该学生所选课程的元组//
createfunctionsname(kechengnonkey)->charstringasstored;
createfunctiontname(studentnonkey)->charstringasstored;
createfunctiontid(studentnonkey)->charstringasstored;
以上定义的源代码保存在文件lyh.amosql中。AMOSQL类似于SQL语言。例如用下面命令对学生信息进行查询:
selecttin(x),tname(x),fromstudent(x);
在AMOSII中运行并得出结果,如图1。
这些类、对象、属性和函数的设计,充分体现了面向对象技术的特点。
2)AMOSII具有强大的可扩充功能。
AMOSII提供的Java函数的接口。在AMOSII中可以调用用户自定义的Java函数。
本案例用Java语言定义函数tongji()并保存在名为lyh.java的文件中。该函数的功能是接受输入参数为学生名,输出该学生所选择的课程名并统计出课程个数。
为了能在AMOSII调用该函数,需要在javademo.osql文件中添加下面的语句:
createfunctiontongji(charstring)->charstringasforeign"JAVA:lyh/tongji";
运行后如图2所示。
这充分体现了AMOSII允许用户根据应用需求自己定义数据类型、函数,具有强大的可扩展功能。
5总结和展望
综上,对象―关系数据库是面向对象技术与数据库技术相结合的产物。AMOSII是最新的一代对象关系数据库,具有强大的面向对象的功能。从学生课程成绩查询案例,可以看到AMOSII具有面向对象数据库的特点,允许用户根据应用需求自己定义数据类型、函数和操作符,具有强大的可扩展功能,体现了对象关系数据库的先进性。本文用具体案例介绍了在AMOSII中如何定义类,对象和函数,和如何调用Java自定义函数,实现统计函数的功能。
对象―关系数据库技术还处于研究发展阶段,在很多方面它还面临很多的挑战,例如对象―关系数据库还可以从面向对象数据库那里吸收养分和研究成果,如路径索引、对象聚集等。相信对象―关系数据库有着美好的发展前景。
参考文献:
[1]赵志升,许素文,杨小姝.对象――关系数据库管理系统及其特性与实现[J].电脑开发与应用,2002,15(8):47-48.
[2]王治.对象―关系数据库技术及其发展[J].九江师专学报:自然科学版,2003,22(5):86-88.
关键词:WebService;LDAP;关系型数据库;数据交互
中图分类号:TP311.52
LDAP目录服务主要实现对各业务系统用户账号的统一管理,而各业务系统大都建立在关系型数据库的基础上,因此要实现用户账号的统一管理,必须首要解决LDAP目录服务与关系型数据库之间用户数据的同步问题。本文要研究的即是一种利用webservice接口实现数据同步的技术。
1LDAP与关系数据库
1.1LDAP目录结构
LDAP目录服务与UNIX文件系统类似,按照树型结构来组织,称为目录信息树(DirectoryInformationTree,DIT)。LDAP协议本身和信息模型都是可扩展的,LDAP协议规定了信息的形式及特性、信息存放的索引和对象组织方式、分布式的操作模型。LDAP目录中可以存放文本、图片、URL、二进制数据等不同类型的数据。
LDAP树状信息中的基本数据单元称为对象,对象可以理解为关系数据库中表的记录。对象是具有标识名(DistinguishedName,DN)的属性集合,DN可以理解为关系数据库表中的关键字。属性可以由类型和多个值组成,LDAP中的属性可以理解为关系数据库中的域。域由域名和数据类型组成,在LDAP中为了便于检索类型,一个类型可以同时拥有多个值。
1.2关系数据库的数据结构
关系数据库最早是E.F.Codd于70年代初提出的,其理论建立在集合代数理论基础上。关系数据库的结构是二维表,由关系和元组组成。目前,主流的关系数据库有ORACLE、SQL、access、SQLServer、sybase等。
1.3LDAP与关系数据库的比较
与众多关系数据库一样,LDAP目录服务也可以进行查询与数据更新操作,但LDAP目录不具备关系数据库完备的关系运算处理能力,也不具备很强的数值计算能力。LDAP目录服务对数据对象建立索引,优化了对数据对象读取和搜索等操作,与普通关系数据库相比具有较高的检索效率。LDAP目录中的对象一般按照地理位置或组织关系进行组织,应用中非常直观。
1.4XML简介
可扩展标记语言(ExtensibleMarkupLanguage,XML)是一种允许用户对自己的标记语言进行定义的源语言,是标准通用标记语言的子集,提供了统一的方法来描述和交换独立于应用程序或供应商的结构化数据。
与Access、Oracle和SQLServer等数据库不同,XML数据库提供了更强有力的数据存储和分析能力,且表现形式极其简单,这就使得它易于在任何应用程序中读写数据,成为数据交换唯一的公共语言。本文研究的数据同步技术就是以XML作为介质实现的。
2数据同步技术
如何实现LDAP与关系数据库之间的数据同步?以典型的关系数据库ORACLE数据库为例,关系数据库之间的数据同步操作可通过数据库本身的触发器实现,数据源一旦触发数据更新操作,触发器会将更新的记录数据自动同步到目的数据库中。但是,LDAP目录服务是面向查询的,为了追求较高的查询效率,LDAP采用基于索引文件的平面存储方式,并且LDAP协议不支持触发器机制,LDAP协议对数据更新不是原子操作。因此,要实现LDAP与关系数据库的数据同步,需解决以下两个问题:一是,实现LDAP目录与关系数据库之间的数据格式转换;二是实现LDAP目录服务向关系数据库的更新触发机制。
2.1数据格式转换的实现方法
LDAP目录的数据文件为.ldif格式的文本文件。关系数据库无法直接与此类文件进行交互。为解决以上问题,可采用XML作为中间文件。当LDAP目录对象的数据发生变化后,将增量数据转化为XML格式文件,之后再将XML文件导入关系数据库实现LDAP目录服务到关系数据库的数据更新。
2.2LDAP更新触发的实现方法
3结束语
通过Tomcat监听和webservice接口调用,可以实现将LDAP目录中更新的对象传输到关系数据库ORACLE表记录中,此方法是使用解决了异构数据源的数据交互问题,实现了LDAP到各业务系统用户账号的统一管理。
[1]宗士强,林剑柠,朱双华.LDAP目录服务同步[J].计算机与现代化,2010(10).
[2]逯文晖,郑晓薇,顾慧.目录于关系数据库的分层映射数据集成模型[J].计算机工程与设计,2010(21).
[3]武静.身份管理技术现状与对策[J].电信网技术,2009(03).
[4]封明玉,赵政,张钢.分布式环境下数据冲突及其解决方案[J].计算机应用研究,2002(02).
关键词:计算机网络设计关系数据库技术应用
在整个经济全球化趋势的影响下,我国关系数据库技术已经被广泛应用于不同行业,特别是在今天技术飞速发展的时期,因此,只有不断提高整个关系数据库技术的质量和水平,才能够促进我国计算机网络设计事业又好又快发展。
1关系数据库技术概述
1.1关系数据库技术内涵
所谓关系数据库技术,主要是指在原有数据库技术的基础上,进行创新和改造,将新型技术融入其中成为一种辅助手段,尤其是将关系数据库技术广泛应用于整个计算机网络设计中,其优势是显而易见的。最早的关系数据库技术主要是用于制作一些表格和模型,通过不断丰富其内容和形式,建立成数据库。从那时候其数据库技术就已经具备了描述的特点,然后人们经过后期的处理和整合就能够将其存储下来,因此,当人们在进行提出数据的过程中,是不需要重新组合改造的,只要将有用的数据进行管理即可,这样也能够提高整个关系数据库技术的质量和水平,使其具备某种发展特性,我国最常见的数据库有:SQL、access等。
1.2关系数据库技术的辅助功能
2计算机网络设计中关系数据库技术应用原理
由于我国数据库技术的种类众多,因此,在整个计算机网络设计中,可以根据不同的模式分为不同的类型,例如:模型数据库技术、层级数据库技术、网络数据库技术以及关系数据库技术等,但其中最为完善、最为全面的就是关系数据库技术,因为其拥有十分科学的数据模型,能够完成各种复杂繁琐的任务,与此同时,其应用的系统和操作简单、容易,这样不仅能够为人们提供完成的编程程序,同时还能够将其广泛应用于计算机网络设计中。在整个关系数据库技术发展的过程中C语言起到了十分重要的作用,它不仅能够满足关系数据库实际发展的需求,还能够优化计算机网络设计的效果,其基本原理如下:
由于在整个计算机数据软件系统中主要是包括了连接性和访问对象两个方面,这两个方面都是单独面向广大计算机用户的,但是其中开放数据库其能够对SQL语言进行自由定义,还能够对C语言的进行定义,这样就可以通过C语言进行访问,但是其中加入了驱动器,这就大大降低了数据库的访问频率。而数据库访问对象则提供了整个数据库信息,当访问对象构成了多个结构并且形成了一个体系之后,就能够实现多接口的访问,从而提高整个数据库技术的质量和水平,C语言也能够顺利摆脱软件进行编程,从而使整个数据库成为独立的,充分发挥了其优势[2]。
3现阶段关系数据库技术存在的问题
虽然我国关系数据库技术已经发展到一定阶段,并且有了实质性的突破,被广泛应用于整个计算机网络设计的过程中,但其仍然存在诸多难以解决的问题,具体表现如以下几点。
3.1关系数据库管理不到位
3.2关系数据人员操作不规范
现阶段我国关系数据库人员操作十分不规范,存在被病毒入侵、数据遗失、以及操作系统失联等多种问题,这不仅会影响到整个关系数据库的稳定性和安全性,还会制约关系数据库技术水平的提高,严重影响了其在计算机网络设计中的应用。如果一旦没有做好防范工作就会给黑客等可乘之机,从而严重威胁了整个计算机数据库的安全性和稳定性,其危害十分大。
4计算机网络设计中关系数据库技术应用策略
4.1加强关系数据库技术安全管理
4.2提高关系数据库技术鉴别能力
每个不同的关系数据库都有其自身的特点,能够对用户的标识进行鉴别和检测,这也是计算机网络设计中的重要内容之一,随着我国科学技术水平的不断提高,鉴别关系数据库的方法也逐步增多,主要是利用身份证信息进行鉴别,利用身份证的数字进行变化鉴别,回答密保口令,随机抽取身份证数据等方式,从而优化整个计算机网络设计的内涵,为其设计提供新的发展思路。在整个过程中要不断创新传统的关系数据库技术,真正做到与时俱进、开拓创新,在实践的基础上创新,在创新的基础上实践,从而提高整个计算机网络设计中关系数据库的质量和水平,将二者有机进行结合[3]。
5结语
综上所述,随着我国科学技术的广泛发展,计算机技术水平的不断提高,因此,将关系数据库技术广泛应用于计算机网络设计过程中其优势是显而易见的,通过加强关系数据库技术安全管理、完善关系数据库技术访问系统、提高关系数据库技术鉴别能力以及提升关系数据库技术人员素质等方法和措施,能够进一步提高我国计算机网络设计的质量和水平,优化计算机网络设计的效果,真正发挥关系数据库技术的优势,从而促进我国计算机行业持续健康发展,实现计算机行业经济效益和社会效益的最大化。
[1]刘建国.关系数据库技术在计算机网络设计中的应用[J].石油仪器,2001,15(3):43-46.