大型数据系统是一个需较大的内存来支持的数据库管理系统内核。对设备和技术要求较高。国际国内的大型数据系统有ORACLE、SYBASE、INFORMIX和INGRES。这些产品都支持多平台,如UNIX、VMS、 WINDOWS,但支持的程度不一样。在下面的分析中会比较他们的平台支持能力。IBM 的
DB2也是成熟的
关系型数据库。但是,
DB2是内嵌于IBM的 AS/400系列机中,只支持OS/400操作系统。
大型数据系统
商品化的数据库管理系统以
关系型数据库为主导产品,技术比较成熟。面向对象的数据库管理系统虽然技术先进,数据库易于开发、维护,但尚未有成熟的产 品。国际国内的主导关系型数据库管理系统有ORACLE、SYBASE、INFORMIX和INGRES。这些产品都支持多平台,如UNIX、VMS、 WINDOWS,但支持的程度不一样。在下面的分析中会比较他们的平台支持能力。IBM 的
DB2也是成熟的关系型数据库。但是,
DB2是内嵌于IBM的 AS/400系列机中,只支持OS/400操作系统。
Oracle
Oracle是以高级SQL为基础的大型关系数据库,通俗地讲,它是用方便逻辑管理的语言操纵大量有规律数据的集合,是目前最流行的客户/服务器(Client/Server)体系结构的数据库之一。
Oracle具有如下特点:
①Oracle 7.X以来引入了共享SQL和多线索服务器体系结构。这减少了Oracle的资源占用,并增强了Oracle的能力,使之在低档软硬件平台上用较少的资源就可以支持更多的用户,而在高档平台上可以支持成百上千个用户。
②提供了基于角色(Role)分工的安全保密管理。在数据库管理功能、完整性检查、安全性、一致性方面都有良好的表现。
③支持大量多媒体数据,如二进制图形、声音、动画以及多维数据结构等。
⑤提供了新的
分布式数据库能力。可通过网络较方便地读写远程数据库里的数据,并有对称复制的技术。
MySQL
MySQL是一个精巧的SQL数据库管理系统,虽然它不是
开放源代码的产品,但在某些情况下可以自由使用。由于它的强大功能、灵活性、丰富的应用编程接口(API)以及精巧的系统结构,所以它受到了广大自由软件爱好者甚至是商业软件用户的青睐,特别是与Apache和PHP/PERL结合,为建立基于数据库的动态网站提供了强大动力。
MySQL是一个真正的多用户、多进程SQL数据库服务器。SQL是世界上最流行的和标准化的数据库语言。MySQLd是一个客户机/服务器结构的实现,它由一个服务器守护程序MySQLd和很多不同的客户程序和库组成。
自1996年以来,它的环境已经超过40个数据库,包含10 000个表,其中500多个表超过700万行,这大约有100 GB的关键应用数据。MySQL建立的基础是业已用在高要求的生产环境多年的一套实用例程。尽管MySQL仍在开发中,但它已经提供一个丰富和极其有用的功能集。
Microsoft SQL Server
SQL Server是一个关系数据库管理系统,它最初是由MicrosoN、Sybase和Ashton—Tate 3家公司共同开发的,于1998年推出了第一个0S/2版本。在Windows NT推出后,Microsog与Sybase在SQL Server的开发上就分道扬镳了。Microsoft将SQL Server移植到Windows NT系统上,专注于开发、推广SQL Server的Windows NT版本;Sybase则较专注于SQL Server在UNIX操作系统上的应用。
使用Microsoft SQL Server 2000的最新增强功能可以开发数据库解决方案。建立在SQLServer 7.0可扩展基础上的SQL Server 2000代表着下一代Microsoft.NET Enterprise Servers(企业服务器)数据库的发展趋势。SQL Server 2000是为创建可伸缩电子商务、在线商务和数据仓储解决方案而设计的真正意义上的
关系型数据库管理与分析系统。
Microsoft针对包括集成数据挖掘、OLAP服务、安全性服务及通过Internet对多维数据集进行访问和链接等在内的分析服务提供了新的数据仓储功能。
电子商务解决方案对数据库应用程序提出了更高要求。除了提供电子商务所需的可伸缩性与可扩展性之外,SQL Server 2000还提供了丰富的数据库编程能力——基于Web标准——以确保系统的协同工作和灵活性。与此相关,SQL Server 2000还将丰富的扩展标记语言(XML)、Wodd Wide Web Consortium(万维网社团,W3C)标准支持、利用Transact SQL(TSQL)实现的XML数据操作能力、灵活而强大的Web分析功能以及使用HyperText TransferProtocol(HTTP,
超文本传输协议)进行的安全web数据访问等新特性包含在内。
SQL Server已成为颇受众多客户关系管理(CRM)应用程序、商务智能(BI)应用程序、企业资源计划(ERP)应用程序及其他在线商务应用程序厂商和客户所青睐的数据产品,而这些主要应归功于该产品在对称多处理(SMP)硬件方面所具有的可伸缩性和较低的数据库维护需求。通过使用SQL Server 2000 Server,将获得增强的可靠性、可伸缩性和简化的管理与优化功能,而这些则恰恰是成功快速部署在线商务应用程序所必须的。SQL Server 2000不仅支持集中化数据库管理功能,而且还最大程度地实现了管理与优化工作的自动化,从而减轻了有关管理人员的负担。
Sybase
Sybase公司是1954年成立的,属于后起之秀。它推出了支持企业范围的“客户/服务器体系结构”的数据库。Sybase把“客户/服务器数据库体系结构”作为开发产品的重要目标。它吸取了INGRES的研制经验,以满足
联机事务处理应用的要求,于1987年推出了SybaseSQL Server,称为大学版INGRES的第3代产品。
Sybase是一个面向联机事务处理,具有高性能,高可靠性的功能强大的关系型数据库管理系统。
Sybase数据库的多库、多设备、多用户、多线索等特点极大地丰富和增强了数据库功能。因为Sybase数据库系统是一个复杂的、多功能的系统,所以对Sybase数据库系统的管理就变得十分重要,管理的好坏与数据库系统的性能息息相关。
Sybase System 11.5是其最新产品,支持企业内部各种数据库应用需求,如数据仓库、联机事务处理、决策支持系统和小平台应用等。
Sybase System 11.5的服务器端和新产品是Adaptive Server。它集成了原有的服务器系列,如SQL Server,SQL Anywhere,Sybase IQ,Sybase MPP等。它具有处理多种数据源的能力,包括遗留的非关系数据和分布的事务;提供了优化的数据存储与访问方法;提供了单一的编程模型。
SYBASE的开发工具有:
DATA WORKBENCH
* VISUAL QUERY LANGUANGE(图形查询语言)
* REPORT WORKBENCH(报表系统)
* INTERACTIVE SQL(交互式SQL环境)
* DATA ENTRY(快速录入数据)
APT WORKBENCH EMBEDED SQL SQR WORKBENCH(开放式报表系统)
* EASY SQR(基于菜单的报表生成器)
* SQR 4GL(第四代语言报表生成器)
* SQR DEBUG(调试工具)
* SQL—EXECUTE(动态表格配置)
GAIN MOMENTUM(面向对象的多媒体开发平台,可以 编辑动画、声音、位图)
SYBASE的不足:
*多服务器系统不支持分布透明
*REPLICATION SERVER数据方面的性能较差,并不能 与操作系统集成
*对中文的支持较差
*多用于银行系统等
*尚无在此数据库基础上的企业管理信息系统
IBM DB2
DB2是IBM公司的产品,起源于System R和System R+。它支持从PC到UNIX、从中小型机到大型机、从IBM到非IBM(HP及SUN UNIX系统等)各种操作平台。它既可以在主机上以主/从方式独立运行,也可以在客户/服务器环境中运行。其中服务平台可以是OS/400,AIX,OS/2,HP.UNIX,SUN-Solaris等操作系统,客户机平台可以是OS/2或Windows,DOS,AIX,HP-UX,SUN Solaris等操作系统。
IBM
DB2数据库环境以用于大型公司、政府、电信和邮电行业等需要海量数据处理的场所而闻名。
DB2数据库核心又称作DB2公共服务器,采用多进程多线索体系结构,可以运行于多种操作系统之上,并分别根据相应平台环境做了调整和优化,以便能够达到较好的性能。
xBase
xBase是dBase,FoxBase、FoxPro的统称,用xBase建立的系统通常包含很多不同类型的文件,每一个表、程序、报表、查询、索引、菜单等内容都是以文件的方式存放在磁盘上,可以通过项目文件对其他类型的文件进行组织与管理;在xBase中,表、记录等数据操纵或界面的设计采用的是xBase。命令进行编程,高版本的FoxPro中引人了部分SQL语句主要用来完成数据的查询:xBase。中采用面向过程的程序设计方法,即使是一个用户输人界面的设计也濡要较长的一段xBase程序。
ACCESS
ACCESS对数据库的组织同大型后台数据库系统的数据库组织非常相似,不同数据或程序元未称为对象,所有的对象都存储在一个物理文件中,而这个物理文件被称为数据库。
INGRES智能关系性数据库管理系统
INGRES数据库系统的多项技术直接采用了伯克利大学最新研究成果。技术上一直处于领先水平。
INGRES数据库不仅能管理数据,而且还能管理知识和对象(对象是指数据与操作的结合体,计算机把他们作为整体处理)。INGRES产品分为三类:第一类为数据库基本系统,包括了数据管理、知识管理、和对象管理。第二类为开发工具。第三类为开放互联产品。
INGRES的基本数据库管理系统中的数据管理支持下面特点:
*开放的客户机/服务器体系结构,允许用户建立多个多线索服务器。
*编译的数据库过程。数据库过程用INGRES第四代语言编 写。由服务器编译管理,用来实现预定义的事务处理,减小CPU负载,减小网络开销。
*智能优化功能。根据查询语言的要求自动地在网络环境中调 整查询顺序,寻找最佳路径。*数据的在线备份。无需中断系统的正常运行,备份保持一致性的数据库备份。
*I/O减量处理。提供快速提交、成组提交、多块读出与写入的技术。减少I/O量。
*多文件存储数据。一个表用一个文件存储,便于在异常情况下对数据库存进行恢复。
*采用两阶段提交协议,保证了网络分布事务的一致性。
*具有数据库规则系统。自动激活满足行为条件的规则,对每个表拥有的独立规则数不受限制,
*无限制的向前推理和无限递归,确保数据库的一致性。
*具有报警系统,当数据在规定的数据量极限时,自动作出相应的操作。
*资源控制与查询优化相结合,由服务器控制查询的资源消耗,确保系统的可预测性能。
*能够对用户自己定义的数据类型进行处理、存储,定义数据的有效区间。
*允许用户将自己定义的函数嵌入到数据库管理系统中。
大型数据库系统中的并行处理技术
下面简单介绍大型数据库系统Oracle和Sybase中的
并行处理技术。
运行在MPP或SMP群集机系统平台上的
Oracle数据库提供了多种并行处理机制。
一种是单个语句的并行处理。Oracle7.1在Oracle7并行事务处理的基础上支持单个语句的并行处理。这种并行处理机制被嵌入到数据库的核心部分,通过单个语句的并行处理提高SQI。语句的执行速度,随着CPU数目的增加系统的性能将不断提高。
对查询语句的并行处理是将SQL查询语句分解成若干子任务,分配给多个CPU并行处理。这种并行有两种方式,一种是子任务内并行,一种是子任务间并行。为了缓解I/O瓶颈,在数据交换中采用高速缓冲改善性能。对并行处理中涉及的大量中间数据交换采用流水线方法实现。Oracle7.1对索引操作采用了并行的全表扫描和并行排序,利用操作内及操作间的
并行处理技术使索引操作在多个CPU上并行执行,大大加快了索引速度。系统对
数据库恢复也采用了并行处理,由多个CPU并行完成,显著地减少了恢复时间。
数据加载(SQL.LOADER)过程也是并行执行的。Oracle7.0继承了Oracle7“直接路径加载”技术,通过语法分析将数据加载分解为多个CPU并行完成,充分利用了I/O并行技术,使数据均匀分布在多个磁盘上。
在多处理机环境下,Sybase无共享体系结构实现了数据库的并行处理,包括多服务器并行和服务器内的并行。
Sybase数据库系统并行体现在多进程、多线程的并行运行,可以处理多个用户的事务请求。可根据处理器的数目设置
数据库服务器的进程,每个进程包含多个线程以并行处理用户的访问要求。Sybase提供了一系列并行控制和管理机制,包括封锁机制、缓冲机制和日志机制等。这些机制构成了Sybase数据库服务器的核心层,使Sybase增强了跨平台特性。
数据库并行技术因并行计算技术的发展有着广阔的前景,在数据库应用要求不断向大容量高速度发展的今天,深入研究
并行数据库技术,开发适合并行计算环境的并行数据库系统必将推动数据库的进一步发展和应用。
大型数据库系统应用
目前,人们在日常生活中,经常通过电话、网络订购图书、火车票、飞机票,或查询某些数据信息,所有这些都属于大型数据库系统。大型数据库系统在军事、经济、文化、体育和科学等各个领域都发挥着及其重要的作用。
第43届世界乒乓球锦标赛(天津)网络系统是一个大型
数据库应用系统,系统通过网络集注册、竞赛组织、记时记分、信息查询、大屏幕显示、电视实况转播、电子文印于一体,实现了各种数据信息的同步协调控制和共享。系统布局如图1所示,系统的整体数据组织结构如图2所示。
从上述系统分布图和数据库
组织结构图中可以看出,大型数据库系统是复杂的,其复杂性体现在: