将信息经过过滤识别出来,再从全局出发,根据管理需求信息按照不同的分类定义工作,然后分别对每个主题数据库定义主题。
概念
主题数据库的设计目的是为了加速应用项目的开发。程序人员使用的数据应已存在于有关数据库中。它把企业的全部数据划分成一些可以管理的单位——主题数据库。主题数据库应设计得尽可能稳定,能在较长时间内为企业的信息资源提供稳定的服务。稳定并非限制主题数据库永不发生变化,而是要求在变化后不会影响已有的应用项目工作。主题数据库的
逻辑结构应独立于当前的
计算机硬件和软件的实现过程,这样能保持在技术不断进步的情况下,主题数据库的逻辑结构仍然有效。
软件特点
主题数据库的基本特征有:
1.面向业务主题。主题数据库是面向业务主题的数据组织存储,例如,企业中需要建立的典型的主题数据库有:产品、客户、零部件、供应商、订货、员工、文件资料、工程规范等。其中产品、客户、零部件等数据库的结构,是对有关单证、
报表的
数据项进行分析整理而设计的,不是按单证、报表的原样建立的。这些主题数据库与企业管理中要解决的主要问题相关联,而不是与通常的计算机应用项目相关联。
2.信息共享。主题数据库是对各个应用系统“自建自用”的数据库的彻底否定,强调建立各个应用系统“共建共用”的共享数据库。不同的应用系统的
计算机程序调用这些主题数据库,例如,库存管理调用产品、零部件、订货数据库;采购调用零部件、供应商、工程规范数据库等。
3.一次一处输入系统。主题数据库要求调研分析企业各经营管理层次上的数据源,强调数据的就地采集,就地处理、使用和
存储,以及必要的传输、汇总和
集中存储。同一数据必须一次、一处进入系统,保证其准确性、及时性和完整性,经由网络-计算机-
数据库系统,可以多次、多处使用。
4.由基本表组成。一个主题数据库的科学的数据结构,是由多个达到“基本表” (Base Table)规范的数据实体构成的,这些基本表具有如下的特性:
· 原子性——基本表中的
数据项是
数据元素(即最小的、不能再分解的信息单元);
· 演绎性——可由基本表中的数据生成全部输出数据(即这些基本表是精练的,经过计算处理可以产生全部企业管理所需要的数据);
· 规范性——基本表中数据满足三范式(3-NF)要求,这是科学的、能满足演绎性要求、并能保证快捷存取的数据结构。
主要区别
主题数据库与应用数据库的区别
我们看一个简单的例子。某单位的工资系统是按工资单建数据库的,职工张华的工资单编号是0104。该单位人事系统是按职工档案建数据库的,张华在人事系统中的编号是1122。人事系统要获得张华的工资数据,需要做接口程序将1122转换成0104,才能正确地检索;反之,工资系统要获得人事系统的数据,需要做接口程序将0104转换成1122。这样,2个应用系统至少需要2个接口。如果再加上安监系统和社保系统,共4个应用系统要互相交流数据,就至少需要12个接口。而企业经营管理中如果有20个大大小小“孤岛式”的应用系统需要相互交流数据,就至少需要380个接口。这么多的接口无法做完,即使做完所有的接口,整个系统的运行也将是低效率和脆弱的。所以,企图通过做接口实现系统集成,从来就是可望而不可及的。
解决这类
应用系统集成问题的正确方法是:不按照单证报表原样建立数据库,而是面向业务主题建立数据库,这就是主题数据库。上例中的员工信息是几个应用系统所共用的,应该对企业的所有员工统一编号,有关员工的信息统一组织存储,从而能保证信息共享——各应用程序都存取共享的“员工主题数据库”,这就从根本上取消了不必要的接口。这就是说,通过建立主题数据库,简单、科学地实现了应用系统的集成。
发达国家在上世纪70年代中后期至80年代初的信息化初级阶段,遇到过包括“信息孤岛”问题在内的“数据处理危机”问题。詹姆斯·马丁(James Martin)提出的主题数据库概念和有关理论方法,为解决这些问题作出了重要的贡献,这对我们具有十分重要的借鉴意义。