数据仓库能为你当前数据库体系的不足做些什么?(1) 数据仓库可以提供对企业数据的便利访问和强大的分析工具,用于生成有意义的信息。数据仓库的目标,是从企业数据中获得有价值的信息,提供可以增加获利的情报,提高运作效率,指导商业决策,和发掘企业的竞争优势。这些目标的实现,一定会对业务产生积极的影响。现如今,数据仓库是在客户/服务器领域的一个热门的话题。对数据仓库的了解,对于客户/服务器开发人员来说,一定极有价值。本文介绍了数据仓库,并提供了许多关于如何实现其目标的技巧,包括关于数据收集、决策支持系统、联机分析处理和数据仓库等内容。我为每一概念下定义,并介绍了数据仓库的处理机制,还讨论了用于创建和维护数据仓库的媒体数据的定义。今天的客户/服务器早期的客户-服务器系统中的工作,主要是开发联机事务处理(OLTP)应用。使业务操作自动化的应用,如定货记录、清单或预定系统,成为近期开发的重点。大部分的这一类应用是较简单的两层应用结构,其实质就是前端的GUI应用访问后端的数据库服务器。事务逻辑经常由客户工作站上的代码实现,也可以是服务器上的过程。今天,大多数公司已完成了大大小小的客户-服务器工程的建立,或至少开始了最初步的系统建设。现在,将事务逻辑与GUI和数据源分离的三层系统,将成为未来开发的重点。商业上经常需要三层系统,以满足更大型且复杂的应用,涉及成千的客户机和数十个服务器。OLTP应用要求响应时间短、准确无误及100%的可用性和实时性。这些应用实现的基本商业操作,是业务高效运转所必须的。数据收集和访问大多数机构和公司都积累了大量数据,并已很好地进行了数据收集的自动化工作,运行良好(在积累及存储方面)。数据存储主要是在关系型数据库中,在这些系统中,大量的数据和数据模型,都是反映公司以往的措施和业绩。今天,SQL是数据访问的主流语言,它面向集合,并提供了应用与数据库间良好的交互性。事务由数据库服务器或事务处理(TP)监视器管理。较大型的应用,一般使用TP监视器,实现数据一致和高性能。大多数数据操作针对单条记录或相关的数据集合。定义合理的关系数据库操作,产生的结果是可预见的。RDBMS查询的结果,一般是动态的综合或计算。决策支持系统机构一旦拥有了完整的数据采集和存储过程,新的需要就产生了:怎样使用好数据库中有价值的信息。在竞争日益激烈的商业市场上,至关重要的是分析这些信息并生成报表,它们可以辅助商业决策。不久,你对自己经营情况的了解,就会转化为可以量化的经营优势或运行改善。与OLTP系统相比,决策支持系统(DSS)主要是需要对数据库作只读访问,用于建立报表和查询结果,辅助制定重要的商业决策。这些系统不要求迅速响应,可以按自己的节奏运动,也许只是偶尔使用一次;并希望能将DSS的信息导出,供其它桌面软件工具使用。DSS在看待企业数据时,使用根本不同的方法,这一不同十分重要,数据被看作是历史记录,分析的最初步骤需要进行分组和综合。经常需要对数据的子集(按月、年、地区、产品)进行数学运算,而后用图表等显示方式,可进一步解释数据的含义。DSS用户一般直接使用DSS工具,并需要数据模型作向导。DSS通常在开始阶段使用的数据库与OLTP的一样,但DBA经常需要为新的功能或任务,创建总结表和视图,提供所需信息。在有些情况下,需要使用复制来将运行系统中的数据移到DSS数据库中,在转移期间需要冻结(定格)生产数据,避免并发操作时出现问题。这对于DSS用户来说没有什么损失,因为他们并不需要快速的对数据的增删插改之类的事务处理,而只关心长期的表现、趋势、总结和摘要。这些工作要求具有分析功能,多数情况下还包括二次开发,用来访问不同地点的数据,这些数据可能具有不同格式,或者不能按某种方法直接得到。但这通常不只是对方案的修修补补。对于数据还需要统一格式,使查询更方便、灵活。针对这类分析系统,你需要经常考虑的是提高性能和提供集中的功能。报表将处理大量的记录集合,只在极少情况下是个别记录。访问路径的可预见性比OLTP系统稍差,但仍可以预先建立系统中的大部分已知或重复数据访问的路径。复制分布式系统的增多、对高性能的要求、DSS系统的特殊性质等等,都促使复制的迅速发展。复制快速成为解决大型数据系统的性能、并发性、可用性和容量限制的基本技术。其缺点是,它不是真实数据,只是信息的复制品。因此,它也即将过时(但对于使用复制机制的双路系统,可以满意地完成双向变化传送)。联机分析处理