e股脑电脑教程网
  • 首 页
  • 操作系统
  • 应用软件
  • 下载工具
  • 影音视频
  • 办公软件
  • 媒体制作
  • 网站建设
  • 平面设计
  • 数据库
  • 程序开发
  • 视频教程
编辑推荐: | 文章搜索:
您现在的位置: e股脑 >> 数据库 >> DB2教程 >> 从数据管理到信息集成: 自然的演变 >> 教程正文
 
教程搜索
 
 
相关教程
  • 数据挖掘器: 警告 — 及时
  • UNIX、Linux 和 Windows 
  • “总览图”: IBM DB2 通用
  • DB2 大事记
  • 数据管理部门副总裁兼 CT
  • IBM 联邦数据库技术
  • 唐纳德.海德勒(Donald J
  • 数据库未来展望
  • 哪一个分布式 DB2 UDB V8
  • 从数据管理到信息集成: 自
  • 联邦 - 数据库互操作性(
  • 成功是必然的(中)
  • 成功是必然的(上)
  • 成功是必然的(下)
  • DB2 信息集成: 总览图
  • IBM 杰出工程师兼信息集成
 
 
赞 助 商
 
 
从数据管理到信息集成: 自然的演变
  • 来源:e股脑
  • 点击次数:
  • 更新时间:2007-8-9

Mary Roth, DBTI for e-Business, IBM 硅谷实验室

Dan Wolfson, DBTI for e-Business, IBM 硅谷实验室

2002 年 7 月

现今企业所面临的难题是管理因特网和电子商务所造成的数据量和多样性的爆炸。原本存在于 DBMS、内容管理系统、中间层高速缓存和数据仓库之间的界限正日益变得模糊,而迫切需要提供所有这些服务的统一视图的平台。我们提出了一种平台,它扩展了最新的联邦数据库体系结构,支持关系和 XML 作为主要数据模型,并紧密地了内容管理服务、工作流、消息传递、分析和其它企业应用程序服务。

简介

最近几年因特网和电子商务的迅猛发展引发了第二次“信息爆炸”。业界分析家预计:未来三年中生成的数据会比所有已记录的历史信息还要多 [INFO]。企业业务应用程序可以用以下两种方法之一来应对信息过载:被这些数据的庞大数量和多样性压垮,或者利用这些信息,并将其转换成可以用来在商业领域赢得竞争优势的有价值的资产。

因为采用基于因特网的商业交易模型的速度大大超过了用来处理“信息爆炸”的工具和技术的开发速度,所以许多企业发现自己在无意中使用着从前的方法。大量开发资源浪费在“快捷但不恰当的方式获得的”(quick and dirty)集成解决方案上,这些解决方案粗制滥造地将不同的数据管理系统(数据库、内容管理系统和企业应用程序系统)组合起来,并将数据从一种格式转换成另一种格式(结构化格式、XML 和字节流)。当应用程序面临可伸缩性和可用性问题时,收入就会减少。新的商机会被轻易地忽略,因为进行商业决策所需的关键性有用信息被所生成的大量数据“淹没”了。

在本文中,我们提出了利用“信息爆炸”的技术平台和多种工具,并提供了一个端对端的解决方案,用来透明地管理当今商业领域中庞杂的数据。我们将这种技术称为 信息集成(information integration)。IBM 提供了数据管理产品系列,这些产品支持使用系统的方法来解决企业如今所面临的信息集成难题。 信息集成技术预览中展示了其中许多产品和技术。

该平台的基础是一个一流的数据库体系结构,该体系结构无缝地提供关系数据和本机 XML 作为一流的数据模型。基于以下三个重要原因,我们相信数据库技术为信息集成平台提供了最坚固的基础:

  • 首先,事实证明,DBMS 在过去 30 多年中,在管理传统业务应用程序中出现的“信息爆炸”方面取得了巨大成功。DBMS 能够很自然地处理与健壮的数据管理相关联的存储、检索、转换、可伸缩性、可靠性和可用性等方面的难题。
  • 其次,数据库业界显示出它可以迅速适应过去 6 年中的电子商务应用程序引入的数据和访问模式的多样性。例如,大多数企业强度的 DBMS 都有内置的对象-关系支持、XML 功能和对外部数据源的联邦访问的支持。
  • 第三,现在全球范围内都对 DBMS 技术进行了大量投资,包括数据库、支持工具、应用程序开发环境和熟练的管理员和开发人员。在所有级别上都利用并增强了 DBMS 体系结构的平台是提供健壮的端对端信息集成的最佳场合。


本文的组织结构如下:

  • 简要回顾 DBMS 体系结构的 演变。
  • 提供一个实际的 方案,它说明了信息集成问题的范围并概述了对技术平台的需求。
  • 正式地讨论对技术平台的 需求。
  • 提供了一个满足这些需求的信息集成平台的 模型,并提供了对于集成问题的端对端解决方案,作为 DBMS 体系结构的下一个发展步骤。

DBMS 技术的演变

图 1表示了关系数据库技术的演变。关系数据库是在存储、操作和管理大量数据的完整性的需求下应运而生的。在 20 世纪 60 年代,网络和分层系统(如 [CODASYL]和 IMS TM)是用于自动化银行业务、记帐和订单处理系统的一流技术,这些系统是由于商业大型计算机的引入才启用的。虽然这些系统为早期系统提供了良好的基础,但它们的基本体系结构将数据的物理操作与逻辑操作混合在一起。当数据的物理位置改变时(譬如从磁盘的一个区域移到另一个区域),也必须更新应用程序,以引用新的位置。

1970 年,Codd 的一篇革命性论文 [CODD]及其商业实现改变了一切。Codd 的关系模型引入了 数据独立性的概念,它将数据的物理表示与在应用程序中的逻辑表示分开。数据从磁盘的一部分移到另一部分或以不同格式存储,都不会导致重写应用程序。应用程序开发人员从单调的数据操作物理细节中解放出来,因而可以将注意力转移到特定应用程序上下文中数据的逻辑操作上。

关系模型不仅减轻了应用程序开发人员的负担,而且在数据管理业界造成了堪称楷模的转变。检索 什么数据和 如何检索数据的分离提供了一种体系结构,新数据库的供应商可以使用这种体系结构来对其产品进行改进和创新。 [SQL]成为描述应该检索什么数据的标准语言。新的存储模式、访问策略和建立索引的算法得以开发,以加速数据在磁盘上的存储和检索,并发性控制、日志记录和恢复机制方面的发展进一步保证了数据完整性 [GRAY]、 [LIND]和 [ARIES]。基于成本的 优化技术 [OPT]完成了数据库从作为抽象数据管理层到成为高性能的、大容量查询处理引擎的转变。


随着公司的全球化,以及公司的数据迅速地分布于其国内和国外的办公室,DBMS 技术的界限再次受到了考验。诸如 [R*]和 [TANDEM]之类的分布式系统表明:可以轻松地利用基本 DBMS 体系结构来管理大量的 分布式数据。分布式数据导致新的并行查询处理技术的出现 [PARA],它说明了 DBMS 作为高性能的、大容量查询处理引擎的可伸缩性。

图 1. DBMS 体系结构的演变

在用分布式和并行算法扩展 DBMS 时获得的经验还引起了 可扩展性方面的发展,由此,即插即用组件改变了单一的 DBMS 体系结构 [STARBURST]。这样的体系结构使得在出现新的业务需求时,可以轻松地引入新的抽象数据类型、访问策略和建立索引的方案。稍后,数据库供应商将这些吸引人的技术向顾客推广,相关的产品有 Oracle 数据部件(Oracle data cartridge)、 Informix® DataBlades®和 DB2® Extender TM。

在整个 20 世纪 80 年代,数据库市场已经成熟,各公司试图基于一家数据库供应商来进行标准化。但是,做生意的实际情况通常使此类战略变得不切实际。从独立部门的购买决策到合并和收购,在一个 IT 部门中存在多种数据库产品和其它管理系统的方案屡见不鲜。企业寻找一种方法来降低与此类异构环境相关的管理和开发成本,数据库业界则以 联邦作为响应。联邦数据库 [FED]提供了用来透明地访问异构的、分布式数据源的功能强大而又灵活的方法。

现在我们处于一个由因特网支持并由电子商务的剧增所推动的革命性的新时期。在过去的六年中,Java TM和 XML 已经成为可移植代码和可移植数据的实现手段。为了适应变化,数据库供应商已经能够利用数据库可扩展性和抽象数据类型方面先前的发展成果来快速提供对象关系数据模型 [OR]、将关系数据作为 XML 文档存储和检索的机制 [XTABLES]和 SQL 的 XML 扩展 [SQLX]。

由于开发和部署复杂的基于因特网的应用程序得到了简化,从而显著地加速了使业务过程自动化的步伐。本文的前提是:现今企业所面临的难题是

[1] [2] [3] 下一页

  • 上一篇教程: 联邦 - 数据库互操作性(第 1 部分)
  • 下一篇教程: 哪一个分布式 DB2 UDB V8 版本适合您?
  •  

    关于本站 | 广告联系 | 版权声明 | 使用帮助

    Copyright © 2004-2008 www.egunao.com All rights reserved.