在信息爆炸的时代,人们希望“共享”信息的渴求越来越迫切。BI技术和报表工具挖掘了数据关联的价值,却对难以访问的信息无能为力,而XML技术的迅猛发展则使异构系统间的数据交换、集成、共享成为可能。
随着企业各种格式的信息日益膨胀,信息资源浪费的问题也凸显出来。商业智能和报表工具的出现,充分挖掘了将这些数据相互关联后产生的新价值,可是又仅仅能分析他们能够访问的数据。而实际上,很多信息分布在不同部门和系统之中,以不同格式,存放在不同的硬件平台上。由于信息难以访问,分析价值也就大大受到了限制。
XML技术逐渐成熟
虽然XML创立之初只是被当作一项基础技术,但其发展早已超出设计者原先的构想。不论是学术界还是商业界都将其视为提高信息化建设水平的重要技术。目前XML已被大量应用于异构系统间的数据交换,数据集成,数据共享,将同一数据以不同的形式表现出来等。
XML不仅仅是一个技术规范,已经形成了一整套技术规范体系。现在XML在多个应用领域都有了相关的行业标准。例如,电子商务中的eBXml、金融行业的XBRL、FPML、描述图形的SVG、描述地理信息的GML等。XML具有非常广阔的前景,业界众多企业都宣布全面支持XML,并已经在各自产品中广泛采用了XML技术,如微软已经在Office 2003上大规模应用了XML技术,并且还表示其准备在2006年下半年发布的下一版本的Office 12中采用基于XML的文件格式;IBM和BEA的产品也纷纷大规模应用了XML技术。
解决应用性能难题
XML技术开始普及,XML产品也开始大量使用,但不可否认的是,大量XML信息出现而导致的性能问题是我们无法忽略的:XML拥有强大功能和良好的兼容性,但它让信息变得太大;XML的数据模型与传统的关系型数据模型截然不同,关系型数据库不能满足需求。这一切看起来似乎都很糟糕。
解决问题的途径就是XML数据库。数据库可以用来管理成千上万的XML文档,保证对结构复杂的XML文档的查询效率,提供事务处理和安全控制,XML数据库是XML应用的基础支撑系统,它能够帮助解决XML的性能问题。
目前市场上有两类XML数据库,XML-Enabled数据库(XED)和Native XML数据库(NXD)。XED是在原有的关系型数据库上面提供对XML的支持,包括Oracle、DB2、SQL Server都提供了这样的技术;NXD是在数据模型、体系结构方面按照XML特点进行设计,在实现上针对XML特点进行优化,Ipedo、SoftwareAG是这类数据库厂商的代表。
XED依靠传统数据库技术二三十年的积累,占据了XML应用市场的大部分份额。但XED在存取XML数据面临着技术难点:首先,为了把XML文档存到XED中,我们必须将XML文档做转化操作,反之亦然,而这个转化操作消耗的性能消耗很大;其次,对XML数据的查询支持不好,对查询性能影响非常大。
相比而言,NXD出场较晚,但作为处理XML文档的专用数据库,XML文档存取无需模式转换,存取速度快,对格式复杂的XML文档支持比XED要好,支持最新的XML技术标准;只是NXD在传统数据库技术上比较薄弱,还没有经历大量考验。
根据IDC对数据库市场的预测,XML数据库增长速度达到140%,远远超过其他数据库的增长比例,预计到2006年XML数据库市场将达到2.8亿美元,这预示着XML数据库将成为今后数据库市场的主导产品。
破除信息孤岛有术
XML技术出现,使得Web Services迅速普及,构建了大量的面向服务架构(SOA)应用,从而开创了新的软件时代。
什么是Web Service,答案可能仁者见仁、智者见智。但我们可以明确看出Web Services的价值:可以用来建设分布式架构的系统;具有良好的兼容性,可以轻易整合异构系统。微软旗帜鲜明地力推Web Services,他们的产品就叫XML Web Services,明确地告诉大家Web Services是基于XML技术的,XML技术解决了Web Services所需的通用性问题,XML和消息传递在服务和应用程序之间相互通信方面起着关键性作用。
EII(企业信息集成)是目前解决普遍存在的“信息孤岛”问题的最新解决方案,BEA、IBM等IT巨头已经涉足该领域。在这个方案中,XML也已经成为了首选技术。
EII强调的是实时集成一个企业范围内的所有信息,乃至广域网上的各类相关信息,Web Services信息等,从而为企业的领导层及时提供各种决策支持,实时监控信息和综合数据分析。而XML良好的、灵活的、多维的语法结构恰恰可以方便的表示各种结构化、半结构化、乃至非结构化的信息;在各个异构的、彼此隔绝的系统间建立一种标准的“沟通语言”。加之Web services的广泛应用,使得XML成为了目前信息集成的首选。目前,HP、英国电信等知名企业都已经实施了采用EII架构的项目。
随着XML和Web Services等跨平台技术的出现,我们看到SOA正在当今的异构环境中被加速采用。而在这个领域,不仅仅IBM、微软、Oracle、BEA等业界巨头可以在平台软件方面立足,独立平台软件开发商同样可以分一杯羹,而且不仅仅是软件商,很多WAN厂商、芯片制造商都在同一个方向上努力。事实上,XML技术的潜能还远未被充分挖掘。
最新研究表明,以XML为基础的产品,将在今后5年以10倍的速度快速成长,在2008年达到116亿美元的营业规模。Zap Think在研究报告中也指出,这些以XML为基础并包括Web服务的工具,是将旧有系统再度激活的新希望。不夸张地说,只要有数据,有互联的地方,就能发现XML的身影。
制定自己的技术规范
我国已经开始制定并推出了符合我国实际情况的XML技术规范,对XML技术的推广进行了大力支持。
从行业上看,在电子政务行业,我国已经出台了《基于XML的电子公文格式》和《XML在电子政务中的应用指南》;在金融行业,中国证监会在中国推广 XBRL标准,并准备制定CNXBRL标准,也正在筹备成立XBRL的地区组织。
高校和科研院所也开始了积极尝试,中科院软件所电子商务技术研究中心提出了电子商务信息化规范——cnXML;北京交大计算机学院采用XML数据库进行相关项目的技术研究,并与Ipedo、交大网通等企业合作建立“Ipedo XML培训与应用推广中心”等等。所有这些努力都是为了推动XML作为信息世界的通用语言,让XML标准更好地服务于应用。 (D12)
阅读关于 XML 的全部文章







