1. 以你想要的方式来使用你所有的数据
无论你采取哪个方法来统一你的商业数据,SQL Server 2008建立在过去对关系数据和非关系数据的强大的支持,提供了使开发人员和管理员可以有效的存储和管理非结构化数据的数据类型,例如文档和图片,所以你可以以最适合你的业务的格式来存储、管理和分析数据。
SQL Server 2008增强了对XML数据存储和一个FILESTREAM 数据类型的支持,FILESTREAM 数据类型使大型的二进制数据可以存储在文件系统中,并且保持事务一致性仍作为数据库完整的一部分。此外,删除了对用户定义的数据类型规模的限制,使得可以超过在之前的SQL Server版本中的8 KB 的限制。对空间和位置数据类型的支持使得可以存储和分析符合行业标准的地理数据。
2.集成所有的企业数据源
SQL Server 2008数据源视图使得可以集成数据和对从异构的企业级数据存储获得的数据进行访问,例如SQL Server、Oracle、DB2和Teradata。这些视图还提供了一个企业范围的联机分析处理存储,而且在SQL Server集成服务中对不同数据源的支持广度意味着你可以从现有的所有种类的商业应用中提取数据。因此,统一你所有的企业数据源的数据是很容易实现的,不论你是否想建立一个抽象层来通过数据源查看或使用ETL处理来与一个只用于分析和报表的数据仓库同步。
此外,通过对Web services和Microsoft .NET框架的支持,SQL Server 2008支持与多个平台、应用和编程语言的协同工作能力,所以你可以通过集成和连接到你的异构的数据源来最大化你对新的和现有的系统的投资回报。支持已有的和新出现的开放标准,例如HTTP、XML、SOAP、XQuery和XSD,进一步推动了你的扩展了的企业系统的通信。
二、数据仓库性能
SQL Server 2008提供了一个全面的和可扩展的数据仓库平台,使得你的企业可以更快的将数据整合到数据仓库中,这样你就可以扩展和管理不断增长的数据量和用户数量。
1.优化ETL过程
数据仓库一般通过ETL 过程从数据源系统获得的数据进行组装和更新。在数据最初加载到数据仓库中之后,会定期的刷新源系统的新的和更改的数据,以确保数据仓库的数据是最新的。
SQL Server 集成服务提供了一个全面的平台,你可以使用它从不同的数据源系统提取数据,做所要求的任何对数据或它的结构和格式的转换,然后加载转换的数据到数据仓库中。执行查找来匹配从数据源系统获得的记录到在数据仓库中的已有的记录是ETL过程中的一个常见操作,在SQL Server 2008中查找的性能被显著的提高了,以致于这些操作扩展到大型表。
为了帮助跟踪数据变化和确保数据仓库一致性,SQL Server 2008推出了变化数据捕获(Change Data Capture,CDC)功能,将更新记录在变更表中,这使得很容易标识被更改的行和确定更改的细节以及更改的原因。
2.有效的管理硬件资源
通过对数据压缩的支持,SQL Server 2008使你可以更有效地存储你的数据和降低存储成本。另外,压缩明显的提高了大型的具有输入/输出限制的工作负载的性能。SQL Server 2008还为备份压缩提供了本地支持即开即用。此外,VARDECIMAL数据类型和SQL Server 2008中的新的稀疏列通过降低大型表(这些表如在数据仓库所常见的,主要为数字或空值)所需要的空间数量来帮助你从你的磁盘存储资源获得最好的效率。
除了在数据存储方面的效率,SQL Server 2008还支持映射内存的地址窗口扩展(Address Windowing Extensions,AWE)的动态分配,它支持Windows Server 2003、数据中心版(Datacenter Edition)的64GB内存、和64位版本的2TB内存,来支持大型数据仓库环境。
SQL Server 200还推出了资源监控器,它使得管理员可以为不同的工作负载定义资源限制和优先权,以便使并发工作负载可以提供稳定的执行,并使得可以预先的管理资源竞争问题。
3.优化数据库性能
SQL Server 2008包括高性能的关系数据库引擎,它使得你可以建立高效的数据仓库解决方案。创新(例如用于star schema(星型模式)和工具的查询优化帮助你调整索引和数据结构)使得SQL Server为经常查询的数据仓库自动选择,同时在SQL Server 2008中推出了MERGE Transact-SQL语句,开发人员可以更有效地处理普通的数据仓库场景,例如检查一行是否存在然后执行插入或更新。此外,对GROUP BY条件语句进行了扩展,使得用户可以在一个查询中定义多个组。Grouping Set生成了一个单独的结果集,这与对不同分组的行执行UNION ALL 操作是等价的,它使得聚合查询和生成报表更加容易和快速。
SQL Server 2008支持分区表,帮助你优化大型表的性能和管理,有了对分区表并行的新的支持,你可以通过使用分区表显著的优化一个数据仓库。