Nehalem-EX:RAS特性挑战RISC
x86/x64服务器和大部分RISC服务器和大型机的主要区别在于高端RISC服务器能够进行错误检测和纠正,并在系统级别进行恢复。这不仅仅是简单的确定坏掉的DIMM并显示错误的位置所在,并自动隔离失效的内存段,并允许内存的热替换,不需要宕机,保持服务器的正常运行。现在,这些原本x86/x64处理器无法企及的特性出现在了Nehalem-EX上,其中最重要的就是MCA (Machine Check Architecture),提供了像RISC一样的故障检测和纠正能力,此外还有其他的可靠性特性被应用在Nehalem-EX上。
Nehalem-EX具有媲美RISC的RAS特性
提供这些高级的可靠性特性并不像听上去这么容易,操作系统在这里扮演着重要的角色。因为处理器需要通知操作系统失效的内存,让操作系统重启使用失效内存的进程,或者将那部分坏的数据隔离,然后再进行内存的隔离或替换。Nehalem-EX还支持热添加内存和CPU,这意味着在不需要系统重启的情况下进行内存和CPU的添加,当然,这样的功能也和操作系统以及固件密切相关,所以在老的操作系统上不要指望呢光能够应用这些特性。但随着Nehalem-EX推出,目前主流的操作系统提供商均已经表示将提供这些特性的支持。
除此之外,Nehalem-EX还具有更多的RAS特性,如提高QuickPath互联架构可靠性的QPI封装重审和QPI CRC校验、I/O hub热插拔、内存热量阀值(memory thermal throttling)等。我们不能不说,英特尔为这个新发布的至强家族引入了几乎所有的高级可靠性特性,这是之前的所有至强都没有的。
Nehalme-EX家族:至强7500
尽管Nehalem-EX没有提供最快的时钟频率,但是核心数量要超过英特尔之前任何一代CPU、可以支持大量内存、引入了几乎所有的可靠性特性——之前仅仅在英特尔安腾处理器上所具备的。虽然AMD发布了Nehalem-EX的对手12核心皓龙6100,但无论胜负结果如何,我们可以非常确定的说,x86/x64计算从来就没有这样好过。