跳到主要内容
  • 联系我们

数据中心热潮 "升温 "了

作者:Bernard Lee

更高的数据中心操作温度影响光纤的可靠性

大数据分析、云、物联网:ICT(信息和通信技术)行业的热门词汇。所有这些都以惊人的速度推动了全球数据中心市场的蓬勃发展。思科预测,到2018年,超过四分之三(78%)的工作负载将由云数据中心处理;22%的工作负载将由传统数据中心处理。尽管从2013年到2018年,整体数据中心的工作负载将增加近一倍(1.9倍);然而,同期云工作负载将增加近两倍(2.9倍)。2013年,云数据中心的工作负载密度(即每台物理服务器的工作负载)为5.2,到2018年将增长到7.5。

巨大的机遇,伴随着巨大的挑战。当问及数据中心运营商 "在数据中心的运行中,什么是最具挑战性的?"毫无疑问,所有人都会回答是与数据中心的HVAC(湿度、通风和空调)系统相关的成本。在许多数据中心,与HVAC相关的年度成本将达到数百万美元,随着能源成本的上升,这将是许多数据中心运营商希望看到的唯一最重要的项目。但是,为什么数据中心的HVAC成本这么高?数据中心在历史上一直使用精密冷却,将数据中心内的环境严格控制在严格的范围内,这是基于可以追溯到1950年代的做法。然而,不断上涨的能源成本加上即将到来的碳税,使许多机构重新审视数据中心的能源效率和驱动其现有数据中心实践的假设。因此,问题是:"数据中心是否需要一直这么冷?"

随着时间的推移,IT行业一直致力于新的创新,以拓宽可接受的热和湿度范围。人们普遍认为,在高于典型工作条件的温度下工作会对电子和电气系统的可靠性产生负面影响。然而,操作者和IT用户对工作环境条件对IT系统的可靠性和寿命的影响了解甚少。使用较宽松的环境围护结构将导致与数据中心的HVAC系统相关的一些运营成本的潜在减少。特别是,不需要机械冷水机冷却设备并依靠节电器的数据中心,在建设和运营方面的成本都会大大降低。其中一种方法是使用自然空气冷却技术,称为 "空气侧冷却"。这对节约的影响有多大?那么Gartner副总裁David Cappuccio估计,将温度提高1华氏度可以每月节省约3%的能源成本。在不影响可靠性的情况下,理想的温度是多少呢?我们可以在多高的温度下驱动设备工作而不增加故障的几率?为了给IT和数据中心设施行业提供方向,美国采暖、制冷和空调工程师协会(ASHRAE)在2004年推出了第一份关于推荐湿度和温度水平的指导文件,在2008年,该文件被修订以反映新的商定范围,见表1所示

DATA-CENTER-BOOM-table-1

在其指南中,ASHRAE定义了两个操作范围。"建议的 "和 "允许的"。在建议范围内操作可以提供最大的设备可靠性和寿命,同时最大限度地减少设备能耗,只要环境热和湿度条件影响这些因素。允许范围允许IT设备在更大的公差下运行,同时接受一些由于静电放电(ESD)、腐蚀或温度引起的故障而产生的 "潜在可靠性风险",同时平衡因此而增加的IT能耗的可能性。尽管如此,在业界,许多供应商支持的温度和湿度范围比ASHRAE 2008允许的范围更宽。值得注意的是,ASHRAE 2008指南只代表了供应商之间商定的交叉点,这使得多个供应商的设备能够在同一个数据中心中有效地运行在一个单一的操作制度下。2011年,ASHRAE再次更新了其指南,定义了数据中心的另外两个运行等级,为供应商和用户提供了运行定义,其允许的温度界限更高,分别达到40℃和45℃。

将注意力集中在更高的操作温度上的公司之一是谷歌。谷歌的能源项目经理Erik Teetzel说,"我们给数据中心运营商的指导是提高恒温器。谷歌自2008年以来一直在运行他们的比利时数据中心,没有任何冷却器,使用自然空气冷却,在一年中的某些时期,温度可能高达95°F或35°C。对人来说太热了,但机器却能继续正常工作。英特尔和微软的研究表明,大多数服务器在较高的温度和外部空气下都能正常工作,缓解了人们对较高硬件故障率的担忧。事实上,戴尔公司最近表示,它将保证其服务器在温度高达45°C(115°F)的环境中运行,这比ASHRAE推荐的工作温度整整高出20°C。因此,在全球范围内,数据中心采用更高的工作温度是不可避免的。

DATA-CENTER-BOOM-figure-3

图3 - 不达标的材料无法经受环境测试

数据中心的无源基础设施将如何应对?新的更高的工作温度是否也会对可靠性构成威胁?幸运的是,45°C的工作温度对无源基础设施来说并不陌生,知名的组件供应商一直在按照国际标准(如IEC 61753-1和Telcordia GR-326-CORE)进行高工作温度测试。在一些测试制度中,产品的可靠性被推到了极致,对样品进行加速热老化,以模拟大约20年的使用寿命,这对无源基础设施来说是一个合理的使用寿命,因为与有源设备不同,有源设备的使用寿命大约为5年(有些甚至更短,然后被更新的版本取代),无源元件如跳线、干线电缆、连接器和适配器以及电缆槽和导管不会频繁更换。在某些情况下,无源基础设施从数据中心开始运营的那天起就一直存在,它被替换只是因为它不符合所需的性能规范,而不是因为组件故障,如图3。从本质上讲,数据中心采用更高的工作温度是不可避免的,我们只是要确保我们今天所设计和安装的东西已经准备好迎接这些新挑战。