首页 > 科技 > 这群人在零下九度的坝上草原,守护天猫双11的数据心脏

这群人在零下九度的坝上草原,守护天猫双11的数据心脏

天下网商记者 黄天然

11月,张北飘落了今年的第三场雪,这里地处海拔1400多米的坝上草原,最低气温已到零下9度。鲜为人知的是,这片“风似刀、雪满怀”的塞北之地,正跳动着阿里巴巴的数据“心脏”。

阿里巴巴张北数据中心

每年天猫双11,张北数据中心便进入了“重保时刻”。每隔2小时,运维工程师们就会对所有关键机组设备进行一次巡检。为确保所有设备的运营维护做到万无一失,警车和消防车都在园区外随时待命。

当天猫双11零点钟声敲响,天猫、淘宝上每一件商品的交易数据,都将在张北数据中心汇聚,机房里每一盏服务器上亮起的巡视灯,都意味着数以亿计的交易数据流正在这里传送。

张北数据中心机房

千里之外,大屏幕上不断刷新跳跃着最新成交数字,聚光灯外,张北就像是一个偏远寂静的“风口”,在零点无数人热火朝天剁手狂欢的同时,运维工程师们正在寒夜里巡逻,他们坚守着网购盛宴的最后一道防线,也改变着这座坝上小城的风景。

阿里的“戍边战士”

这是胡国亮连续参与的第7个天猫双11,作为阿里云IDC研发事业部的运维工程师,2016年9月张北数据中心启用之后,他的工作地点便由北京转战到了张北。

这里和首都相距仅300公里,却是完全不一样的世界。这座坐落在河北西北的县城,没有直达的飞机与高铁,如果不是自驾,从北京出发需要转乘列车、大巴和出租车三种交通工具才能到达。

张北数据中心周围,既没有店铺林立的繁华,也没有市井百态的喧嚣。园区之外,兴许偶尔能看到一两个赶着成群牛羊路过的牧民,此外,目之所及,只有一片空旷无边的大平地。

张北草原天路的冬季

选址张北,是为了让阿里数据中心的节能效果逼近极限值。

地处坝上的张北地理条件独一无二,年平均气温只有2.6℃,全年大约只有40天需要开启传统压缩机空调,仅制冷能耗就可以降低59%,加上风能、太阳能等丰富的绿色能源,这让张北成为了数据中心的绝佳选址地。

“作为阿里第一个自建的基地型数据中心,张北有自主研发的液冷、新风制冷等节能降耗技术,这也是业界未来的发展方向。我就是想趁着自己年轻,投身到张北来,让自己的技术视野更开拓。”胡国亮说。

胡国亮

然而,从大城市中心来到偏僻的小县城远郊,是胡国亮和运维工程师们首先要面临的心理挑战。在张北,相比跟人交流,胡国亮与机器“对话”的时间更久。

在“智能设备大脑”的智能监控辅助之下,可以减少一定的巡检工作量,但胡国亮依然要对园区设备做好实地的保障和测试,服务器、发电机等设备出了什么“症状”,他一听一看就能分辨得清清楚楚。

工程师在冷冻机房巡查管道

日夜与机器和设备相伴,当了两年多的“巡查兵”,即使是节假日,胡国亮也要坚守岗位。2019年的除夕到正月初二,胡国亮就是守在ECC监控室里度过的。不仅要确保数据中心水、电、供油等基本设施正常运转,也要防寒抗冻应对突发情况。在胡国亮看来,数据中心另一头连接着的是每一位用户,不能有丝毫差池。

与胡国亮一样,运维工程师司加详来到张北后,心里感觉自己像是一个“驻守边疆的战士”,虽然地处偏远,但是肩上的责任却更重了。

为了对故障作出最快速度的响应,司加详平时就住在园区的宿舍里,就算晚上下班走出值班室回到宿舍,心里的弦也始终绷得很紧,一旦紧急故障的铃声响起,就说明园区有设备出事了,他脑中立马就要启动最高级别的响应,迅速投入工作。

零下38℃的极寒考验

极寒环境适合数据中心,却为工程师带去了严峻考验。每年12月到1月份,张北最低气温可以达到零下38.6℃,但是整个数据中心园区内外的设备,却依旧需要照常巡检,在极寒天气里,发生紧急抢险任务的概率也更高。

在张北数据中心,防风护目眼镜和硬壳安全保护帽是运维工程师的冬季标配。

每天,运维巡检人员都要爬上设在20多米高楼顶的冷却塔,检查中央温控设备是否正常运转、有无冰冻的情况,即使最寒冷的日子里也不例外。

运维人员冬季夜晚在楼顶巡查

“双11才是张北数据中心降温的开始,双12、春节则是天气最冷的时候,巡检冷却塔,晚上我们顺着钢制的楼梯向上爬的时候,必须带上手套,否则手在钢管楼梯上一扶,很可能被黏住。楼顶风大,有时候刮得睁不开眼、张不开嘴,最冷的时候在外面待5分钟,就足以冻到没有知觉。”司加详说。

今年3月初,一场紧急抢险让司加详至今记忆犹新。当时,许多城市已春暖花开,但张北依旧大雪肆虐。由于极寒天气,园区的供水管在清晨时分被冻裂。司加详第一时间就与同事们到达现场,发现所有水管井盖,都被埋在厚达10cm的积雪之下。

为此,四五个同事在冰天雪地里奋战了一整个上午,扫雪、排查、修整,汗水和着雪水灌进鞋子和衣服里,冰凉刺骨。冷得实在是受不了的时候,大家就靠跺脚恢复知觉。所幸的是,供水管故障点被及时找到,经过抢修之后,园区的供水在一天之内恢复了正常。

在积雪覆盖的园区里施工,已成为运维工程师们的日常

偏远、寒冷是张北的底色,有一点火星反而显得更加温暖。在胡国亮看来,张北的冬天虽然寒冷,但早晨的阳光照耀在身上的时候,感觉依然是温暖幸福的。

去年10月,园区里有了新的食堂,但胡国亮还会怀念之前跟同事们一起在园区外的路边摊上,撸着麻辣烫、吃着煎饼果子时的那种香气和热乎劲儿;自己生日的时候虽然没能回家,却有同事们送来的祝福和惊喜;最期待的就是晚上回宿舍与三岁儿子视频的时刻,驻扎在张北一个月才能回河北石家庄的老家一趟,但每天也能远远地看到着他的成长……

莜麦田里的守望

随着张北数据中心的启用,三年来这一片原本地处远郊的荒芜之地,也正在发生着改变。

“刚来的时候,张北园区还在建,周围一片光秃秃的,附近只有公路和一条河。现在张北的数据中心三大园区已经建成。老远就能看到一栋栋橙色的建筑物。”自2016年就来到张北园区的行政负责人高百万说。

张北数据中心建设变迁

今年,为让张北园区多一片绿色,大伙儿决定在春末夏初气温回暖的时候,在园区外的荒地上种上具有张北特色的植物——莜麦和格桑花。5月10日“阿里日”那天,张北的工程师们带着家属们,一起在园区外播种下了一片绿油油的莜麦田。

两种生命力顽强的植物在这片土地上迅速生长,秋天来临的时候,金灿灿的莜麦与盛开的格桑花交相辉映,十分引人注目。

张北园区外多了一片绿色

到了10月,莜麦已经结出了沉甸甸的麦穗。在行政同学的组织之下,园区的工程师们和行政工作人员们一起将麦穗收割下来,许多从未干过农活的运维工程师们拿起镰刀,捧起一捆捆麦穗,脸上带着农民伯伯丰收时才有的笑容。

“我们的园区有了新的风景,当秋天希望和喜悦来到身边,犹如生活里的蜜糖,驱散了身体的劳累和疲倦。”运维工程师于佳文在阿里巴巴的交流社区帖子里写道,还配上了自己身穿“战袍”手举莜麦,与园区同事们的合影照片。来张北数据中心做运维工程师,是于佳文大学毕业后的第一份工作,这次收割莜麦的分享,让他在阿里社区获得了很多小伙伴的点赞。

“咱们自己种的麦子,咱们自己收着。等双11的时候,我们寄到各个园区,预祝今年的双11大麦(大卖)!”行政负责人高百万还带领着工程师们,将收下的一箱箱莜麦扎成捆,打包寄送到杭州、北京园区,传递来自张北,对今年双11的祝福和期盼。

寓意“双11大卖”的莜麦送往各个阿里园区

剩下来的莜麦,则被擀成莜麦皮用来包饺子,慰劳在张北园区为天猫双11工作的每一位阿里人。

最绿色最省电的双11

“一份耕耘一份收获,在张北探索数据中心的节能降耗技术,其实就像是在荒地上种莜麦,用技术拓荒。”多年来,最让司加详感到有成就感的是,随着数据中心的建成,张北远郊的电路、光缆和机房设备系统,从零开始到如今已经越来越完善,县城远郊成为全国领先的数据港基地。

今年双11期间,张北园区全球最大且独一无二的浸没式液冷服务机群也投入使用。

在特殊的绝缘冷却液里,服务器运算产生的热量可以直接被吸收进入外循环冷却,让散热能耗趋近于0,整体节能可达70%以上,使得园区的能耗再次降低。在这一“黑科技”的加持之下,张北数据中心的年均PUE(能源使用效率)可实现1.25,最低可达1.13。

如此大规模的浸没式液冷服务机群在全国尚属首例,实际操作中遇到的新难题,比如如何补液、如何维修故障元器件等,都需要依靠阿里数据中心运维工程师自主探索研发的新技术来攻克难关。

“对于运维部门来说,由于浸没式液冷技术让服务器处于完全密闭空间,相比风冷散热,减少了日常维护工作量。但一旦出现故障需要维修,就比一般的风冷散热机房更依赖高度自动化的设备。比如要从液体里取出一块坏掉的CPU,风冷机房里一般用手控制就行,而液冷机房里,则要运用我们自主设计研发的电动机械吊臂自动化捞取、更换。”胡国亮介绍说。

此外,AI技术也被应用到数据中心里,算法模型可根据外部温度优化服务器负载,实现更智能化电力和热能管控。

新一代绿色“黑科技”全面支撑着今年双11的电商交易支付、物流等环节。如今,每一万笔电商交易的耗电量已经控制在2度电以内,这意味着仅今年天猫双11一天,就能为社会节省超过20万度电的能耗量。

未来,这些节能技术会更大规模地在张北数据中心覆盖,并向深圳河源、江苏南通的新绿色数据中心推广应用。

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/188496.html