“服务器一死企业整个业务就停摆了,你问我为什么不让服务器永远活着,那个时候还没有‘云计算’啊……”中国航空技术国际控股有限公司(下称“中航国际”)信息化推进办公室主任朱东边说边摊开了双手,这是他为记者做的一个关于“云计算”出现之前的形象假设。
而当“云计算”呼啸而来时,企业自建私有云却面临着无路可循的艰难境地。一家大型央企的CIO在一次信息化会议中就曾公开质疑,“每次开会把私有云说得很热闹的大多是软件服务商,到现在为止还没有企业自建私有云,这时候建企业私有云不靠谱吧?”
正是在这样的猜测和质疑中,中航国际选择了自建私有云的大胆尝试,其实此时的朱东恐怕也并未意识到,中航国际这一探索性创举已经于不经意间开启了企业私有云领域的“潘多拉魔盒”,让企业看好但无突破的私有云领域在中航国际已经破晓。
“我们已经掌握了私有云的放置技巧,现在私有云上的信息化系统与服务器的关系,就像《西游记》里的孙悟空与他自己的汗毛,死掉的是汗毛变的孙悟空,而孙悟空本人却永远也死不了。”朱东如此形象评价中航国际自建的私有云。
尴尬的“替身”
中航国际于2007年开始实施“大集中”的ERP模式,全国各地以及海外分支机构相继将服务器统一归到总部,“全公司所有业务的服务器都集中在我这儿,”朱东说,“从那时起我就没睡过一天安稳觉,总觉得这就像埋下了一颗‘隐形炸弹’,不知道什么时候就会被引爆。”
实际上,中航国际的企业性质就已经决定了企业信息化的复杂性与艰巨性。中航国际以国家防务和民用航空所需的航空技术和产品进出口为核心业务。除了航空产品之外,还有大宗政府产品出口、船舶和大型成套设备出口、一般贸易业务,以及电子制造、零售、钟表业、房地产、酒店与物业管理、矿产资源等业务。飞亚达手表、深南电路板、天马液晶显示板等都是该公司所属企业生产的。用朱东的话来说“公司经营的业务看似有点杂”。
中航国际是一个多业务形态的跨地域大型集团公司,在国内有12个子公司、在全世界30余个国家和地区设有60多家海外机构,拥有7家上市公司,公司员工超过5万人,资产规模逾1000亿元,年销售收入达600亿元。
朱东心里清楚,这样一个大型国企,在全公司实施“大集中”的ERP模式,意味着公司所有的业务将由总部的服务器统一协调运行,如果总部的服务器因地震等不可控因素出了故障,那么公司的整个业务运营将面临停摆的严峻考验。
“假如有一天,服务器‘啪’的一下,出现故障而瘫痪了,那又该怎么办?”在ERP系统上线之前,朱东不断思考着,试图找到万全之策。
为了避免“隐形炸弹”被引爆,中航国际在离总部30公里的地方安装了实时灾备系统。在几十公里外的另一个机房,有一个和总部机房里的ERP系统一模一样的系统,而每做一个业务总部服务器上的数据就会随着实时传过去,这就相当于“为总部的服务器找了个替身”。
在朱东等人的周密部署下,似乎一切都是可控的,但是,在一次主动发起的非常逼真的信息化系统灾备演习当中暴露出的问题使得朱东像被一盆凉水泼了个透心凉,那次以后他对现有灾备系统的安全性产生了高度的怀疑。
灾备系统平时处于一个半休眠的状态,它虽然活着但是不能工作,只能接受数据,公司做一点业务就传一点数据过来,朱东清楚,系统真正启动起来是需要花时间的,而到底要花多少时间,这正是灾备演习的核心目的。
2008年的一天,在中航国际信息化系统和往常一样正常运行之时,“啪”的一下,系统突然出故障了,为了确保全公司上下5万多人正常工作,朱东立即吩咐手下的工程师将离总部三十公里的机房里的备份系统启动,然而时间一分一秒地过去了,工程师急地直跺脚,朱东的心也越揪越紧,眼睛盯着电脑屏幕上一分一秒正在流逝的时间。直到1小时40分钟之后,灾备系统才正式启动,各项业务也才开始正常运行。这是一次对于“替身”应急启动演习的场景,虽然只是一次演习,却让朱东不得不暗自思索,“在我精心准备、布局到位的情况下,启动灾备系统还需要1小时40分钟,那么在无准备的突发情况下,还不知道何时能启动起来。”这让朱东的神经重新紧绷起来,“灾备系统的‘替身’功能真的太差了”。
与此同时,让朱东颇为头痛的还有一个问题,那就是在数据传输过程当中存在不可控因素。从总部服务器向灾备系统数据传输的过程中,经常有第三方施工将线路挖断的情况发生,或者电信、网通自己出现了什么问题,导致公司的专线系统停滞半小时,一停数据就传不过去了,这就出现了新数据传不过去,灾备系统中的数据还是老状态的情况。“此时,备份系统的数据就和正式系统的数据不一样了,也就是说出错了。”朱东告诉记者。
随着中航国际在全公司对ERP系统的持续推广,朱东越是觉得自己就如“刀尖上的舞者”,时刻谨慎地跳着舞,却不知何时就会被尖刀刺得遍体鳞伤。
那年“云计算”还没兴起,自建灾备系统只是下下策,却也是唯一能把可能的损失降到最低的方法。而当“云计算”真的来临时,朱东感到,幸福真的来敲门了。