ioe600

【連載三】

阿里巴巴如何“去IOE”

2013年5月17日,阿里集團(tuán)最后一臺(tái)IBM小機(jī)在支付寶下線(xiàn)。這是自2009年“去IOE”戰(zhàn)略透露以來(lái),“去IOE”非常重要的一個(gè)節(jié)點(diǎn)?!叭OE”指的是擺脫掉IT部署中原有的IBM小型機(jī)、Oracle數(shù)據(jù)庫(kù)以及EMC存儲(chǔ)的過(guò)度依賴(lài)。告別最后一臺(tái)小機(jī),意味著整個(gè)阿里集團(tuán)盡管還有一些Oracle數(shù)據(jù)庫(kù)和EMC存儲(chǔ),但是IBM小型機(jī)已全部消失。7月10日,淘寶重中之重的廣告系統(tǒng)使用的Oracle數(shù)據(jù)庫(kù)下線(xiàn),也是整個(gè)淘寶最后一個(gè)Oracle數(shù)據(jù)庫(kù)。這兩件事合在一起是阿里巴巴技術(shù)發(fā)展過(guò)程中的一個(gè)重要里程碑。

在阿里巴巴“去IOE”成功的大背景下,王堅(jiān)的觀點(diǎn)是:“去IOE”存在一定的技術(shù)挑戰(zhàn),“去IOE”不是簡(jiǎn)單改變軟件和硬件本身,用另一種軟硬件簡(jiǎn)單地取代已有的軟硬件,而是用新的互聯(lián)網(wǎng)技術(shù)和架構(gòu)取代傳統(tǒng)的IT技術(shù)和架構(gòu)。阿里巴巴本身并不賣(mài)軟件和硬件,但這種技術(shù)能力可以用云服務(wù)的方式來(lái)提供給第三方使用,讓云計(jì)算徹底改變傳統(tǒng)IT的基礎(chǔ)架構(gòu)。對(duì)大多數(shù)企業(yè)而言“去IOE最好的解決方式是采用云計(jì)算,而不是買(mǎi)來(lái)一臺(tái)新的機(jī)器替代掉原有機(jī)器。”

作為整個(gè)集團(tuán)的首席技術(shù)官,王堅(jiān)負(fù)責(zé)每年集團(tuán)IT預(yù)算和規(guī)劃,他意識(shí)到對(duì)于傳統(tǒng)IT廠(chǎng)商的依賴(lài)使得相關(guān)技術(shù)及其維護(hù)已不在阿里自己可管理的范圍之內(nèi),例如,大存儲(chǔ)對(duì)客戶(hù)而言基本就是“黑盒子”,客戶(hù)都不能自行進(jìn)行重要的維護(hù),主要依賴(lài)廠(chǎng)家通過(guò)WAN網(wǎng)絡(luò)或電話(huà)拔號(hào)連接上客戶(hù)內(nèi)部的大存儲(chǔ)進(jìn)行管理維護(hù)?!叭OE”也解決了淘寶和支付寶面臨的這類(lèi)影響長(zhǎng)遠(yuǎn)發(fā)展的問(wèn)題。

為什么阿里能夠率先成功?我認(rèn)為有三點(diǎn)重要原因:一是企業(yè)的戰(zhàn)略決心是否足夠強(qiáng)大,在這一點(diǎn)上沒(méi)有巧可以取;二是這項(xiàng)工作是否能夠堅(jiān)持到底,并愿意承擔(dān)技術(shù)上、組織上的各種風(fēng)險(xiǎn);三是,也是最重要的,要有使命感的人和團(tuán)隊(duì)去完成一件看起來(lái)不可能的事。從去“IOE”,也看得出阿里巴巴在技術(shù)上做出的戰(zhàn)略投入,當(dāng)然也包括飛天云計(jì)算平臺(tái)、數(shù)據(jù)庫(kù)、云OS操作系統(tǒng)等

 

Q:阿里巴巴為什么要做“去IOE”這件事?“去IOE”經(jīng)歷了怎樣的過(guò)程?

A:2008~2009年,在做整個(gè)集團(tuán)的預(yù)算時(shí),第一次提出了“去IOE”這件事。每年,我都要負(fù)責(zé)整個(gè)集團(tuán)技術(shù)預(yù)算擬定,當(dāng)看到阿里巴巴對(duì)計(jì)算需求成指數(shù)級(jí)增長(zhǎng),并跟業(yè)務(wù)增長(zhǎng)不成比例時(shí),就意識(shí)到如沒(méi)有技術(shù)的進(jìn)步,一定會(huì)影響公司長(zhǎng)遠(yuǎn)的發(fā)展。

做預(yù)算不僅僅是“錢(qián)”的問(wèn)題,而是考慮集團(tuán)未來(lái)如何發(fā)展的問(wèn)題,也是思考技術(shù)戰(zhàn)略的機(jī)會(huì)?!叭OE”不是一個(gè)人的決定,你需要分析企業(yè)業(yè)務(wù)情況,哪些業(yè)務(wù)適合嘗試“去IOE”,阿里比較幸運(yùn),當(dāng)時(shí)淘寶的技術(shù)團(tuán)隊(duì)愿意創(chuàng)新,去嘗試“去IOE”這件事,最早承擔(dān)這件事的技術(shù)和業(yè)務(wù)風(fēng)險(xiǎn)?!叭OE”的過(guò)程也是技術(shù)發(fā)展的過(guò)程,比如以淘寶為基礎(chǔ)形成了優(yōu)秀的Mysql數(shù)據(jù)庫(kù)團(tuán)隊(duì),也建立了自己開(kāi)發(fā)數(shù)據(jù)庫(kù)Oceanbase的團(tuán)隊(duì),現(xiàn)在的團(tuán)隊(duì)來(lái)自各事業(yè)部,雙管齊下,這是一個(gè)極大的長(zhǎng)期投入,不磨五年是磨不出來(lái)的。當(dāng)支付寶最后一臺(tái)IBM小機(jī)下線(xiàn)時(shí),整個(gè)技術(shù)團(tuán)隊(duì)是非常自豪的!

當(dāng)時(shí)我們考慮“去IOE”并不僅僅出于對(duì)成本的考量,成本只是最容易看得到的東西,最重要的是要滿(mǎn)足企業(yè)未來(lái)長(zhǎng)期發(fā)展的需要?;ヂ?lián)網(wǎng)時(shí)代,每一家企業(yè)都必須擁抱互聯(lián)網(wǎng),傳統(tǒng)IT架構(gòu)的軟硬件已經(jīng)無(wú)法滿(mǎn)足企業(yè)在這方面的發(fā)展。阿里巴巴的成功經(jīng)驗(yàn)表明原來(lái)依賴(lài)IBM、Oracle和EMC的系統(tǒng)是可以構(gòu)建在Commodity PC上的,這為大多數(shù)企業(yè)在云計(jì)算上搭建IT系統(tǒng)掃清了障礙,讓他們可以徹底擁抱云計(jì)算,擁抱互聯(lián)網(wǎng)。

 

Q:傳統(tǒng)企業(yè)“去IOE”的可能性有多大?哪些企業(yè)具備“去IOE”的條件和動(dòng)力?

A:如果對(duì)云計(jì)算帶來(lái)的沖擊認(rèn)識(shí)足夠,就會(huì)明白“去IOE”不是一次技術(shù)的升級(jí),而是一個(gè)時(shí)代的改變,云計(jì)算對(duì)傳統(tǒng)的IT和“開(kāi)源軟件”都是有沖擊的。這是行業(yè)的變化,不是一個(gè)技術(shù)策略的選擇。

正是因?yàn)檫@是一次IT基礎(chǔ)設(shè)施的變革,從硬件和軟件底層著手“去IOE”這件事情不該每個(gè)企業(yè)都做。如果要說(shuō)一個(gè)很直截了當(dāng)?shù)拇鸢?,我?huì)表明一個(gè)觀點(diǎn):如果企業(yè)覺(jué)得已有的云計(jì)算服務(wù)不能滿(mǎn)足IT需求,那么它適合自己完成“去IOE”,我認(rèn)為大部分傳統(tǒng)企業(yè)都是沒(méi)有可能和必要自己實(shí)現(xiàn)“去IOE”,其實(shí),要做“去IOE”這件事情,是有技術(shù)挑戰(zhàn)的,也受市場(chǎng)條件的約束,有機(jī)會(huì)成本問(wèn)題,當(dāng)然也有總體人才資源的限制。所以最好幫助大多數(shù)傳統(tǒng)企業(yè)用戶(hù)解決“去IOE”的途徑是云計(jì)算,云計(jì)算提供的計(jì)算服務(wù)可以將“IOE”去掉,對(duì)企業(yè)來(lái)講這是一個(gè)好的可以長(zhǎng)期發(fā)展的路徑。

對(duì)傳統(tǒng)企業(yè)來(lái)講,“去IOE”的根本是在做一個(gè)選擇,是在選擇是否信任云計(jì)算是一種公共服務(wù),就像企業(yè)信任國(guó)家電網(wǎng)供電一樣。當(dāng)你選擇了IBM的機(jī)器,實(shí)際上是覺(jué)得IBM的機(jī)器和這家企業(yè)是可以信任的。

大家經(jīng)常忽視一個(gè)奇怪的現(xiàn)象,一方面我們都承認(rèn)云計(jì)算是一種服務(wù),但是更多的廠(chǎng)商會(huì)和你談“私有云”,想把軟件和硬件賣(mài)給你,這時(shí)候“云計(jì)算是服務(wù)”就不見(jiàn)了。為了成功賣(mài)出軟件硬件,唯一可以說(shuō)的事情就是安全問(wèn)題,這是我看“私有云“的兩大問(wèn)題?!癐OE”本身是軟件時(shí)代或者說(shuō)買(mǎi)計(jì)算機(jī)時(shí)代留下的產(chǎn)物,而到了云計(jì)算時(shí)代,實(shí)際上變成一個(gè)買(mǎi)“計(jì)算”的時(shí)代,不是買(mǎi)“計(jì)算機(jī)”的時(shí)代,所以去IOE的方法應(yīng)該用服務(wù)的方式去掉?!叭OE”不是用一個(gè)技術(shù)替代一個(gè)技術(shù),而是一個(gè)新的時(shí)代到來(lái)了。這個(gè)過(guò)程中的挑戰(zhàn)是,你心理是否接受云計(jì)算,而不只是技術(shù)上是否接受。

企業(yè)自己去IOE意味著要重復(fù)阿里今天做的很多事情,這是一個(gè)長(zhǎng)期投入,而阿里云可以給企業(yè)“去IOE”幫助的是直接提供云計(jì)算服務(wù),我們已經(jīng)幫助一些小銀行做了;阿里也愿意將自己“去IOE”的經(jīng)驗(yàn)分享,這也是全社會(huì)的財(cái)富,但沒(méi)有辦法把“去IOE”的積累變成軟件硬件賣(mài)給企業(yè),我們不是傳統(tǒng)的IT設(shè)備和軟件提供商。

 

Q:您怎樣看待“去IOE”的人才培養(yǎng)過(guò)程?

A:我自己覺(jué)得,大多數(shù)人對(duì)阿里巴巴集團(tuán)技術(shù)人員的技術(shù)能力還不太了解,阿里巴巴的技術(shù)積累一定超出很多人的想象。我用另外一句話(huà)來(lái)說(shuō),“去IOE”這件事情,沒(méi)做成,肯定是我的責(zé)任;今天做成了,跟我一點(diǎn)關(guān)系都沒(méi)有。我們真的有很多很好的人才,比如說(shuō)像淘寶的一位員工,他對(duì)淘寶業(yè)務(wù)的熟悉,對(duì)技術(shù)的理解也不是一般人可以比的,更重要的是他愿意“革自己的命”,絕不擔(dān)心“去IOE“會(huì)讓自己原來(lái)的技能沒(méi)有用,這時(shí)候理想變得比什么都重要。

大多數(shù)嚴(yán)重依賴(lài)IOE的企業(yè)在技術(shù)人才培養(yǎng)有點(diǎn)“拿自己的錢(qián)給別人交學(xué)費(fèi),但卻給自己帶了手銬”,中國(guó)企業(yè)對(duì)技術(shù)的需求旺盛,超過(guò)世界上任何國(guó)家和地區(qū),所以技術(shù)上面臨的挑戰(zhàn)也超過(guò)了他們,但我們主要使用的是國(guó)外傳統(tǒng)IT企業(yè)的軟硬件,而別人也沒(méi)有現(xiàn)成的技術(shù)能解決你的問(wèn)題,我們自己也因?yàn)檫@種依賴(lài)而失去很多機(jī)會(huì)。阿里巴巴曾經(jīng)選用過(guò)Greenplum是一個(gè)很好的例子,付了很多學(xué)費(fèi)。?!叭OE”的經(jīng)驗(yàn)表明,現(xiàn)在我們有一次機(jī)會(huì)把我們的需求和錢(qián)用來(lái)發(fā)展適合長(zhǎng)遠(yuǎn)發(fā)展的技術(shù),讓IT圍繞自己的產(chǎn)品來(lái)發(fā)展。

 對(duì)于我們自己的人才選擇,阿里很謹(jǐn)慎,很多在國(guó)外廠(chǎng)商干過(guò)的頂級(jí)人才,并沒(méi)有輕松地收到聘書(shū),這是因?yàn)樵谄髽I(yè)中跟著別人做事,和在阿里用使命感開(kāi)闖出一片天空有很大不同?!叭OE”需要極其合適的人才,才能帶出一支像樣的隊(duì)伍,團(tuán)隊(duì)里每一個(gè)人的潛力也是逐漸被激發(fā)出來(lái)的。