12月13日消息,在由云基地主辦的“中關村大數(shù)據(jù)日”活動上,中國聯(lián)通研究院副院長黃文良介紹,“今年,中國聯(lián)通成功將大數(shù)據(jù)和Hadoop技術引入到‘移動通信用戶上網(wǎng)記錄集中查詢與分析支撐系統(tǒng)’。截止到目前,我們已經(jīng)部署了4.5PB的存儲空間。其中,4.5PB的存儲分布在300個數(shù)據(jù)節(jié)點上,即每個節(jié)點配備15TB的存儲空間。如此一來,系統(tǒng)每天有能力處理700億條上網(wǎng)記錄。”
中國聯(lián)通對大數(shù)據(jù)的探索源自于2010年中國聯(lián)通數(shù)據(jù)大集中策略的提出。2009年,中國聯(lián)通3G業(yè)務正式商用,提出“統(tǒng)一品牌、統(tǒng)一業(yè)務、統(tǒng)一包裝、統(tǒng)一資費、統(tǒng)一終端政策、統(tǒng)一服務標準”的“六個統(tǒng)一”策略。這意味著中國聯(lián)通要走一條數(shù)據(jù)大集中的路線。
然而,數(shù)據(jù)大集中將使得中國聯(lián)通面臨著不少挑戰(zhàn)。中國聯(lián)通信息化部總經(jīng)理柳博亮曾在公開演講中指出挑戰(zhàn)來自五個方面,分別是大用戶量下的集中系統(tǒng)的處理能力,如何快速實現(xiàn)對市場變化需求的響應,支撐業(yè)務運營的可靠性,與個性化業(yè)務的支持能力以及集中環(huán)境下的運維體系。
適逢大數(shù)據(jù)的出現(xiàn),為聯(lián)通應對這些挑戰(zhàn)找到了一條途徑。2010年,中國聯(lián)通開始著手大集中的數(shù)據(jù)中心建設,同期引入Hadoop技術。目前,Hadoop被成功部署到中國聯(lián)通的“移動通信用戶上網(wǎng)記錄集中查詢與分析支撐系統(tǒng)”。
黃文良表示,“我們之前很擔心一旦數(shù)據(jù)大集中,會出現(xiàn)用戶查詢響應速度慢等問題,從而影響用戶感知。顯然,這對于保持用戶黏性顯然是不利的。如今引入Hadoop技術后,假如用戶查詢上網(wǎng)記錄,系統(tǒng)在1秒內(nèi)便可呈現(xiàn)數(shù)據(jù)。”
“我們確確實實體會到,自己是分布式計算的受益者,是非結構化數(shù)據(jù)庫的受益者,更是大數(shù)據(jù)的受益者。”黃文良在本次活動上獲得“大數(shù)據(jù)最佳實踐獎”之際由衷地說道。
其實中國聯(lián)通并不是唯一一家吃“螃蟹”的運營商。中國移動可是說是國內(nèi)最早開始Hadoop技術研發(fā)的運營商。2007年3月,中國移動啟動“大云”計劃,當年7月,便利用閑置資源搭建第一個Hadoop平臺。而在中國移動“大云”1.5產(chǎn)品總體架構中,分析型PaaS產(chǎn)品底層便是基于Hadoop數(shù)據(jù)存儲和分析平臺。目前,中國電信也正在進行大數(shù)據(jù)技術的實驗室研究工作。