中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

 首頁 > 新聞 > 專家觀點 >

大數(shù)據(jù)熱背后的冷思考

2012-11-22 09:59:31   作者:吳勇毅   來源:CCW    評論:0  點擊:


  繼云計算、社交網(wǎng)絡之后,如今大數(shù)據(jù)(Big Data)風起云涌,已成為2012 年信息技術領域最時髦的詞匯之一。而相比大數(shù)據(jù)的興起,以前以商業(yè)智能分析而著稱的BI開發(fā)商卻頗為失落。有人大膽預測,未來10年,與大數(shù)據(jù)相關的商務智能分析將引領管理信息化的發(fā)展。

  大數(shù)據(jù)

  真的那么必須?

  通常所說的大數(shù)據(jù)是具有3種特性的數(shù)據(jù),即大數(shù)據(jù)量(Volume)、高生成速度(Velocity)和多數(shù)據(jù)類型(Variety)。大數(shù)據(jù)量指的是數(shù)據(jù)海量,如今有許多企業(yè)已經(jīng)面臨單日數(shù)據(jù)量以數(shù)十、數(shù)百TB的速度增加,而總數(shù)據(jù)量也達到了PB(Petabyte)等級,這樣的數(shù)據(jù)量已讓傳統(tǒng)的數(shù)據(jù)庫難以處理;高生成速度是指企業(yè)數(shù)據(jù)增加的速度越來越快,諸如移動化、社交網(wǎng)絡的廣泛應用,使得數(shù)據(jù)增加的速度比傳統(tǒng)的企業(yè)應用程序要快很多,一旦數(shù)據(jù)增生速度加快,數(shù)據(jù)處理、分析的速度也得跟上;多數(shù)據(jù)類型是指數(shù)據(jù)的多樣性,時下人們上互聯(lián)網(wǎng)不只是看看資訊,同時也在不斷地產(chǎn)出數(shù)據(jù):上傳照片、上傳視頻、發(fā)微博;另一方面,IT深入工作生活中的各個角落,各種各樣的傳感器、監(jiān)控器也時刻不斷產(chǎn)生各種數(shù)據(jù),數(shù)據(jù)的形式已日趨復雜、多樣了。這就催生了大數(shù)據(jù)技術的強烈需求。

  雖然如何解決日漸緊迫的大數(shù)據(jù)處理已成了企業(yè)管理信息化、現(xiàn)代化的必然需求,但國內(nèi)的大數(shù)據(jù)領域到底有多活躍?大數(shù)據(jù)真的如一些廠商所描繪的那么強大、好用,成為每個企業(yè)所必需的嗎?

  在一片叫好聲中,部分專家和業(yè)內(nèi)人士顯得小心謹慎,甚至不乏非議。一些專家認為,除了大量的研討會和各類公司宣稱進軍大數(shù)據(jù)領域的雄心之外,其實際進展至今難見成效。許多企業(yè)CIO認為,國內(nèi)能利用大數(shù)據(jù)背后的價值的行業(yè)主要集中在金融、電信、能源、證券、煙草等超大型、壟斷型企業(yè),其他行業(yè)談大數(shù)據(jù)為時尚早,大數(shù)據(jù)在企業(yè)的應用并不是說只要開放了數(shù)據(jù)、應用一些技術就可以輕易地發(fā)現(xiàn)“金礦”。目前國內(nèi)大數(shù)據(jù)應用似乎正在呈現(xiàn)這樣的狀態(tài):投資人活躍,技術和服務供應商熱心,媒體高調,而大量應用企業(yè)迷惑。

  有人更是批評“大數(shù)據(jù)是在既有的方案上包裝了一下,實質是新瓶裝舊酒,只不過更時髦”,海量數(shù)據(jù)時代的數(shù)據(jù)應用并沒有給多少企業(yè)帶來革命性的變化,在 MapReduce(Hadoop中采用的編程模型,用于大規(guī)模數(shù)據(jù)集的并行運算)出現(xiàn)之前,也有企業(yè)能夠輕松地對數(shù)據(jù)進行大規(guī)模并行計算了,而 NoSQL 的出現(xiàn)也只是為處理數(shù)據(jù)的方式帶來了更多選擇罷了,并沒有革命性、實質性的飛躍。比如,某廠商說,利用其大數(shù)據(jù)技術,電子商務網(wǎng)站就能知道“什么地方的人買東西最瘋狂”或是“什么型號手機最好賣”,這就是大數(shù)據(jù)分析的結果。對此有專家反駁“難道同樣基于數(shù)據(jù)倉庫系統(tǒng)的BI分析出來的結果和基于這個大數(shù)據(jù)出來的結果會有不同?”

  的確,從某些大數(shù)據(jù)應用中能挖掘出新的價值,但這個價值只是附加價值,沒有理由去夸大它,更沒有理由去無端地想象。大數(shù)據(jù)是機會,但現(xiàn)階段還只是少數(shù)人的機會,更多的是巨頭們的商業(yè)謀略。”廈門一位電子公司CIO也認為,“一些企業(yè)所需要的數(shù)據(jù)挖掘,傳統(tǒng)列式數(shù)據(jù)就能很好地處理。與其參加各種口沫橫飛的會議,還不如和工程師聊聊可以運用什么更實用的工具來解決具體問題。”

  大數(shù)據(jù)當立

  BI當下?

  讓大數(shù)據(jù)取代BI也是當下熱議的話題。實際上,大數(shù)據(jù)與BI之間的確存在著天然聯(lián)系,但并不是互相替代、排斥的關系。大數(shù)據(jù)與BI一個主要區(qū)別在于:與傳統(tǒng)基于事務的數(shù)據(jù)倉庫系統(tǒng)相比較,其能在BI的基礎上進行更大容量數(shù)據(jù)和非結構化數(shù)據(jù)處理,大數(shù)據(jù)分析不僅關注結構化的歷史數(shù)據(jù),它們更傾向于去對Web、社交網(wǎng)絡、RFID傳感器等非結構化海量數(shù)據(jù)進行更好地分析。整體相比BI而言,大數(shù)據(jù)更寬泛。

  以EMC公司的 Greenplum核心產(chǎn)品線為例,它分為Greenplum Database(數(shù)據(jù)倉庫)、Greenplum HD(Hadoop分析)和Greenplum DCA(數(shù)據(jù)計算設備),后者還是基于高性價比的工業(yè)標準x86服務器的MPP(大規(guī)模并行處理)分布式可擴展架構。這三個產(chǎn)品歸于一個產(chǎn)品線也可以看出傳統(tǒng)BI和大數(shù)據(jù)之間的內(nèi)在聯(lián)系。

  誠然,海量增長的非結構化、半結構化數(shù)據(jù)中確實有值得深入挖掘的價值,但這并不等于人們就要采用全新的方法、工具來處理它們。正如需求是漸進式的增長一樣,業(yè)務的變革也要以漸進式為主。

  筆者認為,大數(shù)據(jù)的創(chuàng)新性、先進性與前瞻性,不容否定,值得肯定,但當有人提出“大數(shù)據(jù)當立,BI當下”之論,就顯得過分武斷。在如今細分制勝的時代,功能并不是越多越好,功能過多反而顯得累贅,增加無謂費用。Gartner研究公司BI分析師RitaSallam曾表示,“大數(shù)據(jù)讓BI更有價值和更有利于業(yè)務發(fā)展。我們總是會需要看看過去的數(shù)據(jù),當你擁有大數(shù)據(jù)時,你更應該這樣做。BI并不會被大數(shù)據(jù)取代消失,它的作用通過大數(shù)據(jù)被放大了。至少在相當長的時期內(nèi),大數(shù)據(jù)還難于取代傳統(tǒng)BI。”

  時至今日,各種關于大數(shù)據(jù)與BI軟件誰優(yōu)誰劣的交鋒仍不斷泛起,對用戶而言,必須認真權衡,到底利用大數(shù)據(jù)后能給企業(yè)帶來了多少額外的價值?這種增加的價值是否能讓企業(yè)的投入值得?而且更為重要的一點是,是否只要使用大數(shù)據(jù)就一定能夠給企業(yè)帶來以前不可能實現(xiàn)的價值?這些是當下用戶們最需要重點考慮的。

分享到: 收藏

專題

易门县| 昌宁县| 靖远县| 太康县| 吴江市| 佳木斯市| 桓台县| 汶上县| 开阳县| 珠海市| 浦县| 乌苏市| 大关县| 上思县| 越西县| 兰溪市| 读书| 青阳县| 开封市| 潜江市| 乐平市| 东港市| 鄢陵县| 盘锦市| 玛曲县| 四川省| 灵台县| 雷州市| 林周县| 五原县| 多伦县| 虎林市| 阿拉善左旗| 南昌市| 郑州市| 安顺市| 云林县| 轮台县| 寿宁县| 孟村| 项城市|