資料中心的成立,就意味著大資料專案的上馬。
大資料,指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程最佳化能力的海量、高增長率和多樣化的資訊資產。
麥肯錫全球研究所給出的定義是:一種規模大到在獲取、儲存、管理、分析方面大大超出了傳統資料庫軟體工具能力範圍的資料集合,具有海量的資料規模、快速的資料流轉、多樣的資料型別和價值密度低四大特徵。大資料技術的戰略意義不在於掌握龐大的資料資訊,而在於對這些含有意義的資料進行專業化處理。換而言之,如果把大資料比作一種產業,那麼這種產業實現盈利的關鍵,在於提高對資料的“加工能力”,透過“加工”實現資料的“增值”。
從技術上看,大資料與雲端計算的關係就像一枚硬幣的正反面一樣密不可分。大資料必然無法用單臺的計算機進行處理,必須採用分散式架構。它的特色在於對海量資料進行分散式資料探勘。但它必須依託雲端計算的分散式處理、分散式資料庫和雲端儲存、虛擬化技術。
雲端計算這個概念首次在2006年8月的搜尋引擎會議上提出,成為了網際網路的第三次革命。追溯本源的話,它的產生和發展與之前所提及的平行計算、分散式計算等計算機技術密切相關,都促進者雲端計算的成長。但追溯雲端計算的歷史,可以追溯到1956年,ChristopherStrachey發表了一篇有關於虛擬化的論文,因為正式提出虛擬化。虛擬化則是今天雲端計算基礎架構的核心,是雲端計算發展的基礎。而後隨著網路技術的發展,逐漸孕育了雲端計算的萌芽。
在上世紀的90年代,計算機網路出現了大爆炸,出現了以思科為代表以一系列公司,隨即網路出現泡沫時代。
直到2004年,Web2.0會議舉行,Web2.0成為當時的熱點,這也標誌著網際網路泡沫破滅,計算機網路發展進入了一個新的階段。在這一階段,讓更多的使用者方便快捷地使用網路服務成為會聯網發展亟待解決的問題,與此同時,一些大型公司也開始致力於開發大型計算能力的技術,為使用者提供了更加強大的計算處理服務。再到06年,Google執行長埃裡克·施密特在搜尋引擎大會首次提出“雲端計算”的概念。這是雲端計算發展史上第一次正式地提出這一概念,有著巨大的歷史意義。
07年以後,“雲端計算”迅速成為了計算機領域最令人關注的話題之一,同樣也是大型企業、網際網路建設著力研究的重要方向。因為雲端計算的提出,網際網路技術和IT服務出現了新的模式,引發了一場變革。08年,微軟釋出其公共雲端計算平臺,由此拉開了微軟的雲端計算大幕。同樣,雲端計算在國內也掀起一場風波,許多大型網路公司紛紛加入雲端計算的陣列。
09年,阿里軟體建立首個“電子商務雲端計算中心”。同年11月,華夏移動雲端計算平臺“大雲”計劃啟動。
到未來,雲端計算的重要性會變得越來越強。
再說大資料。
依託雲技術成長起來的大資料,同樣是未來網際網路的趨勢。如今這個社會是一個高速發展的社會,科技發達,資訊流通,人們之間的交流越來越密切,生活也越來越方便,大資料就是這個高科技時代的產物。原時空大馬哥在寶島的演講中就提到,未來的時代將不是IT時代,而是DT的時代,DT就是DataTechnology資料科技,顯示大資料對於阿里集團來說舉足輕重。
有人把資料比喻為蘊藏能量的煤礦。
煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大資料並不在“大”,而在於“有用”。價值含量、挖掘成本比數量更為重要。對於很多行業而言,如何利用這些大規模資料是贏得競爭的關鍵。
大資料的價值體現在以下幾個方面:對大量消費者提供產品或服務的企業可以利用大資料進行精準營銷、做小而美模式的中小微企業可以利用大資料做服務轉型、面臨網際網路壓力之下必須轉型的傳統企業需要與時俱進充分利用大資料的價值。
不過,“大資料”在經濟發展中的巨大意義並不代表其能取代一切對於社會問題的理性思考,科學發展的邏輯不能被湮沒在海量資料中。著名經濟學家路德維希·馮·米塞斯曾提醒過:“就今日言,有很多人忙碌於資料之無益累積,以致對問題之說明與解決,喪失了其對特殊的經濟意義的瞭解