認知升級|如何正确看待大(big)數據與雲計算技術?
DT時(hour)代,未來(Come)已來(Come)——數據“大(big)爆炸”
首先要(want)明白大(big)家爲(for)何從前幾年開始談大(big)數據了(Got it)?這(this)是(yes)一(one)個(indivual)基本問題,包含着對當下數據現實的(of)基本認識。一(one)個(indivual)不(No)可忽視的(of)事實是(yes),随着網絡和(and)信息技術的(of)不(No)斷普及,人(people)類産生(born)的(of)數據量正在(exist)呈指數級增長。大(big)約每兩年翻一(one)番,這(this)意味着人(people)類在(exist)最近兩年産生(born)的(of)數據量相當于(At)之前産生(born)的(of)全部數據量。
數據“大(big)爆炸”
對于(At)如此巨量數據(而且單純的(of)增量數據都是(yes)一(one)個(indivual)巨量),與之相關的(of)存儲、分析、流轉、使用(use)到(arrive)交易等等環節産生(born)了(Got it)一(one)系列關聯的(of)問題,而在(exist)當下的(of)時(hour)間節點,我(I)們(them)不(No)得不(No)明确面對,而不(No)僅僅是(yes)先找個(indivual)地(land)方把數據存起來(Come)。
大(big)數據有兩大(big)特點,一(one)是(yes)數據來(Come)源多源,包括各種結構化數據和(and)非結構化數據,如網絡日志、視頻、圖片、地(land)理位置信息等等,同時(hour)數量相對巨大(big),大(big)數據中的(of)‘大(big)’本身就是(yes)一(one)個(indivual)相對的(of)概念;二是(yes)數據處于(At)“on line”即在(exist)線的(of)狀态,能夠随時(hour)被吸取和(and)關聯,并進行分析。
一(one)般來(Come)講,更多智能硬件和(and)這(this)能設備的(of)加入,更多數據實時(hour)産生(born),于(At)是(yes)就需要(want)大(big)數據技術來(Come)實現對數據信息的(of)價值挖掘。大(big)數據技術包括了(Got it)數據采集,數據存取,基礎架構,數據處理,統計分析,數據挖掘,模型預測,結果呈現等八個(indivual)方面。
而以(by)上(superior)幾個(indivual)方面都離不(No)開雲平台和(and)雲計算能力,比如說數據采集之後的(of)數據存儲,現在(exist)很多非核心敏感數據都可以(by)存儲在(exist)雲端;數據挖掘也是(yes)需要(want)通過雲計算和(and)機器學習才能實現。那什麽才是(yes)雲計算呢?
雲計算——低成本部署、随需使用(use)的(of)計算大(big)腦
所謂雲計算是(yes)“能通過網絡訪問可擴展的(of)、靈活的(of)、可共享的(of)物理或虛拟資源池,并按需自助獲取和(and)管理這(this)些資源的(of)模式。其中資源實例包括服務器、操作(do)系統、網絡、軟件、應用(use)和(and)存儲設備等。
那如何理解大(big)數據與雲計算的(of)關系?
在(exist)中國(country)計算機學會大(big)數據專家委員會副主任車品覺看來(Come):人(people)工智能、深度學習,這(this)些都是(yes)二十年前就有的(of)技術,但是(yes)二十年前沒有大(big)數據,沒有可以(by)關聯的(of)數據。所以(by)大(big)數據的(of)故事從有了(Got it)關聯才真正開始。
阿裏巴巴集團首席技術官王堅在(exist)一(one)次小型論壇上(superior)分享到(arrive):“雲計算是(yes)工業時(hour)代的(of)電,大(big)數據就是(yes)福特生(born)産線,雲存儲就是(yes)鋼鐵工業。也就是(yes)說,沒有鋼鐵,就沒有電,就不(No)會有大(big)規模工業化生(born)産。沒有雲計算,大(big)數據不(No)會出(out)來(Come),如果雲計算沒有解決雲存儲的(of)問題,也不(No)會出(out)來(Come)。”