大數據技術在發展 挑戰與機遇並存

雲計算 大數據 並行計算 可視化 大數據觀察 2017-06-05

大數據技術是在傳統數據處理手段無法應對海量數據的實時需求的情況下,採用新的信息技術來應對大數據爆發進行數據處理的技術。大數據技術一般可以包括基礎架構支持、數據採集、數據存儲、數據計算和數據展現交互等。

大數據技術在發展 挑戰與機遇並存

大數據技術的分類

大數據技術涵蓋的範圍十分廣闊。基礎架構支持方面主要包括了支撐大數據處理的基礎架構級數據中心管理、雲計算平臺、雲存儲設備及技術、網絡技術、資源監控等技術。而為了處理數據,則需要有大規模物理資源的雲數據中心和具備高效的調度管理功能的雲計算平臺的支撐。

數據採集技術方面包含了數據採集的手段和數據處理技術。一般來講數據採集最基礎的需要各類傳感器和軟硬件設施,然後需要進行ETL(採集、轉換和加載)過程,對數據進行清洗、過濾、校驗、轉換等各種預處理,然後將有效的數據轉換成為合適的格式及類型。而部分企業還需要為了應對多源異構的數據採集和存儲訪問設計數據總線,以便於企業各個應用和服務之間的數據交換及共享。

數據存儲技術則是在經歷了轉換之後,針對海量數據進行存儲歸檔。一般會採用分佈式文件系統以及分佈式數據庫進行存儲,將數據分佈到多了存儲點中,提供備份、安全、訪問接口及協議等機制。

大數據技術在發展 挑戰與機遇並存

大數據技術在不斷髮展中

而數據計算一般包括了數據查詢、統計、分析、預測、挖掘、圖譜處理、BI商業智能等各項相關技術,數據計算是數據處理的關鍵組成,也是大數據技術的核心部分。通過數據計算可以將大數據從數據轉換為價值。

數據展現交互是與用戶最貼近的一步。由於數據的最終使用者為用戶,目標為給生產、運營、規劃提供決策支持,因此一般會選擇更為直觀便捷的方式將數據的價值和內涵展示出來,讓用戶能夠更有效的利用數據發揮價值。這一步出傳統的報表和圖形之外,當前最流行的手段莫過於可視化工具和人機交互等。

大數據技術面臨的挑戰

大數據技術在不斷的發展過程中並非一帆風順,其也遇到了不少挑戰。

大數據面臨問題並不少

在大數據採集方面,如在不損失數據本身價值的情況下儘可能的將數據集的量降低變小是個問題,在數據的清洗和去除過程中,如何有效的處理大數據,讓其不損失價值,從一個平面的大數據中提取高附加價值的概念、理論以及知識才是關鍵。

大數據管理方面則需要面對多種不同類型的數據。由於當前數據以非結構化數據為主,而且這一趨勢正在加強,如何面對分佈、多態、異構的大數據進行管理,還需要更為有效和快捷的手段。

大數據存儲方面,結構化數據儘管存儲較為便捷,可是在海量數據的查詢、統計和更新方面效率較低;如果面對非結構化數據,如視頻、音頻、文本、圖片等,存儲、檢索都會存在一定困難,而且佔用空間較大。對於半結構化數據,存儲、分析都需要進行結構化數據轉換,或者按照非結構化數據存儲,難度較大而且不利於實時處理。

大數據技術在發展 挑戰與機遇並存

技術在發展 挑戰與機遇並存

數據計算方面,分佈式計算與並行計算都可以提供有效的技術支持,但是如何提供有效的利用手段,開戰大數據分析處理還需要進一步研究,而且在計算方面盡力“傻瓜式”開發的現在,如何找到切實可靠的理想結果也是一個重點。

大數據應用領域,應用大數據輔助具體行業的落地仍然有待提高,如何快速開展治安防控、警情研判及指揮決策,發掘行業信息資源價值,提高領域大數據的利用率都需要進一步的落地實施。

大數據技術的提高是顯而易見的,但是大數據落地是一個重大課題。提高大數據技術,增強大數據應用還會是很長時間裡的主旋律。

相關推薦

推薦中...