AI和機器學習的快速發展惠及數據存儲行業

機器學習 人工智能 深度學習 軟件 ZD至頂網 2017-04-25

關於AI和機器學習的討論已經鋪天蓋地了,雜誌文章和電視新聞也在不停地談論這些技能潛在革新能力。但是我們必須警惕,AI和機器學習對數據存儲的需求是無限的。它們消耗了大量的存儲空間,而且對吞吐量也有無限的需求。

IDC最新的報告顯示,存儲收入在逐步萎縮,AI和機器學習的發展對於存儲供應商來說是一個好消息。但是行業產能將會被無限擴大,正如分析引擎將會與數據存儲庫產品爭奪一樣,將會以他們希望的速度來提供信息。

DataDirect Networks產品營銷高級總監Laura Shepard表示,機器學習的應用會很快地消耗掉基礎數據存取能力和管理基礎設施。原型和一代機器學習基礎設施通常建立在現存的企業存儲之上,或者有團隊會推出自己的白盒或者混合開源的國產、商用工具和應用程序。

因此, 對於大多數成功的機器學習項目來說,隨著規模增加都將會遇到問題;對於AI來書,大多數數據可以產生一個更好的結果。這也推動了機器學習項目的不斷增長。

Shepard表示,規模增加和減少的故障表明,如果不能以所需的速度提供數據訪問,不能擴大數據搜索的速度,那麼就不能使得數據存儲變得更加簡單和具有成本效益。任何失敗都會導致整個項目的失敗,因為如果不能提升輸入,或者增加機器學習網絡的深度,將就不能提高輸出的規模。

無法規模的數據轉換,以改善調查結果,並無法大規模的數據存儲在一個腳印,很容易或具有成本效益的管理。任何這些失敗可能脫軌的整體方案的進步,因為如果你不能增長你的投入或增加你的深度學習網絡的深度,你不能擴大你的輸出,說謝巴德。

Shepard認為,當這種情況發生的時候,我們看到第一代基礎設施開始有壓力了。

機會來臨

但是對於一些人的挑戰,對於另一些人是機會。隨著AI和機器學習應用的增長,它將吸引越來越多的創業公司來解決涉及的更多問題。

IT Brand Pulse高級分析師Frank Berry表示,管理數據中心基礎設施一直是一個需要積極部署的事情,並需要走在業務需求的前面。機器學習的目的是自動獲取更高的存儲能力、更加高可用的服務水平(減少每存儲單元所需管理員數)和更好的性能。

Zadara Storage的市場副總監Kevin Liebl繼續深入探討了這個話題。他相信正如自動駕駛汽車一樣,AI將讓數據存儲具有自我管理的能力和自動駕馭數據中心的能力。

自動化將會大大增加管理員能夠管理的機器數量,當服務器完全配備了分析和自動化服務管理軟件的時候,一名管理員能夠管理的服務器數量將會從今天的500臺增加到未來的20,000臺。Liebl認為,這種管理方式將會讓存儲管理更加簡單,花費更少的時間,並且更加有效率。

Liebl還補充到,存儲是數據中心自我運行的中心,因為所有的這種自動化需要記錄所有的活動,當然,這種記錄將會產生數據。隨著雲計算、移動化和IOT、社交媒體和分析的發展,數據將會大規模的增長。這就是為什麼所有的數據容量都將繼續以沒兩年翻一倍的速度增長。

Liebl 表示,AI在存儲行業的最大需求可能主要在於存儲管理能力,這讓系統能夠自動處理數據的急劇增長。

正如個人電腦重塑了業務世界一樣,AI和機器學習將會以同樣的方式來影響存儲行業的發展。正如個人電腦提高了個人應用能力到大規模企業數據庫和自動程序能力一樣,AI和機器學習很可能由消費者喜歡的功能演變為全方位的數據驅動程序,這將推動全球企業的發展。

Cloudian公司的CEO Michael Tso表示,未來20年,公司將會演變成AI輔助的組織。在那樣的世界裡,數據將促進協作,機器將會收集信息、學習並幫助人類匹配客戶需求來進行實時決策。

這樣的情況現在已經存在了。像亞馬遜這樣的購物網站就使用了這種技術。同樣的,廣告反饋系統越來越善於為網站用戶提供基於訪問的廣告推廣服務。Cloudian也使用了數字廣告牌,這可以匹配個性化的駕駛員和他們的汽車,為其推送合適的廣告。

Tso認為,在存儲行業,這就意味著,供應商不得不保留大規模的非結構化數據來訓練機器。一旦機器可以進行自我學習,他們將能夠收集和生產新的大量的數據來存儲、標記和分析。

在我們的受訪者中,絕大多數專家都提到了自動駕駛汽車。自動駕駛汽車被描述為通過大量的傳感設備來"讀取"周圍環境,這跟準確的地圖數據有點類似。由此來覺得如何駕駛、剎車和加速等。這樣所需存儲的複雜性是顯而易見的。攝像機和雷達等設備產生的數據每秒有10GB之多。所有這些數據都要被壓縮和處理。通過自動駕駛汽車的攝像機和雷達能夠獲得高清地圖數據。這是獲得準確汽車汽車位置的關鍵所在。這些高清地圖在標準地圖之上,額外添加了車道標線、限制和標誌。 所有這些數據以每秒10s+GB的速度產生。這些數據乘以運動量再乘以汽車數量,其數據量將是非常非常巨大的。

另外,每輛汽車還要記錄一些駕駛數據,並保存幾天到幾個月不等---這取決於OEM和監管要求。這是非常重要的,因為即使這些數據上傳到雲,本地還是要保存這些數據的。數據的質量還僅僅只是個開始,這些數據包括每輛車和通過系統產生的,這些數據將會決定汽車的安全行駛和高效運行。所有類型的AI和機器學習系統都將獲取這些信息,並把信息轉變為操作指導。這就意味著存儲系統必須能夠以汽車的行駛速度來存儲、轉移和處理數據。

StorageIO Group 的分析師Greg Schulz表示,這些現有數據的價值還有很多未被挖掘出來,AI還將帶來未開發的和未知的價值。

存儲增強

但是這不是一條獨木橋。這也不僅僅是讓存儲如何存儲更多數據、處理更快、讓分析引擎更快的問題,還有相互之間的影響---AI和機器學習將會給存儲技術帶來更多的關注,並將促進存儲技術的發展。

Schulz 表示,AI和其他算法能夠讓分析被用於管理數據、存儲,甚至會涉及到數據基礎設施資源。這意味著,這將超越基本分析和洞察力意識報告,以及基於系統或軟件管理的傳統政策。

他提到要注意AI和機器學習對CPU處理能力需求的增加和存儲容量的增加,同時還會增加---把數據轉變為信息的工具---的需求。

相關推薦

推薦中...