靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

Yann LeCun體驗OVIS行李箱

在2019年4月的愛迪生獎現場,被譽為“卷積網絡之父”Yann LeCun被現場一個小小的旅行箱所吸引,玩的不亦樂乎。

並且LeCun居然給出了“目前在美國,神經網絡還主要應用在互聯網領域,但你們卻已經將神經網絡應用在硬件產品上。”的肯定。

這個小小的旅行箱就是靈動科技所研發的OVIS行李箱,它與正常旅行箱最大的不同就是其被賦予了視覺AI技術,成為全球首款智能側跟登機箱。

其實在OVIS行李箱的背後,靈動科技在計算機視覺的自主機器人技術領域下了非常大的功夫。相比於市面上通過物理定位等外部輔助運作的AI機器人產品,通過計算機視覺的方法讓人工智能深度學習可以更加貼近人類的行動方式。

同時,不止侷限於產品本身,打造視覺自主機器人的開發平臺才是它的“王牌”。這套開發平臺既可以為內部的產品,同時未來還能為整個行業賦能。

靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

靈動科技創始人齊歐先生

前不久,鈦媒體就與靈動科技創始人齊歐先生做了一次溝通。對於這家僅成立了3年的初創公司,它到底蘊含了怎樣的“魔力”,又會為人工智能的未來發展帶來哪些變革呢?我們一起來看看吧。

OVIS行李箱:靈感來自星球大戰中的R2-D2機器人

靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

喜歡星球大戰的朋友們一定會記得R2-D2這個機器人吧?R2-D2可以說是星戰的頭號機器人,它是一個典型的機智、勇敢、而又魯莽的宇航技工機器人,憨態可掬,每次都陪伴在主角左右,0.96米的身高,卻塞滿了裝有各種工具的附加臂,這使他成為了一個了不起的太空船技工和電腦接口專家。

OVIS行李箱最初的設計初衷就是希望一個機器人能夠真的出現在我們身邊,完成他對我們的一些服務和幫助和樂趣。所以這個希望就以行李箱形式出現了,這會是大家第一個個人機器人。

它屬於你個人,就像80年代有臺個人電腦一樣,然後我們希望這個機器人它能夠做到認識主人,他能夠跟隨主人做移動和搬運,它能夠本身帶拍照的功能,然後幫助主人攜帶物品,它也可以給你身邊不可或缺的手機做充電,然後成為生活中的小幫手。

靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

全球首款智能側跟登機箱OVIS

據齊歐表示,OVIS行李箱只是第一代產品,隨著技術的不斷的前進和一些邊緣計算的芯片的不斷的出現,我們在第二第三代產品希望能做到路徑的引導。

未來的智能旅行箱預期能力是你給他看登機牌,然後他會帶你去登機口,從跟隨到它能夠引導。別看OVIS行李箱的功能看似簡單,但其背後卻蘊藏了很多關於人工智能、機器視覺以及深度學習的技術。

靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

首先,OVIS行李箱用了五顆攝像頭,其中有四顆是360度環繞視覺。然後為了使四顆攝像頭可以同時捕捉環境,是每秒120幀的速度,每1/30秒四個攝像頭的數據能拼到一起。

這是什麼概念呢?就是我們今天所謂自動駕駛這種外來的雷達,差不多是每秒10幀,它通常是64線的信息,而這四個環視攝像頭本身是超過500線的信息。

所以OVIS行李箱基本上做到了一個比Velodyne激光雷達還要再快三倍的這種幀數,然後比它要更全面的信息,並且是在有限算力下,實現每分鐘有30G的這種大高通量的信息給到AI算力平臺。

靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

第二方面,不光是有圖像信息,基於深度學習的計算機視覺還能檢測到附近有幾個人,然後找到主人,並做識別跟蹤,和出框後回來的主人再識別。這些是今天的計算機視覺的核心大廠在做的技術。

此外,行李箱還要知道哪裡可以走,哪裡不可以走,這叫可行使區域的分割,這部分是自動駕駛的技術。

第三方面,OVIS行李箱的底盤和車底盤相比,車是一個經過幾十年迭代的完美的底盤,而行李箱的底盤是一個相對成本有限,靈活度有限的底盤。

所以除了依賴底盤自身的輪子反饋,然後還要加VSLAM視覺的反饋,通過視覺能夠知道空間、位置、和自己的相對移動距離。

靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

第四方面,側面跟隨的算法的革新。經過靈動科技的研究發現是很難窮盡整個環境的一些複雜度的,所以OVIS行李箱使用了強化學習技術,做路徑的優化。通過訓練和仿真的方法,將40萬組數據做baseline, 然後再做不斷的迭代。

所以OVIS行李箱是一款行李箱形態的視覺自主機器,通過這個產品,打通了整個技術鏈條和供應鏈鏈條,形成了一個視覺自主機器人的開發平臺。

這個平臺包括硬件和軟件兩部分。我們具體來看,我們剛才其實看到計算機視覺,手眼協同的機械臂,輪子和眼睛協同的移動能力,加上多車的協同調度算法(雲端大腦)。

B端物流機器人:視覺自主機器人開發平臺的行業泛化應用之一

靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

靈動科技物流倉儲機器人

其實,智能側跟登機箱只是一個實例,靈動科技在產品端已經在行業領域進行了更多的思考與賦能。既有大量的體力工作,並且又是重複的,可有機會被機器所去協同。在這個層面來看,靈動科技現在選擇的是在製造、運輸和農業這三個行業。

當前,很多物流搬運機器人是基於固定路線,沿著鋪設好的磁條或者二維碼走,但無法避障;也有一些通過激光雷達進行定位和避障,但多線激光雷達成本過高,單線激光雷達無法適應複雜的倉儲環境。

靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

靈動科技的倉儲機器人使用了視覺定位導航(VSLAM)與環境理解(CV)技術,以攝像頭為主要傳感器,可以完成三維空間的定位與環境理解,這也使得倉儲機器人硬件成本只有千元。

期望中的場景應該是:倉儲場景不變,然後機器有視覺,可以用機械臂來做卸貨。叉車有視覺和移動能力,可以做平面的搬運,然後機械臂加可用的底盤可以做揀貨,然後可以做相關的一些自動打包,然後最終再裝箱上貨。

靈動科技齊歐:以AI為腦,讓機器人可以用眼睛“看”世界

工業化的場景和機器人

6%的GDP其實有幾百萬人在做重複性的搬箱子、推小車的工作,如何來使他更多地減少人的這些重複性的枯燥工作,有不同的路徑。

目前人工智能分為兩派,一派是說我們花很多錢重新去把你的場景都推導出來,我們叫自動化派,基本上是用20年前的技術。

但是最新的場景,視覺機器人其實就像我們叫自主移動,或者更偏叫AI機器人,他們希望假設是對場景不做變化,而是使機器有視覺感知移動的能力,它來幫助人們做事。

應用場景值得深挖:用機器人在可預測體力勞動上輔助人類

今天在場景具體應用來看,每單揀選成本可以有35%的綜合程度上的下降,也是對行業最大的一個幫助和貢獻。在靈動科技的眼裡,物流行業是很大市場的,15%的GDP這15裡頭是6+9,6%在倉儲,9%在運輸上面。

智能機器人能做的事情,就是在對可預測體力勞動上,用機器人來輔助人類工作。這個行業上來看,其實我們有若干個行業可以探索的機會,像酒店餐飲、製造、運輸、農業、零售、礦業。

其實製造業和運輸業,工人都是用這種機器車和輪性機器人來去解決。我們剛才看到割草機其實它是農業的一個行情的具體實現。

因為我們知道物流佔中國15%的GDP,而它也是一個急需有機器來幫助來做的行業,來滿足諸如每年“雙11”大量訂單增長。所以,我們剛才看到目前有四款工業化的場景和機器人。(本文首發鈦媒體,作者/Kiwi)

更多精彩內容,關注鈦媒體微信號(ID:taimeiti),或者下載鈦媒體App

相關推薦

推薦中...