"數(shù)據(jù)"在具身智能中的價(jià)值超10萬億美元,是互聯(lián)網(wǎng)數(shù)據(jù)價(jià)值的三倍...
2024/06/19
具身人工智能(EAI)是將人工智能(AI)集成到機(jī)器人等物理實(shí)體中,賦予它們感知、學(xué)習(xí)并與環(huán)境動(dòng)態(tài)交互的能力,使這些機(jī)器人能夠在人類社會(huì)中有效地提供商品和服務(wù)。在本文中,我們將與互聯(lián)網(wǎng)領(lǐng)域的數(shù)據(jù)價(jià)值進(jìn)行比較,以估計(jì)EAI中數(shù)據(jù)的潛在價(jià)值。此外,我們深入研究了EAI開發(fā)中數(shù)據(jù)瓶頸帶來的重大挑戰(zhàn),并研究了旨在克服這些障礙的創(chuàng)新數(shù)據(jù)捕獲和生成技術(shù)。
1.
數(shù)據(jù)是一種變現(xiàn)工具
數(shù)據(jù)是互聯(lián)網(wǎng)和機(jī)器人領(lǐng)域變現(xiàn)的重要工具。在此,我們以互聯(lián)網(wǎng)行業(yè)為歷史標(biāo)桿,探討數(shù)據(jù)在EAI中的戰(zhàn)略價(jià)值。
在互聯(lián)網(wǎng)領(lǐng)域,公司利用用戶數(shù)據(jù)主要是進(jìn)行精準(zhǔn)的廣告和提供個(gè)性化內(nèi)容。這種精準(zhǔn)的方法不僅可以增加銷量,還可以提高用戶的參與度,從而導(dǎo)致訂閱費(fèi)更高或使用量增加。與此同時(shí),在EAI領(lǐng)域,數(shù)據(jù)對(duì)于訓(xùn)練深度學(xué)習(xí)模型至關(guān)重要,這些模型可以增強(qiáng)和優(yōu)化機(jī)器人的能力。
從財(cái)務(wù)上來說,用戶數(shù)據(jù)對(duì)互聯(lián)網(wǎng)公司來說代表著巨大的價(jià)值,估計(jì)每個(gè)用戶價(jià)值600美元,考慮到大規(guī)模商業(yè)化后估計(jì)每個(gè)機(jī)器人的成本為35,000美元,我們保守預(yù)測(cè)機(jī)器人公司愿意投資約占機(jī)器人成本的3%用于數(shù)據(jù)收集和生成。這項(xiàng)投資旨在開發(fā)先進(jìn)的EAI功能,預(yù)計(jì)EAI數(shù)據(jù)的市場(chǎng)價(jià)值將超過10萬億美元,是互聯(lián)網(wǎng)行業(yè)的三倍。
這凸顯了EAI數(shù)據(jù)的巨大潛力,而如今EAI的數(shù)據(jù)收集和生成行業(yè)仍處于起步階段。
2.
具身人工智能的數(shù)據(jù)瓶頸
雖然EAI數(shù)據(jù)行業(yè)的未來看起來很光明,但如今EAI系統(tǒng)的可擴(kuò)展性受到嚴(yán)重?cái)?shù)據(jù)瓶頸的巨大阻礙。與互聯(lián)網(wǎng)數(shù)據(jù)不同(主要由用戶生成的輸入組成且收集和聚合相對(duì)簡(jiǎn)單),EAI數(shù)據(jù)涉及機(jī)器人與其動(dòng)態(tài)環(huán)境之間的復(fù)雜交互。這一根本區(qū)別意味著,互聯(lián)網(wǎng)數(shù)據(jù)可以從數(shù)字平臺(tái)上的用戶活動(dòng)中挖掘,而EAI數(shù)據(jù)必須捕獲種類繁多且通常不可預(yù)測(cè)的環(huán)境中的大量物理交互。
例如,雖然易于訪問的聊天數(shù)據(jù)允許ChatGPT 4使用570GB的文本進(jìn)行訓(xùn)練,展示出對(duì)聊天任務(wù)的出色熟練程度,但訓(xùn)練EAI模型需要更多的機(jī)器人數(shù)據(jù),因?yàn)槠涠嗄B(tài)的性質(zhì)。這些機(jī)器人數(shù)據(jù)包含各種感官輸入和交互類型,不僅極具挑戰(zhàn)性,而且收集成本高昂。
訓(xùn)練EAI的第一個(gè)挑戰(zhàn):是獲取廣泛、高質(zhì)量和多樣化的數(shù)據(jù)集。例如,自主導(dǎo)航機(jī)器人需要處理大量環(huán)境數(shù)據(jù),以增強(qiáng)其路徑規(guī)劃和避障能力。此外,數(shù)據(jù)的精度直接影響機(jī)器人的性能;從事高精度任務(wù)的工業(yè)機(jī)器人需要極其準(zhǔn)確的數(shù)據(jù),其中微小的錯(cuò)誤可能會(huì)導(dǎo)致生產(chǎn)質(zhì)量出現(xiàn)重大問題。此外,機(jī)器人在不同環(huán)境中的適應(yīng)和泛化能力取決于其處理數(shù)據(jù)的多樣性。例如,家庭服務(wù)機(jī)器人必須適應(yīng)各種家庭環(huán)境和任務(wù),要求它們從廣泛的家庭環(huán)境數(shù)據(jù)中學(xué)習(xí),以提高其泛化能力。
訓(xùn)練EAI的第二個(gè)挑戰(zhàn):是“數(shù)據(jù)孤島”。獲取如此全面的數(shù)據(jù)充滿挑戰(zhàn),包括成本高、時(shí)間要求長(zhǎng)以及潛在的安全風(fēng)險(xiǎn)。大多數(shù)EAI機(jī)器人企業(yè)僅限于在特定的受控環(huán)境中收集數(shù)據(jù)。實(shí)體之間缺乏數(shù)據(jù)共享加劇了這種情況,導(dǎo)致重復(fù)工作和資源浪費(fèi),并形成“數(shù)據(jù)孤島”。這些孤島極大地阻礙了EAI的進(jìn)展。
3.
數(shù)據(jù)捕獲和生成
為了解決EAI開發(fā)中的數(shù)據(jù)可用性瓶頸,強(qiáng)大的數(shù)據(jù)捕獲和生成管道至關(guān)重要。圖2展示了此類管道的架構(gòu)。
該管道的第一個(gè)組成部分涉及捕獲真實(shí)世界的數(shù)據(jù)。這包括收集人類與物理環(huán)境交互的數(shù)據(jù)以進(jìn)行模仿學(xué)習(xí),如Mobile-Aloha(捕獲復(fù)雜的交互任務(wù))和PneuAct(專注于捕獲與人類手部動(dòng)作相關(guān)的數(shù)據(jù))等研究項(xiàng)目中所見。此外,該管道還涉及從多模式機(jī)器人傳感器收集數(shù)據(jù),以捕獲機(jī)器人對(duì)其物理環(huán)境的感知。
其次,鑒于獲取大量高質(zhì)量和多樣化的EAI數(shù)據(jù)的成本過高,基于數(shù)字孿生的仿真已被證明是一種有效的解決方案。這種方案顯著降低數(shù)據(jù)采集成本,提高開發(fā)效率。例如,為自動(dòng)駕駛汽車捕獲一小時(shí)的多模式機(jī)器人數(shù)據(jù)的成本為180美元,而模擬相同數(shù)據(jù)的成本僅為2.20美元,減少了近100倍。此外,Sim2Real技術(shù)的進(jìn)步促進(jìn)了技能和知識(shí)從模擬環(huán)境到現(xiàn)實(shí)世界應(yīng)用的轉(zhuǎn)移。這項(xiàng)技術(shù)在虛擬空間中訓(xùn)練機(jī)器人和人工智能系統(tǒng),使它們能夠安全有效地學(xué)習(xí)任務(wù),而不受現(xiàn)實(shí)世界的物理風(fēng)險(xiǎn)和限制。因此,現(xiàn)實(shí)世界數(shù)據(jù)和合成數(shù)據(jù)的結(jié)合是克服EAI中數(shù)據(jù)可用性挑戰(zhàn)的戰(zhàn)略方法。
最后,收集和生成的數(shù)據(jù)都必須經(jīng)過時(shí)間和空間的對(duì)齊,這一點(diǎn)至關(guān)重要。這確保了來自各種傳感器的數(shù)據(jù)準(zhǔn)確且同步,從而提供對(duì)機(jī)器人環(huán)境和動(dòng)作的統(tǒng)一且詳細(xì)的了解。只有經(jīng)過這些過程之后,數(shù)據(jù)才能有效地用于訓(xùn)練EAI系統(tǒng)。
結(jié)論
本文探討了數(shù)據(jù)在EAI中的作用,并估計(jì)EAI中數(shù)據(jù)收集和生成的市場(chǎng)可能超過10萬億美元,可能是互聯(lián)網(wǎng)數(shù)據(jù)市場(chǎng)價(jià)值的三倍。與直接收集互聯(lián)網(wǎng)數(shù)據(jù)不同,收集EAI數(shù)據(jù)涉及動(dòng)態(tài)環(huán)境中的復(fù)雜交互,使其成為一項(xiàng)昂貴且具有挑戰(zhàn)性的工作。為了應(yīng)對(duì)這些挑戰(zhàn),我們引入了利用Sim2Real技術(shù)的數(shù)據(jù)捕獲和生成管道,將現(xiàn)實(shí)世界的數(shù)據(jù)收集與基于數(shù)字孿生的模擬相結(jié)合,以降低成本并提高開發(fā)效率。目前,應(yīng)用Sim2Real技術(shù)的主要障礙是“現(xiàn)實(shí)差距”——模擬環(huán)境與現(xiàn)實(shí)世界之間的差異,包括物理、光照和意外交互的差異??朔@一差距需要?jiǎng)?chuàng)新技術(shù),例如領(lǐng)域隨機(jī)化(將各種場(chǎng)景納入模擬)和領(lǐng)域適應(yīng)(調(diào)整人工智能的響應(yīng)以更好地適應(yīng)現(xiàn)實(shí)世界的條件)。這些策略對(duì)于有效彌合模擬訓(xùn)練和現(xiàn)實(shí)應(yīng)用之間的差距至關(guān)重要。
https://cacm.acm.org/blogcacm/the-value-of-data-in-embodied-artificial-intelligence/