ICC訊 近日,一段視頻在網(wǎng)上熱傳。視頻中,初創(chuàng)公司Figure的人形機(jī)器人外表和動(dòng)作都與人類(lèi)十分相似。它可以與人流暢對(duì)話,理解人的意圖。聽(tīng)到工程師“想吃點(diǎn)東西”的口令后,它遲疑了一下,準(zhǔn)確地拿起了蘋(píng)果。它甚至可以解釋自己為什么要這樣做。
北京市中關(guān)村展示中心常設(shè)展上的人形機(jī)器人。 視覺(jué)中國(guó)供圖
這一人形機(jī)器人背后,是OpenAI公司為其配置的大語(yǔ)言模型。多模態(tài)技術(shù)加持下,它具備高級(jí)視覺(jué)和語(yǔ)言智能。
隨著大模型、機(jī)器人制造等技術(shù)發(fā)展,賦予人工智能“形體”的具身智能(Embodied AI)正逐步走入人工智能舞臺(tái)中央。
具身智能是人工智能產(chǎn)業(yè)發(fā)展的重要方向之一。英偉達(dá)近期發(fā)布人形機(jī)器人通用基礎(chǔ)模型Project GR00T,希望能讓機(jī)器人擁有更聰明的“大腦”。由Project GR00T驅(qū)動(dòng)的機(jī)器人能夠理解自然語(yǔ)言,并通過(guò)觀察人類(lèi)行為來(lái)模仿人類(lèi)動(dòng)作。在特斯拉2023股東大會(huì)上,馬斯克也向大眾展示了人形機(jī)器人Optimus的全新型號(hào)。這些都是具身智能駛?cè)氚l(fā)展快車(chē)道的縮影。
AI技術(shù)的集大成者
1950年,圖靈在他的一篇論文中首次提出了具身智能的概念。
“具身智能是人工智能的一個(gè)重要分支,它強(qiáng)調(diào)智能體與其所處的物理環(huán)境緊密交互,通過(guò)人形機(jī)器人等智能實(shí)體實(shí)現(xiàn)感知、決策和行動(dòng)?!辟惖项檰?wèn)人工智能與大數(shù)據(jù)研究中心常務(wù)副總經(jīng)理鄒德寶向科技日?qǐng)?bào)記者介紹,“這種結(jié)合讓人工智能可通過(guò)攝像頭、傳感器等理解環(huán)境,并通過(guò)機(jī)械臂、輪子等執(zhí)行器作用于物理世界,在物理空間中學(xué)習(xí)、適應(yīng)并完成指令任務(wù)?!?
這是一個(gè)包含人工智能幾乎所有技術(shù)的領(lǐng)域,可以說(shuō)是AI的集大成者。
“要充分發(fā)揮人工智能的強(qiáng)大能力,就要將其‘附身’于實(shí)體——機(jī)器人,這一行為被稱為‘具身’?!边_(dá)闥機(jī)器人創(chuàng)始人、首席執(zhí)行官黃曉慶說(shuō)。
在他看來(lái),從生物學(xué)角度,人類(lèi)是自然選擇的產(chǎn)物,因此具備通用性的終極機(jī)器形態(tài)應(yīng)與人類(lèi)相同;從功能性角度,要使機(jī)器人能替代人類(lèi)執(zhí)行所有任務(wù),其形態(tài)需與人類(lèi)相似;從人工智能發(fā)展角度,訓(xùn)練大模型需要大量數(shù)據(jù),而人類(lèi)語(yǔ)言、行為、智能等數(shù)據(jù)信息無(wú)疑最豐富,人形機(jī)器人因此能最大限度獲取訓(xùn)練數(shù)據(jù)。
“通過(guò)為人工智能系統(tǒng)賦予形體,我們可以使其與人類(lèi)用戶之間的交互更直觀、自然和便捷。形體也可以幫助人工智能系統(tǒng)更好地感知和理解現(xiàn)實(shí)世界。”鄒德寶說(shuō),具有形體的人工智能系統(tǒng)可以應(yīng)用于更多領(lǐng)域,特別是在需要與人類(lèi)進(jìn)行密切協(xié)作的場(chǎng)景中。例如,在醫(yī)療領(lǐng)域,一個(gè)具有實(shí)體形態(tài)的人工智能機(jī)器人可以協(xié)助醫(yī)生進(jìn)行手術(shù)操作。
技術(shù)進(jìn)步和挑戰(zhàn)并存
依托大規(guī)模數(shù)據(jù)和強(qiáng)大算力的大模型,為機(jī)器理解世界提供了前所未有的能力。它與具身智能的結(jié)合,預(yù)示著機(jī)器人的未來(lái)將更加智能化、互動(dòng)化。
去年11月,工業(yè)和信息化部印發(fā)《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》,提出人形機(jī)器人集成人工智能、高端制造、新材料等先進(jìn)技術(shù),發(fā)展?jié)摿Υ?、?yīng)用前景廣,是未來(lái)產(chǎn)業(yè)的新賽道。
鄒德寶談到,發(fā)展具身智能,主要可從三方面發(fā)力。一是仿生機(jī)制。具身智能的一個(gè)關(guān)鍵目標(biāo)是使機(jī)器能像生物體一樣具備感知、決策和運(yùn)動(dòng)能力。因此,更深入地研究和模仿復(fù)雜的生物機(jī)制,如神經(jīng)系統(tǒng)的運(yùn)行方式、生物體的自我修復(fù)能力等,是實(shí)現(xiàn)這一目標(biāo)的重要途徑。二是基于物理的智能決策能力。智能系統(tǒng)需要更緊密地與其所處的物理形態(tài)融合,以便在各種環(huán)境中自然、高效地執(zhí)行任務(wù)。這意味著需要發(fā)展出更先進(jìn)的機(jī)器人硬件和軟件技術(shù),支持智能系統(tǒng)在復(fù)雜環(huán)境中的運(yùn)動(dòng)和操作。三是自主學(xué)習(xí)和適應(yīng)環(huán)境。具身智能系統(tǒng)需要具備自主學(xué)習(xí)和適應(yīng)環(huán)境能力,以便能在復(fù)雜多變的環(huán)境中執(zhí)行任務(wù)和解決問(wèn)題。這可以通過(guò)強(qiáng)化學(xué)習(xí)、遷移學(xué)習(xí)等機(jī)器學(xué)習(xí)技術(shù)實(shí)現(xiàn)。
技術(shù)突飛猛進(jìn)之下,具身智能市場(chǎng)活躍。頭部廠商不僅在技術(shù)研發(fā)上取得顯著進(jìn)展,還在商業(yè)應(yīng)用和拓展市場(chǎng)方面取得了突破。特斯拉宣布,其旗下擎天柱人形機(jī)器人的首個(gè)商業(yè)化場(chǎng)景將是自家公司汽車(chē)生產(chǎn)車(chē)間。人形機(jī)器人(上海)有限公司聯(lián)合行業(yè)頭部企業(yè)成立的新型研發(fā)機(jī)構(gòu),致力于建設(shè)貫穿創(chuàng)新鏈、產(chǎn)業(yè)鏈、資金鏈和人才鏈的人形機(jī)器人創(chuàng)新生態(tài)系統(tǒng)。聯(lián)想創(chuàng)投作為聯(lián)想集團(tuán)旗下的全球科技產(chǎn)業(yè)基金,通過(guò)投資和支持具身智能技術(shù)公司,推動(dòng)該技術(shù)的商業(yè)化應(yīng)用。
然而,難題和挑戰(zhàn)也如影隨形。
首當(dāng)其沖的是算力。具身智能需要進(jìn)行大量計(jì)算來(lái)支持感知、決策和運(yùn)動(dòng)過(guò)程。隨著任務(wù)和環(huán)境復(fù)雜性的升級(jí),其對(duì)算力的需求會(huì)不斷增加。
數(shù)據(jù)安全也不可忽視。具身智能系統(tǒng)需要收集和處理大量數(shù)據(jù)進(jìn)行學(xué)習(xí)優(yōu)化,這些數(shù)據(jù)可能包含用戶個(gè)人隱私信息。
“隨著具身智能技術(shù)不斷發(fā)展,我們也需要關(guān)注其可能帶來(lái)的倫理和道德問(wèn)題。例如,如何確保機(jī)器人在執(zhí)行任務(wù)時(shí)不傷害人類(lèi)或造成不必要的損失,如何保證機(jī)器人行為符合人類(lèi)道德和價(jià)值觀等?!编u德寶說(shuō)。
未來(lái)人工智能發(fā)展的重要方向
英偉達(dá)創(chuàng)始人兼CEO黃仁勛曾表示,人工智能發(fā)展的下一個(gè)浪潮是具身智能,是能理解、推理、并與物理世界互動(dòng)的智能系統(tǒng)。
“具身智能對(duì)人工智能產(chǎn)業(yè)發(fā)展意義重大,對(duì)實(shí)現(xiàn)AGI(通用人工智能)具有不可忽視的價(jià)值?!编u德寶認(rèn)為,從當(dāng)前技術(shù)趨勢(shì)和市場(chǎng)動(dòng)態(tài)來(lái)看,具身智能極有可能成為人工智能發(fā)展的下一個(gè)重要方向。
首先,具身智能強(qiáng)調(diào)智能體與真實(shí)世界的交互。這種交互性不僅增強(qiáng)了人工智能系統(tǒng)的實(shí)用性,還促進(jìn)了人工智能技術(shù)在各個(gè)領(lǐng)域的應(yīng)用。具身智能是實(shí)現(xiàn)AGI的關(guān)鍵之一。AGI需要能像人類(lèi)一樣理解并適應(yīng)各種物理環(huán)境和各種復(fù)雜任務(wù),而具身智能正是通過(guò)讓智能體與物理環(huán)境進(jìn)行實(shí)時(shí)交互和響應(yīng),實(shí)現(xiàn)對(duì)環(huán)境的感知和理解。因此,具身智能的發(fā)展將為實(shí)現(xiàn)AGI提供重要技術(shù)支持。
從當(dāng)前技術(shù)發(fā)展趨勢(shì)來(lái)看,具身智能已成為人工智能領(lǐng)域研究熱點(diǎn)。隨著深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和遷移學(xué)習(xí)等技術(shù)的不斷進(jìn)步以及機(jī)器人硬件的日益成熟,具身智能已具備一定技術(shù)基礎(chǔ)。同時(shí),應(yīng)用市場(chǎng)對(duì)具有可交互性的智能系統(tǒng)的需求也在不斷增長(zhǎng),這為具身智能發(fā)展提供了廣闊市場(chǎng)。
針對(duì)發(fā)展具身智能可能面臨的風(fēng)險(xiǎn),鄒德寶建議,要通過(guò)優(yōu)化算法、提高硬件性能等方式不斷提升計(jì)算能力,滿足具身智能對(duì)計(jì)算資源的需求。采用加密技術(shù)、數(shù)據(jù)脫敏等手段保護(hù)用戶數(shù)據(jù)安全和隱私,同時(shí)制定嚴(yán)格的數(shù)據(jù)使用和共享政策,確保用戶數(shù)據(jù)不會(huì)被濫用或泄露。此外,也要制定具身智能技術(shù)倫理和道德準(zhǔn)則,并加強(qiáng)對(duì)具身智能技術(shù)的監(jiān)管和評(píng)估,確保其行為符合人類(lèi)道德和價(jià)值觀。