如今的AI(人工智能),已經(jīng)學(xué)會了對話、創(chuàng)作與分析,下一個(gè)進(jìn)化方向在哪里?答案指向真實(shí)的物理世界。從虛擬世界的信息處理者,到能感知、能行動、能與現(xiàn)實(shí)環(huán)境深度交互的智能體,物理人工智能(物理AI)的興起,正在開啟AI發(fā)展的新篇章。
本期“瞰前沿”欄目,讓我們一起走進(jìn)物理AI的世界,探尋這項(xiàng)前沿技術(shù)的發(fā)展邏輯、現(xiàn)實(shí)挑戰(zhàn)與廣闊前景。
——編 者
從讀懂圖片的“視覺”,到寫出文字的“表達(dá)”,再到創(chuàng)造視頻畫面的“想象”,當(dāng)下,AI正持續(xù)“進(jìn)化”。
學(xué)會看、寫、生成之后,AI還能做什么?近年來,科技界正在探索推動AI從虛擬走向現(xiàn)實(shí)的技術(shù)路徑。一種新的技術(shù)理念——物理AI越來越受關(guān)注。
物理AI與生成式AI有何不同,適用哪些場景?如何理解物理AI與具身智能的關(guān)系,技術(shù)落地又有什么挑戰(zhàn)?記者采訪了相關(guān)業(yè)內(nèi)專家。
升 級
讓AI進(jìn)化為與現(xiàn)實(shí)世界交互的智能體
什么是物理AI?簡單說,我們可以將其理解為走出屏幕、進(jìn)入現(xiàn)實(shí)的AI智能體,它能如人一般感知環(huán)境、“動手”操作。
北京通用人工智能研究院—德塔智能聯(lián)合實(shí)驗(yàn)室負(fù)責(zé)人馬曉健認(rèn)為,物理AI有3個(gè)重要特征:能力建立在真實(shí)物理交互數(shù)據(jù)之上、包含對物理世界的理解以及能部署到真實(shí)實(shí)體上。
這意味著,物理AI知道物體的運(yùn)動、接觸、變形,了解摩擦、重力、空間關(guān)系和因果變化等,并能據(jù)此預(yù)測未來、規(guī)劃動作,從而在開放環(huán)境中完成任務(wù)。
從技術(shù)演進(jìn)角度看,物理AI是AI發(fā)展到一定階段的自然方向。
“第一階段AI通過計(jì)算機(jī)視覺學(xué)會了‘看’,第二階段AI通過自然語言處理學(xué)會了‘寫’,當(dāng)前通過物理AI要學(xué)會‘行動’?!卑俣戎悄茉浦魅渭軜?gòu)師應(yīng)茹介紹,物理AI的出現(xiàn),讓AI從信息處理工具進(jìn)化為能夠與現(xiàn)實(shí)世界交互的智能體。
過去大模型主要是復(fù)現(xiàn)人的語言、知識和推理能力,相當(dāng)于進(jìn)入人的精神世界;但人的智能并不只體現(xiàn)在大腦中,還體現(xiàn)在與物理世界的互動里。“當(dāng)AI在語言和多模態(tài)理解上取得突破后,下一步必然是把這種智能外化到真實(shí)世界,讓機(jī)器能夠感知、行動、試錯(cuò)和完成工作?!瘪R曉健說。
物理AI和生成式AI的差異,主要體現(xiàn)在技術(shù)原理和承載任務(wù)上。
具體來說,物理AI的重要能力是在物理世界中承載運(yùn)動控制、環(huán)境交互等任務(wù);而生成式AI的重要能力是文、圖、視頻生成等,支撐內(nèi)容創(chuàng)作、代碼編寫、數(shù)據(jù)分析等任務(wù)。
“物理AI和生成式AI屬于AI的兩種不同分類維度?!瘪R曉健介紹,兩者正在深度結(jié)合。比如,生成式AI強(qiáng)大的語言理解、場景生成、規(guī)劃和代碼生成能力,可以幫助物理AI更好地理解任務(wù)、構(gòu)建仿真環(huán)境等。
挑 戰(zhàn)
從模型、數(shù)據(jù)到承載本體,物理AI落地面臨多重難題
過去數(shù)年,科技界從核心算法到工程本體,多措并舉推進(jìn)物理AI落地。
比如,用于模擬環(huán)境動態(tài)并預(yù)測未來狀態(tài)的世界模型被稱為物理AI的“內(nèi)部大腦”。學(xué)界專家提出世界模型的3項(xiàng)重要能力,即生成性、多模態(tài)、交互性,為物理AI搭建起環(huán)境理解、因果推斷與任務(wù)規(guī)劃的框架。
當(dāng)前,“視覺—語言—?jiǎng)幼鳌贝竽P偷葸M(jìn),為物理AI筑牢模型底座。
馬曉健介紹,目前落地物理AI大致分為3類技術(shù)路線。第一類是“預(yù)訓(xùn)練—后訓(xùn)練”范式,即先利用互聯(lián)網(wǎng)視頻、第一視角視頻、跨機(jī)器人操作數(shù)據(jù)等開展大規(guī)模預(yù)訓(xùn)練,再依托遙操作數(shù)據(jù)、強(qiáng)化學(xué)習(xí)或真機(jī)微調(diào)完成后訓(xùn)練;第二類是“現(xiàn)實(shí)—仿真—現(xiàn)實(shí)”范式,即先把真實(shí)世界的幾何、材質(zhì)、動力學(xué)等信息重建到高仿真環(huán)境中,讓機(jī)器人在“數(shù)字孿生”場景中大量試錯(cuò),再遷移部署至實(shí)體設(shè)備;第三類是大模型編程路線,依托語言模型,根據(jù)任務(wù)生成機(jī)器人控制程序,串聯(lián)感知、規(guī)劃、執(zhí)行等功能模塊。
不同的技術(shù)實(shí)現(xiàn)路線,各有優(yōu)劣。
比如,“預(yù)訓(xùn)練—后訓(xùn)練”范式路徑清晰,但對數(shù)據(jù)質(zhì)量、機(jī)器人本體一致性和真實(shí)交互數(shù)據(jù)體量要求極高。由于物理AI尚未規(guī)?;涞厣a(chǎn)生活,難以低成本、高效率采集海量訓(xùn)練數(shù)據(jù),這成為制約技術(shù)落地的瓶頸之一。
又比如,“現(xiàn)實(shí)—仿真—現(xiàn)實(shí)”范式的優(yōu)勢在于以仿真算力替代成本高昂、周期漫長的真實(shí)數(shù)據(jù)采集。然而,復(fù)雜接觸、柔性形變、流體運(yùn)動、非平整地面等物理過程仍難以高精度實(shí)時(shí)模擬。
“由于真實(shí)世界工況繁雜、多種物理因素相互影響,仿真系統(tǒng)無法完整復(fù)刻物理細(xì)節(jié),有時(shí)僅能作為真實(shí)數(shù)據(jù)缺失時(shí)的補(bǔ)充方案。”北京微鏈道愛科技有限公司總經(jīng)理張宇說。
“總體看,3條路線大概率不會互相取代,而是在數(shù)據(jù)、仿真和大模型推理層面逐步融合?!瘪R曉健說。
物理AI與具身智能又是什么關(guān)系?簡單說,具身智能是物理AI的重要載體,物理AI是落地具身智能的核心技術(shù)路徑。不過,物理AI落地具身智能的過程中,在硬件本體工程化層面仍存諸多挑戰(zhàn)。例如,具身智能執(zhí)行任務(wù)時(shí),需適配復(fù)雜動作控制算法。倘若硬件精度不達(dá)標(biāo),極易影響軟硬件深度耦合。業(yè)界專家表示,近些年,我國機(jī)器人核心零部件國產(chǎn)化水平提升顯著,但諧波減速器等關(guān)鍵零部件的加工精度距離國際先進(jìn)水平仍有提升空間。
前 景
依托豐富應(yīng)用場景優(yōu)勢,物理AI持續(xù)迭代
雖然存在阻力,但業(yè)內(nèi)專家普遍看好物理AI產(chǎn)業(yè)化落地前景。
一方面,物理AI與大模型發(fā)展底層邏輯相通,依托更大規(guī)模的數(shù)據(jù)采集、性能更強(qiáng)的模型、系統(tǒng)化評測與持續(xù)迭代,產(chǎn)品能力將穩(wěn)步提升。另一方面,物理AI不必等到完全研發(fā)出通用類機(jī)器人才算實(shí)現(xiàn)產(chǎn)業(yè)化。在垂直細(xì)分場景中,只要模型可在同類任務(wù)中展現(xiàn)優(yōu)良泛化能力,便是重要的階段性成果。
在未來,低空經(jīng)濟(jì)、新能源電池、具身智能、高端芯片、航空航天等需要復(fù)雜場景仿真與優(yōu)化的前沿領(lǐng)域,均是物理AI的落地方向。馬曉健認(rèn)為,在一些不適合人類長期作業(yè)、傳統(tǒng)自動化又難以完全解決的場景,物理AI有望最先落地。
電力巡檢便是這樣一個(gè)場景。在西南偏遠(yuǎn)地區(qū),過去需要工作人員翻山越嶺檢查設(shè)備,現(xiàn)在北京人形機(jī)器人創(chuàng)新中心研制的“天工”機(jī)器人可實(shí)現(xiàn)戶外巡檢、變電倒閘操作、配網(wǎng)接地線掛載等復(fù)雜任務(wù)。
“物理AI并不是為了替代所有自動化?!瘪R曉健說,如果任務(wù)高度規(guī)整、流程固定,傳統(tǒng)工業(yè)自動化往往更便宜、更穩(wěn)定。物理AI真正有優(yōu)勢之處在于執(zhí)行環(huán)境多變、需要實(shí)時(shí)感知和靈活決策,同時(shí)兼具重復(fù)性或高危屬性的任務(wù)。
在產(chǎn)業(yè)界,物理AI模型訓(xùn)練效率也在持續(xù)提升。
“得益于在AI基礎(chǔ)設(shè)施領(lǐng)域的常年積淀,我們將‘視覺—語言—?jiǎng)幼鳌竽P陀?xùn)練速度提升70%,世界模型推理時(shí)延下降50%。原本以周為單位的訓(xùn)練周期,如今可壓縮至小時(shí)級?!卑俣燃瘓F(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖表示。
如何更好推進(jìn)物理AI落地?
當(dāng)前物理AI仍處在技術(shù)路線尚未收斂的發(fā)展階段?!拔覀円膭?lì)差異化、多路線并行探索?!瘪R曉健認(rèn)為,產(chǎn)業(yè)政策與科研扶持不宜扎堆單一技術(shù)熱點(diǎn),應(yīng)引導(dǎo)企業(yè)、高校和科研院所圍繞模型、控制、仿真、傳感器、靈巧手、本體結(jié)構(gòu)等方向開展多元化攻關(guān)。此舉既能規(guī)避押注單一路線的研發(fā)風(fēng)險(xiǎn),也有助于補(bǔ)齊我國在算法、硬件、制造和系統(tǒng)集成領(lǐng)域的全鏈條產(chǎn)業(yè)部分短板。
物理AI真正落地,不靠實(shí)驗(yàn)室演示,而是依托真實(shí)場景的數(shù)據(jù)反饋與持續(xù)迭代。
業(yè)內(nèi)人士認(rèn)為,應(yīng)用場景資源充沛是我國發(fā)展物理AI的獨(dú)特優(yōu)勢。“讓技術(shù)深入礦井、工廠、倉儲、巡檢現(xiàn)場等一線場景,物理AI才能更好形成‘場景—數(shù)據(jù)—模型—產(chǎn)品’良性閉環(huán)?!瘪R曉健說。
北疆新聞 | 內(nèi)蒙古自治區(qū)重點(diǎn)新媒體平臺,內(nèi)蒙古出版集團(tuán)?內(nèi)蒙古新華報(bào)業(yè)中心主管主辦的國家互聯(lián)網(wǎng)新聞信息采編發(fā)布服務(wù)一類資質(zhì)平臺。
北疆新聞版權(quán)與免責(zé)聲明:
一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權(quán)均屬北疆新聞所有,轉(zhuǎn)載時(shí)必須注明“來源:北疆新聞”,并附上原文鏈接。
二、凡來源非北疆新聞的新聞(作品)只代表本網(wǎng)傳播該消息,并不代表贊同其觀點(diǎn)。
如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請?jiān)谝娋W(wǎng)后30日內(nèi)進(jìn)行,聯(lián)系郵箱:bjwmaster@163.com。
版權(quán)聲明:北疆新聞版權(quán)所有,未經(jīng)書面授權(quán),不得轉(zhuǎn)載或建立鏡像,違者依法必究。 本站違法和不良信息舉報(bào)電話:15648148811蒙ICP備16001043號-1
Copyright © 2016- 北疆新聞 All Rights Reserved互聯(lián)網(wǎng)新聞信息服務(wù)許可證:15120200009-1廣播電視節(jié)目制作經(jīng)營許可證:(蒙)字第631號蒙公網(wǎng)安備:15010502001245