具身智能現階段缺模型架構? 未來十年人形機械人技術、應用突破圖破壁
未來十年,人形機械人如何影響物理世界?
近日,在位於北京亦莊舉行的世界機械人大會上,人形機械人創業公司宇樹科技的創始人、CEO王興興在一場論壇上表示,目前機械人本體的硬件完全夠用,最大的挑戰是具身智能的智能程度遠不及語言模型,具身智能大模型目前「不太夠用」。
王興興進一步表示,具身智能達到類似ChatGPT的臨界點的判斷標準是,當一個人形機械人來到陌生的環境,能夠聽懂用戶的隨機指令並完成相應任務。「這一天快則1-3年就可實現,慢則3-5年也大概率能實現,」他說。

宇樹科技創始人、CEO王興興
王興興認為,具身智能遭遇瓶頸的另一大原因是具身智能強化學習的規模定律(Scaling Law)未有形成,導致執行每個任務都需要單獨訓練模型,因此端到端的具身大模型仍然是最有希望的研究方向。此外,具身智能對於算力需求大,而機械人本體承載算力的能力小,因而用於具身智能的分布式算力系統相關研究也極具價值。
「當通用AI大規模成熟後,每個人都可以輕鬆造一台人形機械人,就像今天人們可以自己購買零件組裝電腦一樣,」王興興說。
王興興認為,目前新一代通用機械人技術才發展了2-3年,仍屬初期,行業整體取得進展還需要更多時間。未來幾年,從業人員和產品出貨量可能還會維持每年翻倍的增長。而相比於工廠場景,家用機械人在倫理、安全等方面還有更多要求,普及門檻將更高。

港商記者 孫斌攝
而在《香港商報》記者8月11日現場走訪中,發現參與智元髖關節輔助行走外骨骼機械人演示的老年觀眾尤其多,購買需求也強烈,多數老者對記者表示:「輔助設備對於中老年腰間盤凸出患者確實是個福音,但目前的技術主要考慮到了髖關節和下肢的膝蓋上部協調,實際應用中更多老人則是膝蓋無力。」對此,智元機械人相關技術人員表示,下半年圍繞膝蓋助力的輔助機械人正在研發之中。
通過實際的現場走訪,記者發現圍繞醫療場景和家用場景、用餐送餐場景研發的機械人詢問者眾多,而且多數人已經仔細到詢問價格走向。
當日上午,在由中國科協主辦的智能機械人科學家與企業家深度對話」活動圓桌討論環節,與會專家圍繞「智能科研成果轉化破局之路」亦展開激烈交鋒。
國家自然基金委高技術中心研究員、科技部專業技術二級、國務院特貼獲得者劉進長認為:「當下許多機械人仍屬中看不中用!」。他強調,好機械人的核心標準在於「能用、好用、皮實耐用」。他以養老陪護需滿足承重等需求場景為例,表示未來機械人進入家庭是一個逐步的過程。劉進長認為兩派最終應「殊途同歸」,打造「有智能的身體」或「有身體的智能」。

清華大學教授、人工智能研究院智能機械人研究中心主任 孫富春。港商記者 孫斌攝
清華大學教授孫富春則表示,傳統機械人依賴動力學指標,但具身智能需關注三大關鍵能力:生物體般的感知運動能力、認知交互能力以及跨場景任務遷移能力。孫富春特別指出,「學習進化能力才是真智能的試金石」。他以ChatGPT作詩能力逐年提升為例,「如果你是具身智能機械人,必須要學習和進化,性能一年比一年好。」
另一場論壇中,銀河通用創始人王鶴指出,在工廠場景中,搬運,物品的分揀也是人形機械人落地工廠的重要應用。王指出,相較搬運,分揀難度更大,核心卡點在於人形機械人分揀速度不夠快,在模型、硬件兩個層面,目前的機械人都還無法和熟練的分揀工人相比,仍處在技術突破階段。
在具身智能技術挑戰層面,王興興和王鶴存在分歧。王興興認為,具身大模型不夠智能是當下人形機械人面臨的主要問題。目前,行業內模型架構不統一,導致各家進展緩慢。
同場活動上,英偉達物理AI的負責人Rev Lebaredian也指出,獲取合適的數據是具身智能發展面臨的主要問題,把AI用在數據生成流程中、自動化的生成合成數據是英偉達推動行業發展的解法。「如果我們擁有一個自動駕駛的合成數據生成工廠,就能直接將其接入訓練流程,實現訓練過程自動化,減少人為干預,讓機械人大腦更聰明。」他說。
Rev Lebaredian認為,中國具備發展機械人、物理AI的絕佳條件,一方面全球近一半的AI研究人員和開發者位於中國,另一方面中國具備全球無可匹敵的電子製造業。此外,中國還有着龐大的製造業基礎,製造業是天然的大規模部署和測試機械人的真實場景,從而讓具身智能不斷進化。(港商記者 孫斌 北京報道)
頂圖圖説:北京亦莊2025世界機械人大會現場。港商記者 孫斌攝