當前位置：首頁 > 新聞資訊 > 機器人知識 > 機器人的大腦在手眼腦協同中發揮怎么樣的作用

機器人的大腦在手眼腦協同中發揮怎么樣的作用

來源：長江證券編輯：創澤時間：2025/6/21 主題：其他 [加盟]

人形機器人需要具備G泛化能力與思維鏈能力。與工業機器人不同,人形機器人需要與復雜世界進行互動,因此決策控制系統需要G泛化性。在現實世界中,機器人難以一次性完成整個復雜動作,需要將復雜動作拆解成多個簡單步驟完成。而由于現實世界遠比機器人訓練場景復雜,在任務過程中會受到各種干擾,環境也會不斷變化,因此具身智能機器人需要較強的思維鏈能力。早期人形機器人大腦主要通過集成多個“小模型”結合人工介入實現,但隨著GPT-40等大模型的出現,機器人對文本、視覺、語言等多模態信息的理解和轉化顯著提升,致使人形機器人大腦的泛化能力與思維能力亦有大幅增加。

目前機器人大腦按照技術方案劃分為VLM(大腦+小腦)、VLA(端到端)兩種技術路徑。大小腦將復雜的任務分解為G層規劃與底層執行兩個層J,分為兩個主要模塊:

1) G層任務規劃器(慢腦)負責語義理解、任務分解和長程推理,生成任務步驟。

2)底層動作控制器(快腦)執行具體的動作并實時進行控制,將G層指令轉為關節角度、軌跡等低維度控制信號,具備G頻響應等特點，田于端到端指令生成速度慢，生成結果簡單,短期仍然是依靠大腦+小腦系統分別完成決策與控制任務。

在“手眼腦”協同中,大腦的作用主要是針對當前語義、文字的理解識別出任務目標, 并結合輸入的圖像信息,在環境中識別出操作對象,觀察特征。通過對視覺、文字的整合理解,大腦將做出合理的指令任務推導,并生成小腦的執行指令,之后再是由小腦執行手眼標定、手臂+靈巧手的運動軌跡、位姿抓取等動作。因此人形機器人大腦本質上是一個干億J別參數量的多模態大模型,人形機器人感知和決策能力取決于多模態大模型的能力。