人類與世界打交道,靠的是五感:眼睛感受光,耳朵捕捉聲,皮膚辨別觸壓,鼻子識別氣味,前庭系統維持平衡。這套精密的感知系統,是我們理解和行動于世界的基礎。
具身智能
機器人同樣需要感知這個世界。它的“五感”,來自一套精心設計的傳感器體系。
感知是一切行動的前提
在具身智能機器人的技術架構中,環境感知模塊是首要環節。沒有感知,就如同人類的眼睛看不見、耳朵聽不到,一切行動都無從談起。
傳感器承擔著內部和外部兩類感知任務。內部傳感器負責采集機器人自身的狀態,包括關節角度、運動速度、加速度等;外部傳感器則負責探測機器人所處的外部環境,包括物體的形狀、空間位置、障礙物距離,以及抓取對象是否滑落等。
正是這些傳感器,讓機器人具備了類人的直覺與反應能力,讓它能夠“看懂”環境、“感受到”反饋,從而與外部世界產生交互。
視覺:承載80%信息的“眼睛”
在所有感知手段中,視覺是最核心的一項,承載了機器人約80%的信息獲取任務。
機器人的 “眼睛”——視覺傳感器
機器視覺的本質,是為機器植入“眼睛”——利用環境和物體對光的反射,通過光學裝置和非接觸傳感器,自動接收和處理真實物體的圖像,獲取所需信息或用于控制機器人運動。
目前主流的機器人視覺方案有三類:
ToF深度相機(飛行時間法):發射一束脈沖光,打到物體表面后反射回來,通過測量光的飛行時間來計算距離。原理簡潔,響應速度極快,適合實時深度測量。
雙目視覺:模擬人類雙眼的工作方式,用兩個間隔一定距離的攝像頭拍攝同一場景,產生具有視差的兩張圖像,再通過特征點匹配和三角測量算法計算目標的深度信息——這正是人眼判斷遠近的原理在機器上的復現。
3D結構光:主動向物體投射一束有特定圖案的光,通過觀察光圖案在物體表面的變形來計算深度。精度高,常用于工業級精密測量場景。
此外,激光雷達(LiDAR)也在機器人視覺領域廣泛應用,它采用3D激光傳感器,測距遠且精度高,可直接輸出由無數離散點組成的3D點云,尤其在自動駕駛和大范圍環境建圖中發揮著關鍵作用。
力覺:感受力量的“關節神經”
人在拿起一杯水時,手指會自動感受杯子的重量和形狀,并調整握力——太松會掉,太緊會碎。這種對力的細膩感知,對機器人同樣至關重要。
六維力/力矩傳感器,就是機器人感知力量的核心部件。它能夠在三維空間中完整捕捉力的全部信息:三個方向的力分量(Fx、Fy、Fz)和三個方向的力矩分量(Mx、My、Mz)。
通過在機器人的手腕、足底或關節處安裝六維力傳感器,機器人能夠精密測量自己的抓取力度,判斷物體是否被穩固握持,并據此進行精細的力控操作。無論是靈巧手彈鋼琴,還是雙足機器人踏地時的受力反饋,都離不開這類傳感器的支撐。
觸覺:感知形變的“電子皮膚”
觸覺與力覺不同,它更側重于接觸面上的微觀感知。人的皮膚通過感受局部的微小形變和振動,能判斷物體的材質、軟硬和紋理。
機器人的觸覺傳感器,主要有兩種技術路徑:
MEMS壓力陣列傳感器:利用微機電技術(MEMS)制造出微小結構,對介質壓力進行敏感檢測,將檢測到的信號轉換為可讀取的電信號。體積極小,集成度高。
柔性傳感器(電子皮膚):利用柔性材料的物理特性,將外部的力學量轉換為電學量。這種傳感器具有高靈敏度、高柔韌性、響應速度快、延展性強的特點,甚至可以自由彎曲折疊,非常適合包覆在機器人手指和肢體表面,賦予機器人真正意義上的“觸感”。
嗅覺:識別氣味的“電子鼻”
人鼻子能聞到危險氣體,從而規避風險。在一些特殊場景中,機器人同樣需要這種能力——進入火災現場時,能否識別出有毒氣體,往往決定著任務能否安全執行。
嗅覺傳感器(電子鼻)通過敏感元件與氣味分子發生物理或化學反應,將這種反應轉化為可量化的電信號,從而識別氣體的種類與濃度。目前主要有三種技術方案:
MOS傳感器(金屬氧化物半導體):它內部有一個微型的加熱元件,工作時需要保持高溫。當特定氣體飄過時,會與傳感器表面發生反應,導致傳感器的導電能力(電阻)發生變化。這種方案成本低、響應快,是目前機器人最常用的常規配置。
電化學傳感器:它的內部結構類似于一個微型電池。氣體進入傳感器后,會直接與內部的化學物質發生反應并產生微弱的電流。氣體濃度越高,電流就越強。由于它平時不需要加熱,因此非常省電,而且能夠做到“專氣專用”,可以精準識別出某一種特定的有毒有害氣體。
QCM傳感器(石英晶體微天平):它不靠化學反應,而是靠檢測微觀重量。其核心是一個每秒高頻振動千萬次的石英晶體。當氣味分子被晶體表面的敏感膜吸附后,晶體的重量會微幅增加,導致它的振動頻率變慢。通過測量頻率的變化,它能實現納克(百億分之一克)級別的極致測量精度,非常適合對氣味要求極高的精尖場景。
慣性感知:維持平衡的“前庭系統”
人走路時不會隨意摔倒,是因為內耳的前庭系統在持續感知身體的加速度和角速度,幫助大腦維持動態平衡。機器人實現穩定行走的秘密,在于慣性傳感器——IMU(慣性測量單元)。
機器人實現穩定行走的秘密——慣性傳感器
IMU集成了加速度計和陀螺儀。加速度計感知沿三個軸向的線性加速度,陀螺儀則測量繞三個軸的角速度。三個加速度計與三個陀螺儀的組合,構成完整的微機電慣性測量單元(MEMS-IMU)。
機器人實現穩定行走的秘密——慣性傳感器
通過持續高頻采集這些慣性數據,機器人能夠實時獲知自身的姿態、方向和運動狀態,從而實現行走穩定性控制、步態協調、抗推搡、跌倒恢復等。
感官是智能的起點
視覺感知空間,力覺感受重量,觸覺辨別材質,嗅覺識別氣體,慣性傳感維持平衡,這五類傳感器,共同構成了具身智能機器人認知物理世界的感官基礎。
但擁有感官,還只是第一步。感官采集到的數據,是彼此孤立的信息片段——視覺不知道氣味,力覺不知道位置。如何將這些來自不同感官的信息整合起來,形成對客觀環境的完整理解,正是下一步要解決的問題:多模態融合。
(本文系浙江大學教授、博士生導師、浙江大學具身智能感知與控制實驗室(ZEAL Lab)負責人、中國儀器儀表學會科普專家、浙江省儀器儀表學會監事長侯迪波在“智感世界·儀創未來”系列科普直播之從感知到控制:讀懂具身智能新科技的主題分享,光明網記者肖春芳整理)