彙整撰稿/台灣雲協技術專家委員會主秘‧黃彥程
在全球科技競賽的浪潮中,機器人再次站上舞台中心,重新站在聚光燈下。這並非因為它們的新奇,而是因為人工智慧的快速發展,同步加速了機器人與真實世界的結合,使得過去二十年無法突破的瓶頸,正在以肉眼可見的速度鬆動。近來人形機器人的話題再度升溫,不只是展示,而是開始觸及「什麼是智慧」這個根本問題。
一一
10月23日,台灣雲協技術專家委員會舉辦技術專家分享會,由台灣雲協人型機器人SIG協辦,三位講者包括台大人工智慧與機器人研究中心施吉昇主任、工研院趙軒逸博士、瑞昱半導體魏士鈞特助,分別從三個不同角度描繪機器人的未來。看似各抒己見的三段演講,在深入理解後,就可發現它們自然匯聚成三條清晰而互補的技術主軸:具身行動能力、語意與共感理解、自主系統與能量平衡。這三條軸線並非官方定義,也非來自任何技術文件的框架,而是從講者的各自研究中自然形成的「共同認知」。
如此的收斂結果告訴我們,機器人真正的未來,不只是讓 AI 更強、動作更流暢,而是擁有自己的「靈魂」。如何讓機器人在世界中真實地行動、理解人類及人類的想法,並能自主運作。這三件事,就是機器人要從「工具」進化成「智慧體」所必須構成的三個維度。
從具身智慧理解「行動」:AI 不能只存在於雲端
台大人工智慧與機器人研究中心施吉昇主任:實驗室裡的新人工智慧一一
施吉昇主任的演講,聚焦在 AI 何以能讓機器人從過去的固定式工業場域,走向動態且不可預期的真實世界。他用了一個非常具有啟發性的對比:過去的機器人在高溫焊接區或搬運重物的產線上可以精準操作,但只要環境不是靜態可控、無法精準定位或具有非計畫性的事件,這些機器便立刻失效。這不是硬體不夠強,而是它們沒有能力理解「情境」。
因此,所謂「具身智慧(Embodied AI)」不是抽象名詞,而是讓 AI 真正取得行動能力的技術核心。施主任展示台大人工智慧與機器人研究中心多年耕耘的成果:模組化足球機器人、可替換機構的關節、模擬世界先學習再部署到實體機器人的訓練流程,以及「倒一杯水」這個看似平凡卻包含重量感測、液體流動預測與手眼協同的高難度任務。
這些細節都指向一個共同要素:AI 必須透過身體與感知器,理解世界、並在其中行動。
這不是語言模型可以單獨完成的,也不是單靠硬體就能解決的,而是在物理世界與演算法之間建立閉環。而台灣恰恰在這個領域擁有稀有優勢:模組化硬體的量產能力、自製馬達與 MCU 的技術深度、以及工程團隊對可靠度與可維修性的高度敏感,讓台灣在「製造能行動的 AI」這件事情上,具有非凡的基礎。
從語言到共感理解「人」:AI 的真正落地,不只在技術,而在互動
工研院趙軒逸博士:AI機器人的未來與機會一一
與具身智慧的實體行動相對,趙軒逸博士談的是「機器人與人類之間的認知橋樑」。他強調,人型機器人之所以重要,不是因為它像人,而是因為它是最能檢驗 AI 能否理解世界的載體。語言指令不是理解,情境推論才是;執行不是智慧,共感才是。
趙博士指出,工研院在人型機器人上所做的努力,是把視覺、語音、動作規劃與控制拆分為獨立模組,再透過大型語言模型作為多模態整合的中樞。例如:「請幫我倒一杯水」這句話,機器人必須分析語意、定位杯子與容器、規劃動線、感知人是否在等待、並依照環境調整動作。這早已超越傳統所謂「聽懂指令」。
他更明確地說:「人機互動的終點不是命令與執行,而是理解與共感。」這句話道出機器人的核心挑戰:AI 必須能理解人,而非只理解文字。
這裡的「理解」,不是心理層面的擬人化,而是 AI 能否在語言、視覺與動作之間建立一致的、可被人接受的行為邏輯。這正是大型語言模型在機器人領域最有價值的環節。
台灣擁有來自習慣於跨領域協作、強調標準化與模組化的產業文化優勢。這使得台灣更容易打造「可以持續演進的人型機器人系統」,而非一次性原型。
從能量到回饋理解「自主」:機器人不只要做事,也要自己維持穩定
瑞昱半導體魏士鈞特助:自主系統的進化論一一
如果說施吉昇主任談 AI 如何「在世界中行動」,趙軒逸博士談 AI 如何「理解人」,魏士鈞特助則提出了更根本的問題:機器人如何「自己活著」?
魏士鈞以工程師的務實視角拆解「自主」的真義,直言「自主不是能聽也不是會說,而是從開機到關機都不需要人介入」。真正的自主是像生物一樣具備感知、能量調節、回饋平衡,並在不確定的環境中維持穩定。
他舉蒼蝿為例尤其深刻:蒼蠅只有一千萬個神經元,卻能以極高效率避開危險。這某種程度上可以說明智慧不在於算力強度,而在於運作方式是否符合能量與環境的現實條件。
他認為現行 AI 模型遭遇兩個主要問題。其一,模型追求效能而忽略能量成本;其二,缺乏穩定迴路與世界模型,使得 AI 在真實環境下容易不一致、不可靠。因此,未來 AI 的進化不會只由模型變大決定,而是要能保持能效與穩定性,擁有世界模型(World Model),並能依據能量狀態調節行為。
這種思維其實非常貼近台灣在車用與工控領域累積的系統工程能力,而這種能力恰恰是自主系統最不可或缺的基礎。
三條主軸的形成不是巧合,而是產業共同認知的成熟
綜觀全場,三位講者的內容自然而然地收斂成三條脈絡:具身行動、語意與共感理解、自主性與能量平衡。這並非某種形式上的分類,而是一種「貫穿整場會議的共同底層邏輯」。
- 具身智慧讓機器人能夠行動
- 語意與共感讓機器人能被人理解並融入社會
- 自主系統使機器人不再依賴人類才能運作。
這三條技術主軸互相補充,也共同定義了機器人下一階段的發展方向。而更關鍵的是,台灣在這三條路線上都有能力、有底子,也有獨特位置。
我們不必複製其他國家的路線圖,而是可以在世界產業版圖中,用自己的方式定義機器人的未來。當機器人開始學會行動、理解與自主,下一個問題將不是技術能走多遠,而是台灣準備好在這條道路上走多快。