我覺得, 是現在機器人的“大腦”還是不夠聰明。 這兩年發展特別快的大模型, 它的全名是“大型語言模型”, 絕大多數都是基於互聯網上的大量人類資源數據, 訓練出來的“語言”層面的智能, 但要進入真實的物理世界, 還是遠遠不夠的。 就像黃仁勳在CES2025上說的, AI 發展的最後一個階段是“物理AI”, 它強調的就是AI對於物理空間的理解和感知, 比如物理空間學, 比如幾何和空間關系等等, 李飛飛團隊在去年年底的 “一張圖生成一個可交互3D世界”的空間智能模型, 也是這個方向。 在仿真環境中訓練, 基於人類語言的數據, 與真實物理世界中的數據是有本質的差別的。 就像你再如何用語言教一個人握住瓶子, 都不如直接讓他直接看到這個瓶子的形狀, 知道它有多重來得快。 在全球最具權威的IT研究與咨詢公司Gartner 最新發布的“新興技術成熟度曲線圖”中, “人形工作機器人”仍然排在“技術萌芽期”的階段, 也就是說, 這個領域還需要10年以上的時間, 才能走向生產成熟。 現在業界努力的方向, 主要有兩個。 第一, 自動駕駛為啥進步快? 靠的就是路上狂跑攢數據, 機器人當然也一樣。 現在比較主流的, 要麽是讓機器人看自己操作的視頻學經驗, 要麽是讓機器人用仿真環境狂練技能。 第二, 還是得靠AI技術上的突破, 比如李飛飛的空間智能模型, 還有楊樂昆的世界模型, 都是在讓AI學著認識和理解真實的三維世界。 我和很多人一樣, 都在期待著機器人領域迎來一個DeepSeek式的驚喜, 期待著馬斯克所說的“人手三台人形機器人”的未來。
更多精彩內容,請登陸
財華香港網 (//m.iteamtexas.com/)
現代電視 (http://www.fintv.com)