发布日期:2025-03-08 07:27 点击次数:188
nt 动漫
新智元报谈
剪辑:LRST
【新智元导读】近日,来自哥大的商议东谈主员设备出了一种新AI系统,让机器东谈主通过庸碌录像头和深度神经鸠合兑现自我建模、畅通权术和自我建立,冲突了传统机器东谈主依赖工程师谐和的局限,使机器东谈主能像东谈主类相同自主学习和稳当环境变化,为具身智能发展带来新范式。
「咱们东谈主类弗成继续呵护机器东谈主、为他们修理损坏的部件或谐和性能的业绩。机器东谈主需要学会‘温雅’我方,才能信得过说明作用。这即是自我建摹本领如斯进军的原因。」
中国成人网好意思国哥伦比亚大学机器东谈主学诠释注解霍德·利普森的这句话,揭示了机器东谈主本领发展的压根窘境。
在最新发表于《当然·机器智能》的商议中,中国粹者胡宇航指导的团队顺利让机器东谈主取得了「自我学习」才气:仅凭庸碌录像头,就能像孩子不雅察我方的算作般交融体魄构造,甚而在「受伤」时自主谐和和归附。
论文连气儿:https://www.nature.com/articles/s42256-025-01006-w
今天的东谈主工智能与机器东谈主更像是高度覆按的工东谈主,每当咱们需要一个机器东谈主完成特定任务,工程师就必须完成机械三维建模、建立仿真模子、编写限制算法,再左证特定任务完成强化学习。
要是机器东谈主硬件结构转换或者损坏,举例增多新的负载或机械臂曲折,时时无法自我稳当和建立,必须依赖工程师进行谐和。
但要是机器东谈主一运转就能像东谈主类相同我方学习的形态和畅通呢?
机器东谈主「照镜子」学会明白我方
东谈主类从来不需要依赖精确的三维模子或要道角度限制来掌持妙技,咱们通过眼睛看、尝试、响应来交融我方的体魄和任务。
视觉对环境的交融提供了一种仿真才气,咱们不错通过在大脑中设想画面作念各式仿真测试。
比如从货架上拿东西,你不需要诓骗任何数学模子,就能在大脑中设想出来你到货架前取下东西的所有这个词历程,因为你的视觉才气和自我明白在其中匡助到了你。
当今,机器东谈主也不错作念到这少许。
商议东谈主员设备了一种新的AI系统,让机器东谈主通过一个庸碌的录像头和三个师法大脑的东谈主工智能系统(称为深度神经鸠合),通过给定提醒量度出机器东谈主我方在三维空间中占据的位置。
机器东谈主利用「FFKSM」(Free Form Kinematic Self-Model)本领,不错兑现:
不雅察我方,交融体魄的形态和畅通方式。
权术我方的动作,无需预设物理引擎或仿真。
在受损后自我修正,比如要是手臂曲折,机器东谈主能识别变化并谐和行为,而不需要工程师从头编程。
图示:A,一个机器东谈主看着镜子宗旨图,机器东谈主通过挪动体魄不雅察变化来建立我方的模子。B,利用该模子,机器东谈主不错量度我方的形态并践诺各式操作任务。C,FFKSM 兑现旨趣。该模子包含三个深度神经鸠合:坐标编码器、畅通编码器和量度模块。通过处置 3D 点坐标和要道角度,它不错量度查询点的密度和可见性。然后使用此信息来渲染 PRED 量度图像,并将其与分段二进制图像 (GT) 进行相比以进行覆按。
这项才气透顶转换了对机器东谈主的界说和交融方式——从被迫践诺任务的器具,变成主动学习、稳当和谐和。
具身智能的三大困局与自我建摹本领破解之谈
困局1:数据与物理实体的割裂
近况:现时具身智能依赖海量覆按数据,但不同机器东谈主的机械结构、传感器建立相反导致数据难以复用。
冲突:FFKSM 让机器东谈主通过录像头不雅察本身畅通,并构建通用的自我表征,不依赖手工界说的畅通模子。这格外于为机器东谈主创造了一种跨平台的「机器语」:无论是四足机器东谈主、双足机器东谈主,甚而是机械臂,它们齐能将本身畅通转换为合伙的明白框架。
困局2:畅通模子的自我更新
近况:传统具身智能需预编程物理参数(如逆畅通学模子与要道坐标),但现实寰宇的磨损、负载变化常使预设模子失效。
冲突:动态的自我建摹本领使机器东谈主像生物般继续感知体魄气象。当工业机械臂因金属疲钝产生细小形变时,系统能通过视觉不雅测自主更新畅通模子。
困局3:Sim2Real问题
近况:现存系统需在仿真环境中预覆按数月,但移植到实体机器东谈主时仍濒临sim2real(杜撰到现实)相反。
冲突:及时在线建模,兑现「所见即所得」的学习范式,兑现欠驱动系统和柔性机器东谈主的仿真(包括东谈主脸机器东谈主)。
具身智能的新范式:从「功能机器」到「明白生命体」
明白维度:传统系统通过编码挨次交融寰宇(如用DH参数法样子机械臂畅通),新本领则建立基于视觉-畅通有关的直观明白,更接近生物进化出的骨子感知。
可解释冲突:三个深度神经鸠合的协同机制(坐标编码→畅通编码→量度考证)酿成了类脑的明白闭环。当机器东谈主聘用绕过庇荫物时,商议者可记忆其「念念考」旅途:先自我模拟机械臂舞动幅度→臆测碰撞概率→生成祛除轨迹。
伦理前瞻:胡宇航在采访中至极强调:「咱们在系统中确立了明白范畴拘谨,确保自我建模仅用于物理畅通优化,这是智能体取得‘体魄目田’的前撮要求。」
应用场景
东谈主形机器东谈主:从稳当环境与任务
设想一个东谈主形机器东谈主在户新手走,倏得遭受一派光滑的冰面,或者践诺任务时因特地负载导致体魄均衡发生变化。
传统机器东谈主在这种情况下可能会因预设步态不稳当新环境而滑倒或失去均衡,必须依赖特地的传感器或东谈主为侵略来谐和动作。
有关词,具备自我感知和自我建模才气的机器东谈主能够及时识别环境变化,比如检测大地的摩擦力镌汰,或感知本身分量的变化。机器东谈主会像东谈主类相同谐和姿态——就像咱们在湿滑大地上会本能地延慢治安、谐和均衡,而在背上背包时会自动谐和站姿以防患失衡。
顶点环境:从易受赔本到高度鲁棒
在外天际或顶点场景,工程师无法云尔建立探伤器,细小的机械故障可能导致所有这个词任务失败。
举例,火星车的机械臂可能因风沙卡住,或轮子受到庇荫物撞击而变形,导致行为受阻。新一代自我建模机器东谈主不错像东谈主类相同更新畅通模子——就像东谈主在肌肉拉伤时会转换步态,勤快走到医务室。
这种机器东谈主不错检测本身畅通额外,动态谐和限制政策,即使某个部件受损,也能找到替代性畅通方式,确保任务络续进行。这种高度鲁棒的才气,将极大晋升机器东谈主在顶点环境下的活命才气。
东谈主脸机器东谈主:自监督学习冲突东谈主工建模瓶颈
柔性材料的建模一直是东谈主形机器东谈主鸿沟的繁难,尤其在面部仿真和动态情愫生成方面,传统圭臬依赖复杂的物理建模和东谈主工调校,难以精确模拟东谈主脸的当然畅通。全新的自监督学习圭臬将透顶转换这一所在,使东谈主脸机器东谈主不再依赖东谈主工建模,而是通过视觉学习本身结构和畅通方式,自主优化情愫限制模子。
这一冲突不仅让机器东谈主面部情愫愈加当然,还能让机器东谈主自主谐和不调遣绪气象下的微情愫和肌肉动态,从而大幅减少「恐怖谷效应」。最终,这项本领将鼓舞更具拟东谈主感、更当然、重灵活的机器东谈主交互体验,加快东谈主机共存时期的到来。
机器东谈主的「畅通自我刚硬」(Kinematic Self-Awareness)
这项商议中所展示的才气是哥伦比亚大学团队在昔日二十年中发布的一系列样式中的最新一个,昔日这些样式中的机器东谈主正在学习若何更好地利用录像头和其他传感器进行「自我建模」。
2006年,他们的机器东谈主能够通过不雅察来创建通俗的、雷同洋火东谈主景色的自我模拟。大要十年前,机器东谈主运转使用多台录像机创建保真度更高的模子。
在这项商议中,机器东谈主仅使用单个庸碌录像机的视频就能创建一个全面的畅通自我模子,就像照镜子相同。商议东谈主员将这种新发现的才气称为畅通自我刚硬。
Hod Lipson解释,「咱们东谈主类本能地刚硬到我方的体魄;咱们不错设想我方在改日的神色,并在现实中践诺这些行为之前就将行为的效果形象化,最终,咱们但愿赋予机器东谈主雷同的设想我方的才气。因为一朝你能设想我方在改日的神色,你所能作念的事情就莫得搁置了。」
华东谈主作家先容
第一作家胡宇航,哥伦比亚大学博士生。2024年,以第一作家身份在《科学·机器东谈主学》(Science Robotics)发表商议Human-Robot Facial Coexpression。
胡宇航:我一直对东谈主类和动物若何交融寰宇感到陶醉——不是依靠数学模子,而是通过不雅察、尝试和稳当。咱们此前发表在《科学·机器东谈主学》上的商议,利用「镜子」让咱们的面部机器东谈主 Emo 通过视觉学习东谈主类的情愫。
当今,咱们把这个方针进一步拓展:让机器东谈主仅通过视觉不雅察本身,兑现自我建模、畅通权术,并在受损后自主归附。这项冲突让我充满期待——机器东谈主不再仅仅践诺号召,而是能够与咱们一谈进化。
这不仅比让强化学习覆按机器东谈主掌持某项妙技更意旨,更进军的是,它波及了智能执行的中枢问题。要是机器东谈主能够像东谈主类相同,通过视觉感知和交融本身在物理寰宇中的存在,那么它们梗概依然迈出了「自我刚硬」的第一步。
参考贵府:
https://www.nature.com/articles/s42256-025-01006-w
https://www.engineering.columbia.edu/about/news/robots-learn-how-move-watching-themselves-0nt 动漫