(来源:MIT News)
如今,无人机表演已成为一种备受欢迎的“大型灯光秀”。在表演中,成百上千架无人机按照编程设定好的路径飞行,在天空中共同勾勒出复杂绚丽的形状和图案。当一切按计划进行时,无人机表演场面颇为壮观,然而,一旦有一架或多架无人机出现故障则可能会对地面观众构成严重威胁,比如近期在佛罗里达、纽约等地发生的事故。
无人机表演事故的发生让人们意识到在“多智能体系统”中保障安全依然面临挑战。多智能体系统由多个相互协调、协作并经过计算机编程的智能体组成,常见的比如无人机、机器人和自动驾驶汽车等。
如今,麻省理工学院的工程师团队开发出一种针对多智能体系统的训练方法,能够确保这些系统即便在拥挤复杂的环境中也能安全运行。研究人员发现,利用这种方法训练少量智能体后,它们学到的安全边界和控制策略可以自动扩展应用到更多的智能体上,进而提高整个系统的安全性。
在实际演示过程中,该团队训练了几架微型无人机成功完成不同任务,比如在飞行过程中同时变换位置并降落在移动的机器人上面。在模拟实验里,同样的程序在几架无人机上训练后,可以复制并扩展到数千架无人机,使大规模系统能够安全地完成任务。
(来源:MIT News)
“对于任何需要多智能体协作的应用场景,比如搜索救援无人机、仓库机器人以及自动驾驶汽车等,这种方法都有望成为行业标准。这就像是构筑了一道‘安全屏障’,能让每个智能体在执行任务的同时保障安全。”麻省理工学院航空航天学副教授范楚楚表示(她曾入选《麻省理工科技评论》2021 年度亚太地区“35 岁以下科技创新 35 人” 榜单)。
目前这项研究成果已经发表在IEEE Transactions on Robotics上,该论文的共同作者还包括麻省理工学院研究生 Songyuan Zhang、Oswin So,以及亚利桑那州立大学助理教授 Kunal Garg。
探索安全边界
在设计多智能体系统的安全机制时,研究人员通常需要考虑每个智能体相对于系统中其他智能体的潜在运动路径,这种两两之间的路径规划不仅耗时且计算成本高昂。即便如此,也无法完全确保安全。
“在无人机表演中,每架无人机都被预先设定好了特定轨迹,包括一系列路径和时间点,然后它们就‘闭上眼睛’按照这个计划飞行。由于它们只知道需要自己的既定路径,一旦发生意外情况就不知道该如何进行调整。”这项研究的主要作者 Songyuan Zhang 指出。
与传统方法不同,麻省理工学院团队尝试开发一种新的方法,先训练少量智能体安全运行,然后让这种安全策略能有效扩展到系统中的所有智能体。更关键的是,这种方法不再为单个智能体规划具体路径,而是让它们能够持续‘绘制’自己的安全边界(即一旦超出就可能不安全的区域边界)。这样一来,智能体只要始终处于安全边界范围内,就可以选择任意路径完成任务。
从某种程度上来说,团队提出的这种方法和人们在日常生活中直观地导航周围环境很相似。“想象一下,你身处一个人很多的购物中心,为了安全行走且不撞到别人,你通常只会留意自己周围数米范围内的人,而不会去关注相距更远的人,我们的研究采用的就是类似的局部方法。”Oswin So 解释道。
构建安全屏障
在这项新研究中,团队提出了一种名为 “GCBF+” 的方法,即 “图控制屏障函数(Graph Control Barrier Function)”。在机器人技术领域,屏障函数是一个数学概念,用于计算安全边界,一旦智能体越过这个边界就很可能变得不安全。在多智能体系统中,由于智能体的移动,对于任何一个智能体而言,其安全区域随时都可能发生变化。
通常情况下,设计人员在计算多智能体系统中某个智能体的屏障函数时,需要考虑它与系统中所有其他智能体的潜在路径和交互情况。但麻省理工学院团队的方法不同,他们只计算少数智能体的安全区域,而且计算方式足够精确,能够反映系统中更多智能体的动态变化。
“计算出少数智能体的屏障函数后,我们可以将其复制并应用到每个智能体上,这样就能快速得到适用于系统中任意数量智能体的安全区域图。”Oswin So 表示。
在计算智能体的屏障函数时,团队首先考虑了智能体的 “感知半径”,即根据其传感器能够观察到的环境范围。就像在购物中心的例子里,研究人员假设智能体只需关注其感知半径内的其他智能体,就能保证安全并避免碰撞。
接下来,团队利用计算机模型模拟智能体的特定机械能力和限制,设计出一个“控制器”,也就是一组关于智能体及其相似个体应该如何移动的指令。然后,他们让多个智能体按照特定轨迹移动并进行模拟,记录它们之间是否发生碰撞或其他交互情况。
“有了这些轨迹数据,我们就能计算出一些最小化的规则,比如当前控制器中出现了多少次安全违规情况,然后据此更新控制器,提高安全性。”Songyuan Zhang 表示。
通过这种方式,控制器可以被编程到智能体中,让智能体在即时环境中感知其他智能体信息,持续绘制自己的安全区域,并在安全区内移动来完成任务。
“我们的控制器具有实时反应能力。它不会提前规划好固定路径,而是不断收集无人机的行进方向、速度,以及其他无人机的速度等信息,利用这些信息实时生成计划,并且每次都会重新规划路径。所以,一旦环境发生变化,它能够迅速响应调整,确保安全。”范楚楚表示。
团队在一个由 8 架微型四旋翼无人机组成的系统中对 GCBF + 方法进行了演示。这些无人机的任务是在空中飞行并变换位置。如果无人机直接沿最短路径直线飞行,肯定会相撞,但在经过团队方法训练后,无人机能够在飞行过程中实时调整,相互避让,始终保持在各自的安全区域内,成功在空中完成了位置切换。
类似地,团队还让无人机飞行并降落在特定的轮式机器人上,这个机器人持续绕着大圈行驶,无人机在降落过程中也能避免相互碰撞。
“使用我们的框架,只需要告诉无人机它们的目的地,而不是整个无碰撞的路径轨迹,无人机就能自己找出如何到达目的地而不发生碰撞。”范楚楚表示。她设想,这种方法可以应用到任何多智能体系统中来保障安全,比如无人机表演、仓库机器人、自动驾驶汽车以及无人机配送系统等。
这项研究部分得到了美国国家科学基金会、麻省理工学院林肯实验室特技飞行制度安全(SAFR)计划,以及新加坡国防科学技术局的支持。
https://news.mit.edu/2025/mit-engineers-help-multirobot-systems-stay-safety-zone-013