麻省理工的AI飞行控制系统:无人机送货的未来已经来临!
麻省理工的AI飞行控制系统:无人机送货的未来已经来临!
麻省理工学院(MIT)的研究人员已经开发出一种基于AI的方法,用以提升自主机器人的安全性和稳定性,成功解决了被称为"稳定-避障"问题。这种方法结合了深度强化学习和数学优化的双步处理方法,并已经在模拟喷气机上进行了有效测试。这种新方法未来可能在需要安全稳定的动态机器人上有应用,比如自主送货无人机。
在电影《壮志凌云:独行侠》中,独行侠,由汤姆·克鲁斯(Tom Cruise)扮演,被指派训练年轻飞行员,完成一项看似不可能的任务——驾驶他们的喷气机深入崎岖的峡谷,靠得地面如此之低以至于不能被雷达探测,然后以极度的角度迅速爬升出峡谷,避开岩壁。剧透警告:在独行侠的帮助下,这些人类飞行员完成了他们的任务。
然而,机器则难以完成相同的任务。比如对于一个自主飞行的飞机来说,直奔目标的最直接路径与机器需要做的避免撞击峡谷壁或保持未被探测到的行动产生了冲突。许多现有的AI方法无法克服这种被称为“稳定避障”的冲突,无法安全地达到目标。
MIT的研究人员开发了一种新技术,可以比其他方法更好地解决复杂的稳定-避障问题。他们的机器学习方法在提供十倍稳定性的同时,达到或超过了现有方法的安全性,这意味着该代理能够到达并在目标区域内保持稳定。
在一次让独行侠感到自豪的实验中,他们的技术有效地驾驶一架模拟喷气机飞越了一个狭窄的走廊,没有坠落到地面上。
实验中模拟飞行的展示,在AI算法下成功飞机避开了所有壁垒,驾驶飞机向前行进
“这一直是一个长期的、具有挑战性的问题。许多人研究过,但并不知道如何处理如此高维和复杂的动态,”范楚楚(Chuchu Fan),航空和宇宙工程助理教授,该研究的主要负责人,解释道,“我们的方法结合了深度强化学习和数学优化,为复杂的动态提供了一个稳定且安全的解决方案。”
这项新技术的核心是一个结合了深度强化学习(DRL)和混合整数优化(MIO)的框架,名为深度S-MIO。DRL用于学习复杂的机器人动态和控制策略,而MIO则作为一种优化工具,为每个控制动作提供了安全和稳定的约束。
首先,DRL框架会从一系列模拟飞行中学习。它将尝试不同的策略,并逐渐学习哪些行动是安全的,哪些会导致危险。然后,MIO步骤会对每个可能的动作进行检查,确保它们在复杂环境中仍然安全。这样,只有那些既稳定又安全的动作才会被选择。
"我们的方法利用了最佳的两个世界,"范楚楚解释说,"深度强化学习帮助我们理解和适应复杂的动态,而混合整数优化则保证我们的决策始终安全和稳定。"
这项技术的一个潜在应用是自主飞行的无人机。这些无人机需要在复杂的环境中,如城市街道或山区,安全稳定地飞行,以便进行快递或人员救援。这项新技术可能使这些无人机在避障和稳定之间找到更好的平衡,从而提高他们的性能和安全性。
范楚楚和她的团队希望继续改进这项技术,并将其应用于更多的实际情况。"我们希望将我们的方法应用到更复杂的机器人系统,例如具有更复杂动态和更复杂环境的无人机,"她说。
虽然这个技术目前仍处于早期阶段,但它为解决自主飞行机器人中的稳定-避障问题提供了一个全新的途径,使得未来可能有更多的机器人能像电影中的独行侠一样,成功驾驶通过崎岖的地形。