World Champion: Fastest Drone Racing Recorded

세계 챔피언: 기록된 가장 빠른 드론 레이싱

인공지능(AI)이 다시 한번 인간 챔피언을 물리쳤다.

이번에는 드론 레이싱 분야입니다.

취리히 대학교 로봇 및 지각 그룹의 엘리아 카우프만 박사가 이끄는 팀과 인텔 팀은 공동으로 Swift라는 자율 주행 시스템을 설계했습니다. 이 시스템은 1대1 챔피언십 경기에서 인간 상대보다 드론을 더 잘 운전할 수 있습니다.

이 획기적인 연구는 Nature 잡지의 최신 호에 표지 기사로 게재되었습니다.

Nature에 동시에 게재된 뉴스 및 견해 기사에서 Delft University of Technology의 Institute of Technology 교수인 Guido de Croon은 "Kaufmann 등의 연구는 로봇공학자들이 현실 세계의 격차를 어떻게 극복할 수 있는지에 대한 좋은 사례입니다. Swift는 AI 학습 기술과 전통적인 엔지니어링 알고리즘을 교묘하게 조합하여 훈련되었지만, 이 기술의 잠재력을 최대한 발휘하려면 더욱 현실적이고 가변적인 환경에서 시스템을 추가로 개발해야 합니다."라고 적었습니다.

그러나 연구팀은 이 연구가 모바일 로봇공학 및 기계 지능 분야에서 이정표를 세우는 것이라거나, 자율 주행 지상 차량, 비행 차량, 개인용 로봇 등 다른 물리적 시스템에 혼합 학습 기반 솔루션을 배치하는 데 영감을 줄 수 있다고 밝혔습니다.

AI와 엔지니어링 알고리즘을 결합한 지능형 훈련 현재, 딥 강화 학습을 기반으로 하는 AI 시스템은 아타리 게임, 체스, 스타크래프트, 그란 투리스모 등의 게임에서 인간 챔피언을 앞지르기도 했지만, 이러한 모든 성과는 실제 세계가 아닌 가상 환경에서 이루어졌습니다.

드론 레이싱은 숙련된 조종사와 AI에게 도전이지만 AI에게는 훨씬 더 도전적입니다. 가상 환경에서는 리소스가 거의 무한하지만 현실 세계로 전환하면 제한된 리소스를 사용해야 합니다. 이는 특히 드론의 경우 인간 조종사를 대체하는 센서와 컴퓨팅 장비를 공중으로 운반해야 하기 때문입니다.

더욱이, 현실 세계는 가상 세계보다 예측할 수 없습니다. 시뮬레이션된 드론은 미리 프로그래밍된 궤적을 완벽하게 따를 수 있지만, 현실 세계의 드론에 대한 단일 명령은 여러 가지 효과를 낼 수 있으며, 특히 AI로 훈련된 드론의 경우 예측할 수 없는 결과를 초래할 수 있습니다.

기존의 종단간 학습 방법으로는 가상 환경에서 현실 세계로 매핑을 전환하는 것이 어렵습니다. 두 환경 사이에 실질적인 차이가 존재하기 때문입니다. 이 실질적인 차이가 로봇 분야의 주요 과제 중 하나입니다.

이 연구에서 Swift 시스템은 AI 학습 기술을 기존 엔지니어링 알고리즘과 통합하여 지능형 훈련을 달성했습니다. 먼저, 시스템은 드론 카메라로 촬영한 이미지를 신경망을 사용하여 처리하여 문의 모서리를 정확하게 감지합니다. 그런 다음 쌍안경 소프트웨어를 사용하여 드론의 속도를 계산합니다.

Swift 시스템의 혁신적인 측면은 드론의 상태를 추력과 회전 속도를 조정하는 명령에 매핑하는 또 다른 인공 신경망입니다. 강화 학습을 사용하여 시뮬레이션에서 시행착오 과정을 통해 환경에서 얻은 보상을 최적화합니다. 이 알고리즘에서 시스템은 엔드투엔드 학습이 아닌 강화 학습을 사용하여 추상적 개념을 통해 현실과 시뮬레이션 간의 격차를 메울 수 있습니다.

상태 인코딩이 원래 이미지보다 추상 수준이 더 높기 때문에 강화 학습 시뮬레이터는 더 이상 복잡한 시각적 환경을 필요로 하지 않습니다. 이 최적화는 시뮬레이션 시스템과 실제 시스템 간의 차이를 줄이고 시뮬레이션 속도를 개선하여 시스템이 약 50분 만에 학습을 완료할 수 있도록 합니다.

이 논문에 따르면 Swift는 관찰 정책과 제어 정책이라는 두 가지 핵심 모듈로 구성되어 있습니다. 관찰 정책은 시각적 관성 추정기와 고차원 시각 및 관성 정보를 작업별 저차원 인코딩으로 변환할 수 있는 도어 감지기로 구성되어 있습니다. 제어 정책은 저차원 인코딩을 수용하고 드론 명령으로 변환할 수 있는 2층 퍼셉트론으로 표현됩니다.

인간 조종사의 속도와 성능을 능가하는 이 대회의 레이스 코스는 조직 외부의 세계적 수준의 FPV(일인칭 시점) 조종사가 설계했습니다. 코스에는 30x30x8m 공간에 배치된 7개의 정사각형 게이트가 포함되어 75m 트랙을 형성합니다.

게다가 이 코스는 Split-S를 포함한 독특하고 도전적인 기동을 특징으로 합니다. 충돌이 발생하더라도 드론이 계속 비행할 수 있는 한 조종사는 여전히 경주를 계속할 수 있습니다. 충돌이 발생하고 두 드론 모두 코스를 완료하지 못하면 결승선에서 더 멀리 떨어진 드론이 승리합니다.

스위프트는 알렉스 바노버(2019 드론 레이싱 리그 월드 챔피언), 토마스 비트마타(2019 멀티GP 챔피언), 마빈 셰퍼(3회 스위스 챔피언) 등과 함께 여러 레이스에 참가했습니다.

특히, 스위프트는 A. 바노버와의 경기에서 9개 경기 중 5개에서 승리했고, T. 비트마타와의 경기에서 7개 경기 중 4개에서 승리했으며, M. 셰퍼와의 경기에서 9개 경기 중 6개에서 승리했습니다.

또한 스위프트는 10번의 패배를 당했는데, 그 중 40%는 상대편과 충돌하여, 40%는 게이트와 충돌하여, 20%는 인간 조종사보다 느린 속도로 비행하여 발생했습니다.

전반적으로 Swift는 각 인간 조종사에 대한 대부분의 레이스에서 승리했습니다. 나아가 Swift는 가장 빠른 레이스 시간 기록을 세웠으며, A. Vanover의 최고 인간 조종사 성과를 0.5초 차이로 앞섰습니다. 데이터 분석을 통해 Swift가 일반적으로 모든 인간 조종사보다 빠르다는 것을 알 수 있으며, 특히 이륙 및 비상 회전과 같은 중요한 부분에서 그렇습니다. Swift의 이륙 반응 시간은 더 짧으며, 인간 조종사보다 평균 120밀리초 앞서 있습니다. 나아가 Swift는 가속도가 더 높아 첫 번째 게이트에서 더 높은 속도에 도달합니다.

또한 Swift는 급선회 시 더 타이트한 기동 동작을 보이는데, 이는 더 긴 시간 척도에서 궤적을 최적화하기 때문일 수 있습니다. 반면 인간 조종사는 기껏해야 다음 게이트의 위치를 ​​고려하여 더 짧은 시간 척도에서 동작을 계획하는 경향이 있습니다.

또한 Swift는 트랙에서 전체적으로 가장 높은 평균 속도를 달성했고, 가장 짧은 레이스 경로를 찾았으며, 항공기가 한계 근처에서 비행하는 데 성공했습니다. 타임 트라이얼에서 Swift는 인간 챔피언과 비교되었고, 자율 주행 드론은 평균 값과 분산이 더 낮은, 지속적으로 더 높은 랩 타임을 보인 반면, 인간 조종사의 성과는 더 높은 평균 값과 분산으로 더 개별적으로 달랐습니다.

종합적인 분석 결과, 자율 주행 드론 Swift는 속도 측면뿐만 아니라 경쟁 전반에 걸쳐 높은 수준의 성능을 유지할 수 있게 해주는 독특한 비행 전략 측면에서도 경쟁에서 뛰어난 성과를 보였습니다.

드론 경주만이 아닙니다. 이 연구는 물리적 환경으로부터 잡음이 많고 불완전한 센서 입력을 기반으로 하는 자율 드론 경주를 탐구하여 자율적인 물리적 시스템이 경주에서 챔피언십 수준의 성과를 달성했으며, 때로는 인간 세계의 세계 챔피언을 앞지르기도 했다는 것을 보여줍니다. 이는 로봇이 인기 스포츠에서 세계 챔피언십 수준의 성과를 달성한 것의 중요한 의미를 강조하고 로봇 공학과 인공 지능에 있어 중요한 이정표를 달성했다는 것을 보여줍니다.

그러나 이 연구에 사용된 시스템은 충돌 후 회복에 대한 훈련을 받지 않았기 때문에 충돌 후에 비행을 계속하는 능력이 제한되었습니다. 반면 인간 조종사는 하드웨어가 손상되어도 경쟁을 계속할 수 있습니다.

또한, 인간 조종사와 비교했을 때 Swift 시스템은 환경 변화에 대한 적응력이 약하고, 화면 주사율이 낮은 카메라를 사용합니다. 이 방법이 자율 드론 경주에서는 탁월한 성과를 거두었지만, 다른 실제 시스템과 환경에서의 일반화 능력은 아직 충분히 탐구되지 않았습니다.

분명 카우프만과 그의 팀의 업적은 드론 경주 분야에만 국한되지 않으며, 이 기술은 군사적 응용 분야에서도 자리를 잡을 수 있을 것입니다.

또한, 그들의 기술은 드론을 더 안정적이고, 더 빠르고, 더 먼 거리로 만들어 로봇이 제한된 자원을 운전, 청소, 검사 등에 더 효과적으로 활용할 수 있도록 도울 수 있습니다. 하지만 이러한 목표를 달성하기 위해 연구팀은 여전히 ​​많은 과제를 극복해야 합니다. 크룬이 그의 리뷰 기사에서 언급했듯이, "어떤 레이싱 환경에서든 인간 조종사를 이기려면 시스템은 바람, 변화하는 조명 조건, 잘 정의되지 않은 진입 및 출구 지점, 다른 레이싱 드론 및 기타 여러 요인과 같은 외부 교란을 처리할 수 있어야 합니다."

블로그로 돌아가기

댓글 남기기