Ultralytics YOLO 통한 충돌 예측 개선

도로에서 주의를 기울여도 사고는 여전히 일어날 수 있습니다. 차가 차선을 변경하거나 보행자가 무단횡단을 하거나 자전거 운전자가 경고 없이 과속을 하는 경우. 이러한 일상적인 순간은 충돌 예측 시스템이 실질적인 변화를 가져와 모든 사람의 안전을 지키는 데 도움을 줄 수 있는 예시입니다.

이전에는 공의 궤적 예측을 살펴보면서 빠르게 움직이는 공의 경로를 예측하는 것이 스포츠 분석이 움직임을 이해하고 다음에 일어날 일을 예측하는 데 어떻게 도움이 되는지 살펴봤습니다. 충돌 예측도 비슷한 방식으로 작동합니다.

이러한 예측 시스템은 기본적으로 미래를 내다봅니다. 차량과 보행자가 어떻게 움직이는지 관찰함으로써 위험을 조기에 포착하고 위험한 상황이 발생하기 전에 경로 또는 행동을 조정할 수 있습니다(모션 계획 또는 경로 계획이라고도 함).

충돌 예측 시스템의 핵심 컴퓨터 과학 기술은 인공 지능과 그 하위 분야인 컴퓨터 비전 및 예측 방법과 같이 사물이 어떻게 움직일지 예측하는 데 도움이 되는 기술입니다. 예를 들어, 다음과 같은 컴퓨터 비전 모델은 Ultralytics YOLO11 및 곧 출시될 Ultralytics YOLO26과 같은 컴퓨터 비전 모델은 차량과 보행자와 같은 물체를 실시간으로 detect track 데 사용할 수 있으며, 예측 모델은 이러한 인사이트를 사용하여 다음 움직임을 예측합니다.

그림 1. 도로 위의 물체를 detect 데 사용되는 YOLO11 예(출처).

‍

그 결과, 주변에서 일어나는 일을 이해하고 동적인 환경에서 더 스마트한 의사 결정을 지원하는 AI 시스템이 탄생했습니다. 이 글에서는 충돌 예측의 작동 방식과 그 이면의 방법, 그리고 이 과정에서 컴퓨터 비전과 Ultralytics YOLO 모델이 수행할 수 있는 역할에 대해 살펴봅니다. 시작해 보겠습니다!

충돌 예측이란 무엇인가요?

충돌 예측은 물체가 움직이는 방식을 이해하고 물체가 매우 가까이 오거나 접촉할 수 있는 시점을 예측하는 AI 시스템의 기능입니다. 다양한 시스템에서 이 정보를 안전 기능 지원, 이동 최적화, 공유 공간에서의 행동 조율 등 다양한 방식으로 사용할 수 있습니다.

고속도로의 자동차, 창고 통로의 지게차, 길을 건너는 보행자 등 물체가 공유 공간을 이동할 때마다 충돌 예측은 시스템이 이러한 상호 작용이 어떻게 전개될 수 있는지 이해하는 데 도움이 됩니다. 안전에 중점을 둔 애플리케이션에서는 이러한 예측을 통해 위험을 줄일 수 있으며, 다른 환경에서는 경로 계획, 타이밍 또는 조율된 이동과 같은 작업을 지원할 수 있습니다.

예를 들어, 첨단 운전자 보조 시스템(ADAS)이 장착된 많은 최신 차량에서는 카메라와 센서가 전방 도로를 모니터링하고 차량이 주변 물체에 얼마나 빨리 접근하고 있는지 추정합니다. 시스템이 안전하지 않은 상황을 감지하면 운전자에게 경고하고 경우에 따라 자동 제동을 통해 충격을 줄일 수 있습니다.

충돌 예측의 4단계 살펴보기

충돌 예측에는 여러 AI 구성 요소가 함께 작동하여 물체를 식별하고, 움직임을 추적하고, 다음에 일어날 수 있는 일을 예측하는 조정된 프로세스가 포함됩니다. 이러한 시스템은 일반적으로 물체 감지, 물체 추적, 궤적 예측, 최종 충돌 예측의 네 가지 연결된 단계를 거쳐 작동하며 각 단계는 이전 단계의 정확도를 기반으로 합니다.

다음으로 각 단계가 어떻게 작동하는지 자세히 살펴보겠습니다.

물체 감지 살펴보기

객체 감지는 비전 AI 모델이 이미지 또는 비디오 프레임에서 객체를 식별하고 위치를 파악하는 핵심 컴퓨터 비전 작업입니다. 객체 감지 모델은 픽셀 데이터를 분석하여 바운딩 박스, 객체 클래스, 신뢰도 점수의 세 가지 주요 결과물을 생성할 수 있습니다. 경계 상자는 객체의 위치를 표시하고, 객체 클래스는 자동차, 보행자, 자전거 등 객체의 종류를 나타내며, 신뢰도 점수는 모델이 예측에 대해 얼마나 확신하는지를 반영합니다.

YOLO11 및 YOLO26과 같은 비전 AI 모델은 이러한 기반을 바탕으로 물체 감지, 물체 추적, 방향성 경계 상자(OBB) 감지 등 여러 가지 관련 작업을 지원합니다. 객체 감지는 각 프레임에 무엇이 있는지 예측 시스템에 알려주고, 추적은 객체가 움직일 때 이를 따라가며, 방향성 경계 상자는 다양한 각도에서 나타나는 객체에 대해 보다 정확한 모양을 제공합니다.

이 단계에서 충돌 예측 시스템은 시각적 데이터에 존재하는 것을 이해하는 데만 집중합니다. 이후 모든 단계가 의존하는 기본 정보 계층을 형성하지만, 아직 객체가 어떻게 움직이거나 상호 작용할지는 고려하지 않습니다.

개체 추적 개요

객체가 감지되면 다음 단계는 시스템이 시간 경과에 따라 객체가 어떻게 움직이는지 이해할 수 있도록 여러 프레임에 걸쳐 객체를 track 것입니다. 감지는 매 프레임마다 새로운 바운딩 박스를 제공하지만, 오브젝트 추적은 시간 경과에 따라 이러한 감지를 연결하여 연속성을 추가합니다.

ByteTrack 또는 BoT-SORT와 같이 Ultralytics Python 패키지에서 지원하는 추적 알고리즘은 각 프레임의 감지 데이터를 사용하여 객체가 움직일 때 따라가는 방식으로 YOLO11 같은 모델에서 작동합니다. 이러한 알고리즘은 각 객체에 고유 ID를 할당하고 이를 사용하여 객체가 빠르게 움직이거나 부분적으로 숨겨지는 경우에도 해당 ID를 유지합니다. 이를 통해 물체가 어떻게 움직이는지 포착하는 매끄러운 추적 기록을 생성합니다.

그림 2. YOLO 사용하여 다양한 탐지에 고유 ID를 할당하는 모습(출처)

‍

다음은 이 두 가지 추적 방법이 어떻게 작동하는지에 대한 간략한 설명입니다:

바이트트랙: 높은 신뢰도와 낮은 신뢰도 감지를 모두 사용하여 일관된 개체 ID를 유지하며, 칼만 필터의 움직임 예측을 통해 개체가 빠르게 움직이거나 잠시 detect 어려운 경우에도 트래커가 안정적으로 유지되도록 도와줍니다.
BoT-SORT: 이 알고리즘은 칼만 필터 동작 예측과 외관 단서를 결합하여 SORT를 확장함으로써 트래커가 혼잡한 장면이나 부분적인 오클루전 중에 객체를 더 안정적으로 추적할 수 있도록 합니다.

이러한 추적 방법의 성능을 측정하기 위해 연구자들은 기존의 다중 객체 추적(MOT) 데이터 세트와 벤치마크를 통해 추적 방법을 평가합니다. 또한 일반적으로 사용되는 지표로는 전반적인 추적 품질을 반영하는 다중 개체 추적 정확도(MOTA), 개체 식별이 얼마나 일관되게 유지되는지를 측정하는 식별 F1 점수(IDF1), 탐지 성능과 연관 정확도 모두를 균형 있게 보여주는 고차 추적 정확도(HOTA)가 있습니다.

궤적 예측 이해

여러 프레임에 걸쳐 물체를 추적한 후 다음 단계는 물체가 다음에 어디로 갈지 예측하는 것입니다. 이를 궤적 예측이라고 합니다. 감지가 물체를 찾고 추적은 물체가 어떻게 움직이는지 따라가는 반면, 예측은 물체의 앞을 내다보고 미래 위치를 예측합니다.

물체의 바운딩 박스, 프레임 간 위치, 할당된 ID와 같은 감지 및 추적 정보를 사용하여 속도, 방향, 이동 패턴과 같은 모션 특징을 계산할 수 있습니다. 이렇게 도출된 인사이트는 예측 모델에 향후 몇 초 동안 물체가 어디에 있을지를 예측하는 데 필요한 데이터를 제공합니다.

추적 데이터에 간격이 있거나 갑작스러운 점프가 있는 경우 보간 기법을 사용하면 더 부드럽고 일관된 궤적을 재구성할 수 있습니다. 이를 통해 예측 모델은 노이즈가 많거나 불완전한 위치 데이터 대신 고품질의 모션 입력을 받을 수 있습니다.

‍

이러한 예측을 위해 많은 시스템은 물체의 움직임이 시간에 따라 어떻게 변화하는지 이해하도록 설계된 딥러닝 모델을 사용합니다. 이러한 모델은 과거 위치의 시퀀스와 그로부터 파생된 모션 특징을 분석하여 일반적인 움직임 패턴을 학습하고 그 지식을 사용하여 미래 경로를 예측합니다.

다음은 궤적 예측에 일반적으로 사용되는 몇 가지 딥러닝 및 머신러닝 접근 방식입니다:

순환 신경망(RNN): RNN은 일련의 비디오 프레임과 같은 시퀀스에서 작동하도록 설계된 딥러닝 모델입니다. 이전 위치를 기억하고 해당 정보를 사용하여 물체가 어떻게 움직였는지 이해할 수 있습니다. 이를 통해 시스템은 속도를 높이거나 낮추거나 직선으로 움직이는 것과 같은 간단한 동작 패턴을 인식할 수 있습니다.

장단기 메모리 네트워크 (LSTM): LSTM은 더 오랜 기간 동안 정보를 기억할 수 있는 고급 유형의 RNN입니다. 따라서 회전을 준비하는 차량이나 방향을 바꾸는 보행자와 같이 더 복잡한 움직임을 포착할 수 있습니다. 더 긴 추세를 track 수 있기 때문에 바쁜 환경에서 더 신뢰할 수 있는 예측을 생성하는 경우가 많습니다.

트랜스포머: 트랜스포머는 풀 모션 시퀀스를 처리하고 이러한 시퀀스에서 가장 중요한 디테일에 집중하기 위해 주의를 기울입니다. 따라서 자동차가 합쳐지거나 보행자가 횡단하는 등 여러 오브젝트가 상호 작용하는 장면에서 특히 효과적입니다.

이러한 모델은 단기 및 장기 경로를 모두 예측할 수 있습니다. 일반적으로 2초 미만의 단기 예측이 가장 정확한 경향이 있으며, 2~6초와 같이 더 긴 기간 동안의 예측은 더 많은 예측을 제공하지만 더 큰 불확실성을 수반합니다.

모든 것을 통합하세요: 충돌 감지 알고리즘

마지막 단계인 충돌 예측에서는 각 물체가 무엇인지(감지), 어떻게 움직였는지(추적), 다음에 어디로 갈 가능성이 있는지(예측) 등 지금까지 학습한 모든 것을 사용합니다. 이 단계에서는 예측된 경로가 충돌로 이어질 수 있는 방식으로 교차할 수 있는지 여부를 확인합니다.

‍

자율주행차의 경우 충돌 확인 시스템은 자동차, 보행자, 자전거 등 주변 물체의 미래 궤적을 비교합니다. 예측된 두 경로가 겹치거나 위험할 정도로 가까워지면 차량 충돌 가능성이 있는 상황으로 표시합니다. 충돌 위험이 얼마나 긴급한지 파악하기 위해 시스템은 충돌까지의 시간이라는 값도 계산합니다.

충돌까지의 시간(TTC)은 빠르게 움직이는 환경에서 중요한 측정값입니다. 두 물체가 현재 속도와 방향으로 계속 진행할 경우 충돌하기까지 남은 시간을 추정합니다. TTC가 특정 임계값 아래로 떨어지면 시스템은 경고를 보내거나 브레이크를 밟거나 계획된 경로를 조정하여 대응할 수 있습니다.

충돌 예측의 실제 적용 사례

충돌 예측은 교통 관리, 스마트 시티 인프라, 산업 자동화, 모바일 로봇 공학 등 여러 산업 분야에서 중요성이 커지고 있습니다. 최첨단 컴퓨터 비전 및 예측 모델이 계속 발전함에 따라 이러한 시스템은 움직임을 예측할 수 있는 능력이 더욱 향상되고 있습니다.

이제 충돌 예측과 궤적 예측이 어떻게 작동하는지 더 잘 이해했으니, 다양한 실제 환경에서 이러한 방법을 어떻게 사용할 수 있는지 보여주는 흥미로운 연구 결과를 살펴봅시다.

긴급 자율 주행 차량을 위한 YOLO 충돌 예측

혼잡하고 예측할 수 없는 환경을 탐색하는 것은 자율주행 시스템에서 가장 어려운 과제 중 하나이며, 특히 보행자가 명확한 패턴을 따르지 않는 방식으로 움직일 때 더욱 그렇습니다. 긴급 차량은 구조화된 도로, 차선 표시 또는 예측 가능한 보행자 행동에 의존하지 않고 밀집된 공공장소에서 빠른 속도로 이동해야 하므로 이러한 문제에 더욱 자주 직면하게 됩니다.

이러한 유형의 시나리오에서는 사람들이 어디에 있고 앞으로 몇 초 동안 어떻게 움직일지 파악하는 것이 사고를 피하는 데 필수적입니다. 예를 들어, 최근의 한 연구에서는 보행자가 많은 환경에서 운행하는 긴급 자율주행 차량(EAV)을 위한 완전한 충돌 예측 파이프라인을 구축하여 이 문제를 탐구했습니다.

YOLO 충돌 예측 파이프라인의 작동 방식

이 방법론의 작동 원리는 다음과 같습니다:

YOLO 사용한 보행자 감지: YOLO 감지기는 각 카메라 프레임에서 보행자를 식별하고 보이는 각 사람에 대한 경계 상자를 출력합니다.
↪f_200D↩
바이트트랙을 이용한 모션 트래킹: 바이트트랙 알고리즘은 이러한 감지를 프레임 간에 연결하여 각 보행자에게 일관된 ID를 부여하고 시간 경과에 따라 어떻게 움직이는지 보여주는 모션 히스토리를 생성합니다.
‍
실제 위치 추정: 역원근 매핑(IPM)은 2D 픽셀 좌표를 대략적인 지표면 위치로 변환하여 시스템이 차량 대비 실제 공간에서 보행자의 위치를 파악하는 데 도움을 줍니다.
↪f_200D↩
cGAN을 사용한 조감도 생성: 한 이미지 형식을 다른 이미지 형식으로 변환하는 AI 모델인 조건부 GAN은 장면의 조감도를 생성합니다. 이 하향식 레이아웃을 사용하면 보행자의 위치와 주변 환경을 더 쉽게 해석할 수 있습니다.
‍
LSTM 모델을 사용한 궤적 예측: 각 보행자의 과거 위치와 이동 패턴을 사용하여 LSTM 모델이 다음 몇 초 동안 이동할 가능성이 높은 위치를 예측합니다.
‍
충돌 콘을 이용한 효율적인 충돌 감지: 충돌 콘 방법을 사용하여 예측된 궤적을 비교하여 차량과 보행자의 경로가 교차할 수 있는 경로인지 여부를 결정합니다.
‍
신호를 통한 충돌 방지: 시스템이 충돌을 예측하면 최적의 순간에 청각적 신호(예: 경적 또는 벨)를 활성화합니다. 이 타이밍은 보행자의 행동에 영향을 미치고 속도를 높이거나 낮춰 안전하게 피할 수 있는 기회를 제공하기 위해 선택됩니다.

엣지 비전과 YOLO 활용한 도시 내 보행자 안전 보장

마찬가지로 충돌 방지를 위한 또 다른 접근 방식은 차량을 넘어 인프라 자체에 초점을 맞추는 것입니다. 이 방법은 차량 내부의 센서에 의존하는 대신 횡단보도와 교차로에 설치된 스마트 카메라를 사용하여 보행자와 차량의 움직임을 실시간으로 모니터링합니다. 이러한 장소에서는 사람들이 갑자기 도로에 뛰어들거나 자전거를 타는 사람이 차 사이로 끼어들 수 있고 운전자가 항상 속도를 줄이지 않을 수 있기 때문에 위험을 조기에 감지하는 것이 매우 중요합니다.

교차로에서 차량과 보행자의 위험을 직접 예측하도록 설계된 에지 비전 장치인 NAVIBox라는 시스템을 통해 이 아이디어를 탐구한 흥미로운 연구가 있습니다. 이 시스템은 Ultralytics YOLOv8 모델을 사용하여 보행자와 차량을 detect , 가벼운 Centroid 트래커를 사용하여 여러 프레임에 걸쳐 보행자를 추적합니다. 이를 통해 짧고 신뢰할 수 있는 모션 히스토리를 생성한 다음, 원근 변환을 통해 각진 CCTV 뷰를 도로의 선명한 조감도로 변환하여 정제합니다.

이러한 정교한 궤적을 통해 NAVIBox는 도로 사용자가 향후 몇 초 동안 어떻게 움직일지 예측하고 경로가 교차할 수 있는지 확인할 수 있습니다(교차로 테스트라고도 함). 시스템이 위험한 상호작용을 감지하면 원격 서버나 네트워크 연결에 의존하지 않고도 운전자에게는 디스플레이를 통해, 보행자에게는 스피커를 통해 즉시 경고를 보냅니다. 실제 도심에서의 테스트 결과, NAVIBox는 실시간 대응이 가능할 정도로 빠르게 작동하고 잠재적인 충돌 시나리오를 정확하게 식별할 수 있어 복잡한 도심 교차로에서 실용적인 안전 도구가 될 수 있는 것으로 나타났습니다.

‍

충돌 감지 및 예측의 장단점

AI 기반 예측 충돌 시스템을 사용하면 얻을 수 있는 몇 가지 이점은 다음과 같습니다:

상황 인식을 개선합니다: AI 시스템은 환경에서 사물이 어떻게 움직이는지 지속적으로 매핑하여 대규모 군중의 흐름, 교통 행동 또는 기계 경로에 대한 보다 풍부한 이해를 제공합니다.
↪f_200D↩
장기적인 계획을 위한 데이터 기반 인사이트: AI 시스템은 감지, 아차사고, 이동 패턴을 기록하여 도시 계획가, 안전팀, 차량 운영자가 교차로를 재설계하고 표지판을 개선하거나 운영 정책을 개선하는 데 사용할 수 있는 분석 정보를 제공합니다.

비용 효율적인 위험 예방: 이러한 시스템은 위험이 확대되기 전에 이를 감지함으로써 비용이 많이 드는 사고, 보험 청구 또는 장비 수리를 방지할 수 있습니다.

이러한 장점에도 불구하고 충돌 없는 시스템도 특정 한계에 직면해 있습니다. 다음은 몇 가지 고려해야 할 과제입니다:

센서 및 카메라 배치 제약: 카메라의 위치나 각도가 잘못되면 물체의 크기나 거리가 왜곡되어 깊이 추정 및 궤적 예측의 신뢰도가 떨어질 수 있습니다.
↪cf_200D↩
오클루전: 객체가 다른 객체 뒤에 부분적으로 또는 전체적으로 숨겨질 수 있습니다. 이렇게 하면 모델이 시각적 연속성을 잃기 때문에 오브젝트 추적이 어려워집니다.
‍
환경 조건: 저조도, 강한 햇빛, 비, 안개 또는 카메라 화질이 좋지 않으면 모델이 장면을 선명하게 볼 수 있는 능력이 저하되어 정확도에 영향을 줄 수 있습니다.

주요 내용

충돌 예측은 시스템이 현재 환경에서 일어나는 일을 이해하는 컴퓨터 비전과 다음에 일어날 일을 예측하는 궤적 예측이라는 두 가지 강력한 기능을 결합합니다.

이러한 강점을 결합하여 기계는 움직이는 물체를 실시간으로 detect 몇 초 안에 물체가 어떻게 상호작용할지 예측할 수 있습니다. 컴퓨터 비전과 예측 기술이 계속 발전함에 따라 충돌 예측은 더 안전하고 안정적이며 확장 가능한 자율 시스템을 구축하는 데 핵심이 될 것입니다.

AI에 대해 자세히 알아보려면 커뮤니티와 GitHub 리포지토리를 확인하세요. 솔루션 페이지에서 의료 분야의 AI 및 제조 분야의 컴퓨터 비전과 같은 애플리케이션을 살펴보세요. 라이선스 옵션을 살펴보고 지금 바로 구축을 시작하세요!

Ultralytics YOLO 모델을 통한 충돌 예측 개선