Yolo 비전 선전
선전
지금 참여하기
용어집

프레임 보간

프레임 보간 기술이 AI를 활용해 부드럽고 높은 프레임률(FPS)의 영상을 생성하는 방식을 살펴보세요. Ultralytics Ultralytics 사용하여 물체 추적 성능을 향상시키는 방법을 알아보세요.

프레임 보간은 기존 프레임 사이에 새로운 중간 프레임을 합성하여 동영상의 프레임 속도를 높이고 더 부드러운 움직임을 구현하는 컴퓨터 비전 및 영상 처리 기술입니다. 과거에는 기본적인 이미지 블렌딩에 의존했으나, 현대의 프레임 보간 기술은 고급 딥러닝(DL) 모델을 활용하여 인접한 프레임의 움직임과 내용을 분석하고, 복잡한 픽셀 이동을 예측하여 고품질의 연속적인 이미지를 생성합니다. 이 AI 기반 접근 방식은 다양한 멀티미디어 및 과학 분야에서 표준 영상을 고주사율 미디어로 변환하고, 슬로우 모션 효과를 합성하며, 빠른 속도의 시퀀스를 안정화하는 데 널리 활용되고 있습니다.

AI 기반 프레임 보간 기술의 작동 원리

현대적인 보간 프레임워크는 단순한 프레임 평균화 방식에서 벗어나 있습니다. 대신, 이들은 복잡한 신경망(NN) 과 정교한 운동 추정 전략을 활용하여 연속적인 입력 데이터 사이의 공백을 메웁니다:

  • 광학 흐름 기반 보간법: 이 방법은 프레임 간 픽셀의 겉보기 움직임을 계산합니다. 모델은 이렇게 추정된 흐름을 이용해 입력 이미지를 변형하고 합성합니다. 처리 속도는 빠르지만, 심각한 가림 현상이나 급격한 움직임의 경우 처리하기 어려울 수 있습니다.
  • 컨볼루션 및 트랜스포머 아키텍처: 심층 컨볼루션 신경망(CNN) 과 최신 트랜스포머 모델은 풍부한 공간적 및 시간적 관계를 학습합니다. 이들은 더 넓은 수용 영역에 걸쳐 문맥적 특징을 예측함으로써 가림 현상과 빠른 움직임을 처리합니다.
  • 생성적 접근법: 최근의 획기적인 연구에서는 확산 모델을 활용하여 중간 프레임을 생성합니다. 이러한 모델은 입력 프레임에 상당한 움직임 공백이 존재하더라도 지각적으로 현실감 있는 합성을 가능하게 하며, 이벤트 기반 비디오 프레임 보간(EVFI) 과 같은 기술을 적용해 희소 센서 데이터를 이용해 고속 움직임을 재구성합니다.

관련 개념 구분하기

비디오 향상 파이프라인을 효과적으로 구축하려면 프레임 보간과 관련 인공지능(AI) 기술을 명확히 구분하는 것이 중요합니다:

  • 프레임 보간 대 광학 흐름: 광학 흐름은 픽셀 이동의 방향과 속도를 측정하는 저수준 지표입니다. 프레임 보간은 픽셀을 변형하고 완전히 새로운 이미지 프레임을 생성하기 위해 광학 흐름을 기본 도구로 활용하는 경우가 많은 고수준 작업입니다.
  • 프레임 보간 대 초고해상도: 보간은 초당 프레임 수를 늘려 시간 해상도를 높입니다(예: 30 FPS에서 60 FPS로 시간적 업샘플링 ). 반면, 초고해상도는 개별 프레임의 픽셀 크기를 확대하여 공간 해상도를 높입니다(예: 1080p에서 4K로).

주요 실제 적용 사례

프레임 보간 기술은 시각적 데이터의 공백을 메움으로써 다양한 산업 분야에서 직면한 중대한 과제를 해결합니다:

  1. 미디어 및 스포츠 방송: 제작자들은 Google FILM(Frame Interpolation for Large Motion) 과 같은 도구를 활용해 일반 카메라로 촬영한 영상에서 매우 부드러운 슬로우 모션 영상을 생성합니다. 이를 통해 고가의 고속 촬영 장비를 사용하지 않고도 스포츠 분석과 영화 같은 효과를 한층 더 향상시킬 수 있습니다.
  2. 생물 및 의학 영상: 타임랩스 현미경 관찰에서, 생성적 프레임 보간 기술은 세포 분열이나 박테리아 이동과 같은 생물학적 대상의 추적 정확도를 높여줍니다. 중간 단계를 합성함으로써, 연구자들은 실제 촬영 빈도를 줄일 수 있으며, 이는 광독성을 억제하고 민감한 시료를 보존하는 데 도움이 됩니다.

보간 영상을 활용한 AI 워크플로 개선

기계 학습에서 고프레임률 영상을 활용하면 시간적 전환이 더욱 부드러워지고 바운딩 박스의 갑작스러운 이동이 줄어들어, 후속 물체 추적의 정확도가 획기적으로 향상됩니다. 영상을 보간법을 통해 부드럽게 처리하면, Ultralytics 같은 모델이 합성된 프레임 전반에 걸쳐 track 쉽게 track 수 있습니다.

다음 사항 Python 이 코드 예제는 track 보간 처리된 고프레임률(FPS) 동영상에서 ultralytics 패키지입니다:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Run persistent object tracking on the temporally up-sampled video
# The tracker uses the smooth motion to preserve object IDs more accurately
results = model.track(source="interpolated_high_fps_video.mp4", show=True, tracker="botsort.yaml")

대규모 영상 처리를 위해 팀은 Ultralytics 활용하여 보간된 데이터셋에 대한 데이터 주석 작업을 자동화함으로써, 복잡한 영상 이해 파이프라인을 위한 원활한 클라우드 훈련과 안정적인 모델 배포를 실현할 수 있습니다.

함께 AI의 미래를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요