욜로 비전 선전
선전
지금 참여하기

YOLO12 설명: 실제 애플리케이션 및 사용 사례

Abirami Vina

5분 분량

2025년 2월 26일

최신 컴퓨터 비전 모델인 YOLO12를 경험해 보세요! 주의 집중 아키텍처와 FlashAttention 기술이 산업 전반에서 객체 감지 작업을 향상시키는 방법을 알아보세요.

컴퓨터 비전은 기계가 이미지와 비디오를 이해하도록 돕는 인공 지능(AI)의 한 분야입니다. AI 연구원과 개발자가 끊임없이 한계를 뛰어넘고 있기 때문에 엄청난 속도로 발전하고 있는 분야입니다. AI 커뮤니티는 항상 모델을 더 빠르고, 더 스마트하고, 더 효율적으로 만드는 것을 목표로 합니다. 가장 최근의 혁신 중 하나는 2025년 2월 18일에 출시된 YOLO(You Only Look Once) 모델 시리즈의 최신 버전인 YOLO12입니다.

YOLO12는 SUNY(뉴욕 주립 대학교) 버팔로 캠퍼스 및 중국 과학원 대학교의 연구원들이 개발했습니다. YOLO12는 새로운 접근 방식으로 주의 집중 메커니즘을 도입하여 모델이 모든 것을 동일하게 처리하는 대신 이미지에서 가장 중요한 부분에 집중할 수 있도록 합니다. 

또한 더 적은 메모리를 사용하면서 처리 속도를 높이는 기술인 FlashAttention과 인간이 자연스럽게 중앙 객체에 집중하는 방식을 모방하도록 설계된 영역 주의 메커니즘이 특징입니다.

이러한 개선으로 YOLO12n은 YOLOv10n보다 2.1% 더 정확하고 YOLO12m은 YOLO11m보다 +1.0% 더 정확합니다. 그러나 여기에는 절충점이 있습니다. YOLO12n은 YOLOv10n보다 9% 더 느리고 YOLO12m은 YOLO11m보다 3% 더 느립니다.

__wf_reserved_inherit
Fig 1. YOLO12를 사용하여 객체를 감지하는 데 사용되는 예시입니다.

이번 글에서는 YOLO12를 차별화하는 요소, 이전 버전과의 비교, 그리고 적용 분야에 대해 살펴보겠습니다.

YOLO12 출시 로드맵

YOLO 모델 시리즈는 실시간 객체 탐지를 위해 설계된 컴퓨터 비전 모델 모음으로, 이미지와 비디오에서 객체를 신속하게 식별하고 위치를 찾을 수 있습니다. 시간이 지남에 따라 각 버전은 속도, 정확성 및 효율성 측면에서 개선되었습니다.

예를 들어, 2020년에 출시된 Ultralytics YOLOv5는 빠르고 쉽게 사용자 정의 훈련 및 배포할 수 있었기 때문에 널리 사용되었습니다. 이후 Ultralytics YOLOv8은 인스턴스 분할 및 객체 추적과 같은 컴퓨터 비전 작업에 대한 추가 지원을 제공함으로써 이를 개선했습니다. 

최근에는 Ultralytics YOLO11이 속도와 정확성 간의 균형을 유지하면서 실시간 처리 개선에 주력했습니다. 예를 들어 YOLO11m은 YOLOv8m보다 파라미터 수가 22% 적었지만 객체 탐지 모델 평가를 위한 널리 사용되는 벤치마크인 COCO 데이터 세트에서 더 나은 탐지 성능을 제공했습니다.

이러한 발전을 바탕으로 YOLO12는 시각 정보를 처리하는 방식에 변화를 가져왔습니다. 이미지의 모든 부분을 동일하게 취급하는 대신 가장 관련성이 높은 영역의 우선 순위를 지정하여 감지 정확도를 향상시킵니다. 간단히 말해서 YOLO12는 이전 개선 사항을 기반으로 하면서도 더 정확해지는 것을 목표로 합니다.

YOLO12의 주요 기능

YOLO12는 실시간 처리 속도를 그대로 유지하면서 컴퓨터 비전 작업을 향상시키는 몇 가지 개선 사항을 도입했습니다. 다음은 YOLO12의 주요 기능에 대한 개요입니다.

  • 어텐션 중심 아키텍처: YOLO12는 이미지의 모든 부분을 동일하게 취급하는 대신 가장 중요한 영역에 집중합니다. 이를 통해 정확도가 향상되고 불필요한 처리가 줄어들어 복잡한 이미지에서도 탐지가 더 선명하고 효율적으로 이루어집니다.
  • FlashAttention: YOLO12는 메모리 사용량을 줄이면서 이미지 분석 속도를 높입니다. 메모리 효율적인 알고리즘인 FlashAttention을 통해 데이터 처리를 최적화하여 하드웨어 부담을 줄이고 실시간 작업을 더 원활하고 안정적으로 만듭니다.
  • R-ELAN(Residual Efficient Layer Aggregation Networks): YOLO12는 R-ELAN을 사용하여 레이어를 보다 효율적으로 구성하여 모델이 데이터를 처리하고 학습하는 방식을 개선합니다. 이를 통해 훈련이 더욱 안정화되고, 객체 인식이 더욱 선명해지며, 컴퓨팅 요구 사항이 낮아져 다양한 환경에서 효율적으로 실행됩니다.

이러한 기능이 실제로 어떻게 작동하는지 이해하려면 쇼핑몰을 생각해 보십시오. YOLO12는 쇼핑객을 추적하고, 화분이나 홍보 표지판과 같은 상점 장식을 식별하고, 잘못 놓이거나 버려진 품목을 발견하는 데 도움이 될 수 있습니다. 

주의 집중 아키텍처는 가장 중요한 세부 사항에 집중하는 데 도움이 되며, FlashAttention은 시스템에 과부하를 주지 않으면서 모든 것을 신속하게 처리합니다. 이를 통해 쇼핑몰 운영자는 보안을 강화하고, 매장 레이아웃을 구성하고, 전반적인 쇼핑 경험을 향상시킬 수 있습니다.

__wf_reserved_inherit
Fig 2. YOLO12를 사용하여 쇼핑몰에서 객체 감지.

그러나 YOLO12에도 고려해야 할 몇 가지 제한 사항이 있습니다.

  • 더 느린 훈련 시간: 아키텍처로 인해 YOLO12는 YOLO11에 비해 더 많은 훈련 시간이 필요합니다.
  • 내보내기 문제: 일부 사용자는 YOLOv12 모델을 내보낼 때, 특히 특정 배포 환경에 통합할 때 어려움을 겪을 수 있습니다.

YOLO12의 성능 벤치마크 이해

YOLO12는 다양한 요구 사항에 최적화된 여러 가지 변형으로 제공됩니다. 소형 버전(nano 및 small)은 속도와 효율성을 우선시하므로 모바일 장치 및 에지 컴퓨팅에 적합합니다. 중간 및 대형 버전은 속도와 정확도 사이의 균형을 유지하며, YOLO12x(extra large)는 산업 자동화, 의료 영상 및 고급 감시 시스템과 같은 고정밀 애플리케이션을 위해 설계되었습니다.

이러한 변형을 통해 YOLO12는 모델 크기에 따라 다양한 수준의 성능을 제공합니다. 벤치마크 테스트에 따르면 특정 YOLO12 변형은 정확도 면에서 YOLOv10 및 YOLO11보다 성능이 뛰어나 더 높은 평균 정밀도(mAP)를 달성합니다. 

그러나 YOLO12m, YOLO12l, YOLO12x와 같은 일부 모델은 YOLO11보다 이미지 처리 속도가 느려 감지 정확도와 속도 간의 절충점을 보여줍니다. 그럼에도 불구하고 YOLO12는 여전히 효율적이며 다른 많은 모델보다 적은 파라미터를 필요로 하지만 YOLO11보다는 더 많이 사용합니다. 따라서 원시 속도보다 정확도가 더 중요한 애플리케이션에 적합합니다.

__wf_reserved_inherit
Fig 3. Ultralytics YOLO11과 YOLO12 비교.

Ultralytics Python 패키지를 통한 YOLO12 사용

YOLO12는 Ultralytics Python 패키지에서 지원되며 사용하기 쉬워 초보자와 전문가 모두가 접근할 수 있습니다. 몇 줄의 코드만으로 사용자는 사전 훈련된 모델을 로드하고, 이미지 및 비디오에서 다양한 컴퓨터 비전 작업을 실행하고, 사용자 지정 데이터 세트에서 YOLO12를 훈련할 수도 있습니다. Ultralytics Python 패키지는 복잡한 설정 단계를 제거하여 프로세스를 간소화합니다.

예를 들어 객체 탐지를 위해 YOLO12를 사용하는 단계는 다음과 같습니다.

  • Ultralytics 패키지 설치: 먼저 YOLO12를 효율적으로 실행하는 데 필요한 도구를 제공하는 Ultralytics Python 패키지를 설치합니다. 이렇게 하면 모든 종속성이 올바르게 설정됩니다.
  • 사전 훈련된 YOLO12 모델 로드: 작업에 필요한 정확도와 속도 수준에 따라 적절한 YOLO12 변형(nano, small, medium, large 또는 extra large)을 선택하십시오.
  • 이미지 또는 비디오 제공: 분석할 이미지 또는 비디오 파일을 입력합니다. YOLO12는 실시간 감지를 위해 라이브 비디오 피드를 처리할 수도 있습니다.
  • 탐지 프로세스 실행: 모델은 시각적 데이터를 스캔하여 객체를 식별하고 경계 상자를 배치합니다. 또한, 탐지된 각 객체에 예측 클래스 및 신뢰도 점수를 레이블링합니다.
  • 감지 설정 조정: 신뢰도 임계값과 같은 파라미터를 수정하여 감지 정확도와 성능을 미세 조정할 수도 있습니다.
  • 결과 저장 또는 사용: 탐지된 객체를 포함하는 처리된 이미지 또는 비디오를 저장하거나 추가 분석, 자동화 또는 의사 결정을 위해 애플리케이션에 통합할 수 있습니다.

이러한 단계를 통해 YOLO12는 감시 및 소매 추적에서 의료 영상 및 자율 주행 차량에 이르기까지 다양한 애플리케이션에 쉽게 사용할 수 있습니다.

실용적인 YOLO12 응용

YOLO12는 객체 감지, 인스턴스 분할, 이미지 분류, 자세 추정 및 OBB(Oriented Object Detection)를 지원하므로 다양한 실제 애플리케이션에서 사용할 수 있습니다. 

__wf_reserved_inherit
Fig 4. YOLO12는 객체 탐지 및 인스턴스 분할과 같은 작업을 지원합니다.

그러나 앞서 논의한 바와 같이 YOLO12 모델은 속도보다 정확성을 우선시하므로 이전 버전에 비해 이미지를 처리하는 데 약간 더 오래 걸립니다. 이러한 절충은 YOLO12를 실시간 속도보다 정밀도가 더 중요한 애플리케이션에 이상적으로 만듭니다. 예를 들면 다음과 같습니다.

  • 의료 영상: YOLO12는 엑스레이 및 MRI에서 종양 또는 이상을 높은 정확도로 탐지하도록 맞춤형으로 훈련될 수 있으므로, 진단을 위해 정확한 이미지 분석이 필요한 의사와 방사선 전문의에게 유용한 도구입니다.
  • 제조업의 품질 관리: 생산 과정에서 제품 결함을 식별하는 데 도움이 되어 고품질 품목만 시장에 출시되도록 하는 동시에 폐기물을 줄이고 효율성을 개선할 수 있습니다.
  • 법의학적 분석: 법 집행 기관은 YOLO12를 미세 조정하여 감시 영상을 분석하고 증거를 수집할 수 있습니다. 범죄 수사에서는 핵심 세부 사항을 식별하는 데 정확성이 중요합니다.
  • 정밀 농업: 농부들은 YOLO12를 사용하여 작물 건강을 분석하고, 질병이나 해충 감염을 감지하고, 토양 상태를 모니터링할 수 있습니다. 정확한 평가는 농업 전략을 최적화하여 더 나은 수확량과 자원 관리를 가능하게 합니다.

YOLO12 시작하기

YOLO12를 실행하기 전에 시스템이 필요한 요구 사항을 충족하는지 확인하는 것이 중요합니다.

기술적으로 YOLO12는 모든 전용 GPU(Graphics Processing Unit)에서 실행할 수 있습니다. 기본적으로 FlashAttention이 필요하지 않으므로 대부분의 GPU 시스템에서 작동할 수 있습니다. 그러나 FlashAttention을 활성화하면 대규모 데이터 세트 또는 고해상도 이미지로 작업할 때 특히 유용합니다. 속도 저하를 방지하고 메모리 사용량을 줄이며 처리 효율성을 향상시키는 데 도움이 되기 때문입니다. 

FlashAttention을 사용하려면 Turing(T4, Quadro RTX), Ampere(RTX 30 시리즈, A30, A40, A100), Ada Lovelace(RTX 40 시리즈) 또는 Hopper(H100, H200) 시리즈의 NVIDIA GPU가 필요합니다.

사용 편의성과 접근성을 고려하여 Ultralytics Python 패키지는 아직 FlashAttention 추론을 지원하지 않습니다. 설치가 기술적으로 매우 복잡할 수 있기 때문입니다. YOLO12 시작 및 성능 최적화에 대한 자세한 내용은 Ultralytics 공식 문서를 참조하십시오.

주요 내용

컴퓨터 비전이 발전함에 따라 모델이 더욱 정확하고 효율적으로 변모하고 있습니다. YOLO12는 주의 집중 처리 및 FlashAttention을 통해 객체 감지, 인스턴스 분할 및 이미지 분류와 같은 컴퓨터 비전 작업을 개선하여 메모리 사용을 최적화하면서 정확도를 향상시킵니다.

동시에 컴퓨터 비전은 그 어느 때보다 접근성이 높아졌습니다. YOLO12는 Ultralytics Python 패키지를 통해 사용하기 쉬우며 속도보다 정확성에 중점을 두어 정밀도가 중요한 의료 영상, 산업 검사 및 로봇 공학에 적합합니다.

AI에 대해 더 알고 싶으신가요? GitHub 저장소를 방문하여 커뮤니티에 참여하세요. 솔루션 페이지에서 자율 주행차의 AI농업의 컴퓨터 비전과 같은 분야의 혁신을 살펴보세요. 라이선스 옵션을 확인하고 Vision AI 프로젝트를 실현해 보세요. 🚀

함께 미래의 AI를 만들어 갑시다!

미래의 머신러닝 여정을 시작하세요

무료로 시작하기
클립보드에 링크가 복사되었습니다.