최신 컴퓨터 비전 모델인 YOLO12를 경험해 보세요! 주의 집중 아키텍처와 FlashAttention 기술이 산업 전반에서 객체 감지 작업을 향상시키는 방법을 알아보세요.
최신 컴퓨터 비전 모델인 YOLO12를 경험해 보세요! 주의 집중 아키텍처와 FlashAttention 기술이 산업 전반에서 객체 감지 작업을 향상시키는 방법을 알아보세요.
컴퓨터 비전은 기계가 이미지와 비디오를 이해하도록 돕는 인공 지능(AI)의 한 분야입니다. AI 연구원과 개발자가 끊임없이 한계를 뛰어넘고 있기 때문에 엄청난 속도로 발전하고 있는 분야입니다. AI 커뮤니티는 항상 모델을 더 빠르고, 더 스마트하고, 더 효율적으로 만드는 것을 목표로 합니다. 가장 최근의 혁신 중 하나는 2025년 2월 18일에 출시된 YOLO(You Only Look Once) 모델 시리즈의 최신 버전인 YOLO12입니다.
YOLO12는 SUNY(뉴욕 주립 대학교) 버팔로 캠퍼스 및 중국 과학원 대학교의 연구원들이 개발했습니다. YOLO12는 새로운 접근 방식으로 주의 집중 메커니즘을 도입하여 모델이 모든 것을 동일하게 처리하는 대신 이미지에서 가장 중요한 부분에 집중할 수 있도록 합니다.
또한 더 적은 메모리를 사용하면서 처리 속도를 높이는 기술인 FlashAttention과 인간이 자연스럽게 중앙 객체에 집중하는 방식을 모방하도록 설계된 영역 주의 메커니즘이 특징입니다.
이러한 개선으로 YOLO12n은 YOLOv10n보다 2.1% 더 정확하고 YOLO12m은 YOLO11m보다 +1.0% 더 정확합니다. 그러나 여기에는 절충점이 있습니다. YOLO12n은 YOLOv10n보다 9% 더 느리고 YOLO12m은 YOLO11m보다 3% 더 느립니다.

이번 글에서는 YOLO12를 차별화하는 요소, 이전 버전과의 비교, 그리고 적용 분야에 대해 살펴보겠습니다.
YOLO 모델 시리즈는 실시간 객체 탐지를 위해 설계된 컴퓨터 비전 모델 모음으로, 이미지와 비디오에서 객체를 신속하게 식별하고 위치를 찾을 수 있습니다. 시간이 지남에 따라 각 버전은 속도, 정확성 및 효율성 측면에서 개선되었습니다.
예를 들어, 2020년에 출시된 Ultralytics YOLOv5는 빠르고 쉽게 사용자 정의 훈련 및 배포할 수 있었기 때문에 널리 사용되었습니다. 이후 Ultralytics YOLOv8은 인스턴스 분할 및 객체 추적과 같은 컴퓨터 비전 작업에 대한 추가 지원을 제공함으로써 이를 개선했습니다.
최근에는 Ultralytics YOLO11이 속도와 정확성 간의 균형을 유지하면서 실시간 처리 개선에 주력했습니다. 예를 들어 YOLO11m은 YOLOv8m보다 파라미터 수가 22% 적었지만 객체 탐지 모델 평가를 위한 널리 사용되는 벤치마크인 COCO 데이터 세트에서 더 나은 탐지 성능을 제공했습니다.
이러한 발전을 바탕으로 YOLO12는 시각 정보를 처리하는 방식에 변화를 가져왔습니다. 이미지의 모든 부분을 동일하게 취급하는 대신 가장 관련성이 높은 영역의 우선 순위를 지정하여 감지 정확도를 향상시킵니다. 간단히 말해서 YOLO12는 이전 개선 사항을 기반으로 하면서도 더 정확해지는 것을 목표로 합니다.
YOLO12는 실시간 처리 속도를 그대로 유지하면서 컴퓨터 비전 작업을 향상시키는 몇 가지 개선 사항을 도입했습니다. 다음은 YOLO12의 주요 기능에 대한 개요입니다.
이러한 기능이 실제로 어떻게 작동하는지 이해하려면 쇼핑몰을 생각해 보십시오. YOLO12는 쇼핑객을 추적하고, 화분이나 홍보 표지판과 같은 상점 장식을 식별하고, 잘못 놓이거나 버려진 품목을 발견하는 데 도움이 될 수 있습니다.
주의 집중 아키텍처는 가장 중요한 세부 사항에 집중하는 데 도움이 되며, FlashAttention은 시스템에 과부하를 주지 않으면서 모든 것을 신속하게 처리합니다. 이를 통해 쇼핑몰 운영자는 보안을 강화하고, 매장 레이아웃을 구성하고, 전반적인 쇼핑 경험을 향상시킬 수 있습니다.

그러나 YOLO12에도 고려해야 할 몇 가지 제한 사항이 있습니다.
YOLO12는 다양한 요구 사항에 최적화된 여러 가지 변형으로 제공됩니다. 소형 버전(nano 및 small)은 속도와 효율성을 우선시하므로 모바일 장치 및 에지 컴퓨팅에 적합합니다. 중간 및 대형 버전은 속도와 정확도 사이의 균형을 유지하며, YOLO12x(extra large)는 산업 자동화, 의료 영상 및 고급 감시 시스템과 같은 고정밀 애플리케이션을 위해 설계되었습니다.
이러한 변형을 통해 YOLO12는 모델 크기에 따라 다양한 수준의 성능을 제공합니다. 벤치마크 테스트에 따르면 특정 YOLO12 변형은 정확도 면에서 YOLOv10 및 YOLO11보다 성능이 뛰어나 더 높은 평균 정밀도(mAP)를 달성합니다.
그러나 YOLO12m, YOLO12l, YOLO12x와 같은 일부 모델은 YOLO11보다 이미지 처리 속도가 느려 감지 정확도와 속도 간의 절충점을 보여줍니다. 그럼에도 불구하고 YOLO12는 여전히 효율적이며 다른 많은 모델보다 적은 파라미터를 필요로 하지만 YOLO11보다는 더 많이 사용합니다. 따라서 원시 속도보다 정확도가 더 중요한 애플리케이션에 적합합니다.

YOLO12는 Ultralytics Python 패키지에서 지원되며 사용하기 쉬워 초보자와 전문가 모두가 접근할 수 있습니다. 몇 줄의 코드만으로 사용자는 사전 훈련된 모델을 로드하고, 이미지 및 비디오에서 다양한 컴퓨터 비전 작업을 실행하고, 사용자 지정 데이터 세트에서 YOLO12를 훈련할 수도 있습니다. Ultralytics Python 패키지는 복잡한 설정 단계를 제거하여 프로세스를 간소화합니다.
예를 들어 객체 탐지를 위해 YOLO12를 사용하는 단계는 다음과 같습니다.
이러한 단계를 통해 YOLO12는 감시 및 소매 추적에서 의료 영상 및 자율 주행 차량에 이르기까지 다양한 애플리케이션에 쉽게 사용할 수 있습니다.
YOLO12는 객체 감지, 인스턴스 분할, 이미지 분류, 자세 추정 및 OBB(Oriented Object Detection)를 지원하므로 다양한 실제 애플리케이션에서 사용할 수 있습니다.

그러나 앞서 논의한 바와 같이 YOLO12 모델은 속도보다 정확성을 우선시하므로 이전 버전에 비해 이미지를 처리하는 데 약간 더 오래 걸립니다. 이러한 절충은 YOLO12를 실시간 속도보다 정밀도가 더 중요한 애플리케이션에 이상적으로 만듭니다. 예를 들면 다음과 같습니다.
YOLO12를 실행하기 전에 시스템이 필요한 요구 사항을 충족하는지 확인하는 것이 중요합니다.
기술적으로 YOLO12는 모든 전용 GPU(Graphics Processing Unit)에서 실행할 수 있습니다. 기본적으로 FlashAttention이 필요하지 않으므로 대부분의 GPU 시스템에서 작동할 수 있습니다. 그러나 FlashAttention을 활성화하면 대규모 데이터 세트 또는 고해상도 이미지로 작업할 때 특히 유용합니다. 속도 저하를 방지하고 메모리 사용량을 줄이며 처리 효율성을 향상시키는 데 도움이 되기 때문입니다.
FlashAttention을 사용하려면 Turing(T4, Quadro RTX), Ampere(RTX 30 시리즈, A30, A40, A100), Ada Lovelace(RTX 40 시리즈) 또는 Hopper(H100, H200) 시리즈의 NVIDIA GPU가 필요합니다.
사용 편의성과 접근성을 고려하여 Ultralytics Python 패키지는 아직 FlashAttention 추론을 지원하지 않습니다. 설치가 기술적으로 매우 복잡할 수 있기 때문입니다. YOLO12 시작 및 성능 최적화에 대한 자세한 내용은 Ultralytics 공식 문서를 참조하십시오.
컴퓨터 비전이 발전함에 따라 모델이 더욱 정확하고 효율적으로 변모하고 있습니다. YOLO12는 주의 집중 처리 및 FlashAttention을 통해 객체 감지, 인스턴스 분할 및 이미지 분류와 같은 컴퓨터 비전 작업을 개선하여 메모리 사용을 최적화하면서 정확도를 향상시킵니다.
동시에 컴퓨터 비전은 그 어느 때보다 접근성이 높아졌습니다. YOLO12는 Ultralytics Python 패키지를 통해 사용하기 쉬우며 속도보다 정확성에 중점을 두어 정밀도가 중요한 의료 영상, 산업 검사 및 로봇 공학에 적합합니다.
AI에 대해 더 알고 싶으신가요? GitHub 저장소를 방문하여 커뮤니티에 참여하세요. 솔루션 페이지에서 자율 주행차의 AI 및 농업의 컴퓨터 비전과 같은 분야의 혁신을 살펴보세요. 라이선스 옵션을 확인하고 Vision AI 프로젝트를 실현해 보세요. 🚀