YOLO12 설명: 실제 애플리케이션 및 활용 사례
최신 컴퓨터 비전 모델인 YOLO12를 만나보세요! 어텐션 중심 아키텍처와 FlashAttention 기술이 어떻게 산업 전반의 객체 탐지 작업을 향상시키는지 배워보세요.

컴퓨터 비전은 기계가 이미지와 영상을 이해하도록 돕는 인공지능(AI)의 한 분야입니다. 이 분야는 AI 연구자와 개발자들이 끊임없이 한계를 돌파하고 있어 놀라운 속도로 발전하고 있습니다. AI 커뮤니티는 항상 더 빠르고, 더 스마트하며, 더 효율적인 모델을 만드는 것을 목표로 합니다. 가장 최근의 획기적인 성과 중 하나는 2025년 2월 18일에 출시된 YOLO(You Only Look Once) 모델 시리즈의 최신 제품인 YOLO12입니다.
YOLO12는 뉴욕 주립대학교(SUNY) 버팔로 캠퍼스와 중국 과학원 대학교 연구진에 의해 개발되었습니다. 독특한 새로운 접근 방식을 취하는 YOLO12는 어텐션 메커니즘을 도입하여 모델이 모든 것을 동일하게 처리하는 대신 이미지의 가장 중요한 부분에 집중할 수 있게 합니다.
또한 YOLO12는 더 적은 메모리를 사용하면서 처리 속도를 높이는 FlashAttention 기술과, 인간이 중앙의 객체에 자연스럽게 집중하는 방식을 모방하도록 설계된 영역 어텐션(area attention) 메커니즘을 탑재하고 있습니다.
이러한 개선을 통해 YOLO12n은 YOLOv10n보다 정확도가 2.1% 향상되었고, YOLO12m은 YOLO11m보다 정확도가 1.0% 향상되었습니다. 그러나 여기에는 상충 관계(tradeoff)가 있는데, YOLO12n은 YOLOv10n보다 9% 느리고 YOLO12m은 YOLO11m보다 3% 느립니다.

그림 1. YOLO12를 사용하여 객체를 탐지하는 예시.
본 글에서는 YOLO12가 무엇이 다른지, 이전 버전들과 어떻게 비교되는지, 그리고 어디에 적용될 수 있는지 살펴보겠습니다.
Link to this sectionYOLO12 출시까지의 여정#
YOLO 모델 시리즈는 실시간 객체 탐지를 위해 설계된 컴퓨터 비전 모델 모음으로, 이미지와 영상 내의 객체를 빠르게 식별하고 위치를 파악할 수 있습니다. 시간이 흐름에 따라 각 버전은 속도, 정확도 및 효율성 측면에서 개선되어 왔습니다.
예를 들어, 2020년에 출시된 Ultralytics YOLOv5는 빠르고 커스텀 학습 및 배포가 쉬워 널리 사용되었습니다. 이후 Ultralytics YOLOv8은 인스턴스 세그멘테이션 및 객체 추적과 같은 컴퓨터 비전 작업에 대한 추가 지원을 제공함으로써 이를 개선했습니다.
최근에는 Ultralytics YOLO11이 속도와 정확도 사이의 균형을 유지하면서 실시간 처리를 향상시키는 데 집중했습니다. 예를 들어, YOLO11m은 YOLOv8m보다 파라미터 수가 22% 적으면서도, 객체 탐지 모델 평가를 위한 널리 사용되는 벤치마크인 COCO 데이터셋에서 더 나은 탐지 성능을 보여주었습니다.
이러한 발전을 기반으로 YOLO12는 시각 정보를 처리하는 방식에 변화를 가져왔습니다. 이미지의 모든 부분을 동일하게 처리하는 대신, 가장 관련성이 높은 영역에 우선순위를 두어 탐지 정확도를 향상시킵니다. 간단히 말해, YOLO12는 이전의 개선 사항들을 토대로 더 정밀해지는 것을 목표로 합니다.
Link to this sectionYOLO12의 주요 기능#
YOLO12는 실시간 처리 속도를 유지하면서 컴퓨터 비전 작업을 향상시키는 몇 가지 개선 사항을 도입했습니다. 다음은 YOLO12의 주요 기능에 대한 개요입니다:
- 어텐션 중심 아키텍처: YOLO12는 이미지의 모든 부분을 동일하게 처리하는 대신 가장 중요한 영역에 집중합니다. 이는 정확도를 높이고 불필요한 처리를 줄여, 복잡한 이미지에서도 탐지를 더 선명하고 효율적으로 만듭니다.
- FlashAttention: YOLO12는 메모리 사용량을 줄이면서 이미지 분석 속도를 높입니다. 메모리 효율적인 알고리즘인 FlashAttention을 통해 데이터 처리를 최적화하여 하드웨어 부담을 줄이고 실시간 작업을 더 매끄럽고 안정적으로 만듭니다.
- R-ELAN (Residual Efficient Layer Aggregation Networks): YOLO12는 R-ELAN을 사용하여 레이어를 더 효율적으로 구성하며, 이는 모델이 데이터를 처리하고 학습하는 방식을 개선합니다. 이를 통해 학습이 더 안정적이고, 객체 인식이 더 선명해지며, 컴퓨팅 요구 사항이 낮아져 다양한 환경에서 효율적으로 실행됩니다.
이러한 기능들이 실생활에서 어떻게 작동하는지 이해하기 위해 쇼핑몰을 예로 들어보겠습니다. YOLO12는 쇼핑객을 추적하고, 화분이나 홍보용 간판과 같은 매장 장식을 식별하며, 잘못 놓여 있거나 방치된 물건을 발견하는 데 도움을 줄 수 있습니다.
어텐션 중심 아키텍처는 가장 중요한 세부 사항에 집중하도록 돕고, FlashAttention은 시스템 과부하 없이 모든 것을 빠르게 처리하도록 보장합니다. 이를 통해 쇼핑몰 운영자는 보안을 강화하고, 매장 배치를 최적화하며, 전반적인 쇼핑 경험을 향상시킬 수 있습니다.

그림 2. YOLO12를 사용하여 쇼핑몰 내 객체 탐지.
그러나 YOLO12에는 고려해야 할 몇 가지 제한 사항도 있습니다:
- 학습 시간 증가: 아키텍처 특성상 YOLO12는 YOLO11에 비해 더 긴 학습 시간이 필요합니다.
- 내보내기 문제: 일부 사용자는 특정 배포 환경에 YOLO12 모델을 통합할 때 내보내기에 어려움을 겪을 수 있습니다.
Link to this sectionYOLO12 성능 벤치마크 이해하기#
YOLO12는 다양한 요구 사항에 최적화된 여러 버전으로 제공됩니다. 더 작은 버전(nano 및 small)은 속도와 효율성을 우선시하여 모바일 기기 및 엣지 컴퓨팅에 이상적입니다. 미디엄 및 라지 버전은 속도와 정확도 간의 균형을 맞추며, YOLO12x(extra large)는 산업 자동화, 의료 영상, 첨단 감시 시스템과 같은 고정밀 애플리케이션을 위해 설계되었습니다.
이러한 다양성을 통해 YOLO12는 모델 크기에 따라 다른 수준의 성능을 제공합니다. 벤치마크 테스트에 따르면 특정 YOLO12 버전은 정확도 면에서 YOLOv10 및 YOLO11을 능가하며 더 높은 mAP(mean average precision)를 달성합니다.
하지만 YOLO12m, YOLO12l, YOLO12x와 같은 일부 모델은 YOLO11보다 이미지를 느리게 처리하며, 이는 탐지 정확도와 속도 간의 상충 관계를 보여줍니다. 그럼에도 불구하고 YOLO12는 다른 많은 모델보다 적은 파라미터를 필요로 하여 여전히 효율적이지만, YOLO11보다는 더 많이 사용합니다. 이는 순수한 속도보다 정확도가 더 중요한 애플리케이션에 훌륭한 선택입니다.

그림 3. Ultralytics YOLO11과 YOLO12 비교.
Link to this sectionUltralytics Python 패키지를 통한 YOLO12 사용#
YOLO12는 Ultralytics Python 패키지에서 지원하며 사용하기 쉬워 초보자와 전문가 모두가 접근할 수 있습니다. 단 몇 줄의 코드로 사용자는 사전 학습된 모델을 로드하고, 이미지와 영상에 대해 다양한 컴퓨터 비전 작업을 수행하며, 커스텀 데이터셋으로 YOLO12를 학습시킬 수 있습니다. Ultralytics Python 패키지는 복잡한 설정 단계 없이 프로세스를 간소화합니다.
예를 들어, 객체 탐지에 YOLO12를 사용하기 위한 단계는 다음과 같습니다:
- Ultralytics 패키지 설치: 우선 YOLO12를 효율적으로 실행하는 데 필요한 도구를 제공하는 Ultralytics Python 패키지를 설치합니다. 이는 모든 종속성이 올바르게 설정되도록 보장합니다.
- 사전 학습된 YOLO12 모델 로드: 작업에 필요한 정확도와 속도 수준에 따라 적절한 YOLO12 버전(nano, small, medium, large 또는 extra large)을 선택합니다.
- 이미지 또는 영상 제공: 분석하려는 이미지 또는 영상 파일을 입력합니다. YOLO12는 실시간 탐지를 위해 라이브 영상 피드도 처리할 수 있습니다.
- 탐지 프로세스 실행: 모델이 시각 데이터를 스캔하고, 객체를 식별하며, 그 주위에 BBox를 배치합니다. 각 탐지된 객체에 대해 예측된 클래스와 신뢰도 점수를 라벨링합니다.
- 탐지 설정 조정: 신뢰도 임계값과 같은 파라미터를 수정하여 탐지 정확도와 성능을 미세 조정할 수 있습니다.
- 결과물 저장 또는 활용: 탐지된 객체가 포함된 처리된 이미지나 영상은 추가 분석, 자동화 또는 의사 결정을 위해 저장하거나 애플리케이션에 통합할 수 있습니다.
이러한 단계들을 통해 YOLO12는 감시 및 매장 추적부터 의료 영상, 자율 주행 차량까지 다양한 애플리케이션에 쉽게 사용할 수 있습니다.
Link to this section실무에서의 YOLO12 적용#
YOLO12는 객체 탐지, 인스턴스 세그멘테이션, 이미지 분류, 포즈 추정 및 방향성 객체 탐지(OBB)에 대한 지원 덕분에 다양한 실제 애플리케이션에서 사용될 수 있습니다.

그림 4. YOLO12는 객체 탐지 및 인스턴스 세그멘테이션과 같은 작업을 지원합니다.
하지만 앞서 논의했듯이 YOLO12 모델은 속도보다 정확도를 우선시하므로 이전 버전에 비해 이미지를 처리하는 데 약간 더 오래 걸립니다. 이러한 상충 관계 때문에 YOLO12는 다음과 같이 실시간 속도보다 정밀도가 중요한 애플리케이션에 이상적입니다:
- 의료 영상: YOLO12는 X-레이나 MRI에서 종양이나 이상 징후를 높은 정확도로 탐지하도록 커스텀 학습될 수 있으며, 진단을 위해 정밀한 영상 분석이 필요한 의사 및 방사선 전문의에게 유용한 도구가 됩니다.
- 제조 품질 관리: 생산 공정 중에 제품 결함을 식별하여 고품질 제품만 시장에 출시되도록 보장하고, 낭비를 줄이며 효율성을 향상시킬 수 있습니다.
- 법의학 분석: 법 집행 기관은 YOLO12를 미세 조정하여 감시 영상을 분석하고 증거를 수집할 수 있습니다. 범죄 수사에서 정밀함은 핵심 세부 정보를 파악하는 데 필수적입니다.
- 정밀 농업: 농부는 YOLO12를 사용하여 작물 건강을 분석하고, 질병이나 해충 침입을 탐지하며, 토양 상태를 모니터링할 수 있습니다. 정확한 평가는 농업 전략을 최적화하여 수확량과 자원 관리를 개선하는 데 도움이 됩니다.
Link to this sectionYOLO12 시작하기#
YOLO12를 실행하기 전에 시스템이 필수 요구 사항을 충족하는지 확인하는 것이 중요합니다.
기술적으로 YOLO12는 모든 전용 GPU (Graphics Processing Unit)에서 실행될 수 있습니다. 기본적으로 FlashAttention은 필수가 아니므로, 대부분의 GPU 시스템에서 문제없이 작동합니다. 하지만 FlashAttention을 활성화하면 대규모 데이터셋이나 고해상도 이미지를 다룰 때 속도 저하를 방지하고 메모리 사용량을 줄이며 처리 효율성을 높이는 데 특히 유용할 수 있습니다.
FlashAttention을 사용하려면 Turing(T4, Quadro RTX), Ampere(RTX 30 시리즈, A30, A40, A100), Ada Lovelace(RTX 40 시리즈) 또는 Hopper(H100, H200) 시리즈 중 하나인 NVIDIA GPU가 필요합니다.
사용 편의성과 접근성을 고려하여, Ultralytics Python 패키지는 아직 FlashAttention 추론을 지원하지 않는데, 이는 설치 과정이 기술적으로 매우 복잡할 수 있기 때문입니다. YOLO12 시작하기와 성능 최적화에 대해 더 알아보려면 공식 Ultralytics 문서를 확인하십시오.
Link to this section핵심 요약#
컴퓨터 비전이 발전함에 따라 모델들은 더 정밀하고 효율적으로 변하고 있습니다. YOLO12는 어텐션 중심 처리 및 FlashAttention으로 객체 탐지, 인스턴스 세그멘테이션, 이미지 분류와 같은 컴퓨터 비전 작업을 개선하여 정확도를 높이면서 메모리 사용을 최적화합니다.
동시에 컴퓨터 비전은 그 어느 때보다 접근하기 쉬워졌습니다. YOLO12는 Ultralytics Python 패키지를 통해 사용하기 쉬우며, 속도보다 정확도에 중점을 두어 의료 영상, 산업 검사 및 로봇 공학 - 즉 정밀함이 핵심인 애플리케이션에 매우 적합합니다.
AI에 대해 궁금하십니까? GitHub 저장소를 방문하여 커뮤니티와 소통하십시오. 자율 주행차의 AI 및 농업 분야의 컴퓨터 비전과 같은 부문의 혁신을 솔루션 페이지에서 살펴보십시오. 라이선스 옵션을 확인하고 귀하의 비전 AI 프로젝트를 현실로 만들어 보십시오. 🚀






