YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics YOLO

객체 탐지 및 Ultralytics의 YOLO 모델의 진화

객체 탐지의 발전을 되돌아보겠습니다. 지난 몇 년간 YOLO 모델이 어떻게 발전해 왔는지에 집중할 것입니다.

ABAbirami Vina
4 min read
객체 탐지 및 YOLO 모델의 진화

컴퓨터 비전은 기계가 인간이 실제 세계를 인식하는 것과 유사하게 이미지와 비디오를 보고 이해하도록 가르치는 데 중점을 둔 인공지능(AI)의 하위 분야입니다. 인간에게 객체 인식이나 동작 식별은 본능적인 능력이지만, 기계의 경우 이러한 작업에는 구체적이고 전문적인 컴퓨터 비전 기술이 필요합니다. 예를 들어, 컴퓨터 비전의 핵심 작업 중 하나는 이미지나 비디오 내에서 객체를 식별하고 위치를 파악하는 객체 탐지입니다.

Since the 1960s, researchers have been working on improving how computers can detect objects. Early methods, like template matching, involved sliding a predefined template across an image to find matches. While innovative, these approaches struggled with changes in object size, orientation, and lighting. Today, we have advanced models like Ultralytics YOLO11 that can detect even small and partially hidden objects, known as occluded objects, with impressive accuracy.

컴퓨터 비전이 계속 발전함에 따라 이러한 기술이 어떻게 개발되어 왔는지 되돌아보는 것은 중요합니다. 이 기사에서는 객체 탐지의 진화 과정을 살펴보고 YOLO (You Only Look Once) 모델의 변화를 조명해 보겠습니다. 시작해 볼까요?

Link to this section컴퓨터 비전의 기원#

객체 탐지에 대해 알아보기 전에 컴퓨터 비전이 어떻게 시작되었는지 살펴보겠습니다. 컴퓨터 비전의 기원은 과학자들이 뇌의 시각 정보 처리 방식을 탐구하기 시작한 1950년대 후반과 1960년대 초반으로 거슬러 올라갑니다. 고양이를 이용한 실험에서 연구자 David Hubel과 Torsten Wiesel은 뇌가 가장자리나 선과 같은 단순한 패턴에 반응한다는 사실을 발견했습니다. 이는 시각 시스템이 복잡한 패턴으로 넘어가기 전에 가장자리와 같은 이미지의 기본 특징을 감지하고 인식한다는 개념인 특징 추출 아이디어의 토대가 되었습니다.

컴퓨터 비전의 특징 추출에 영감을 준 고양이 뇌 실험

그림 1. 고양이의 뇌가 빛 막대에 어떻게 반응하는지 학습하는 것은 컴퓨터 비전의 특징 추출을 발전시키는 데 기여했습니다.

거의 같은 시기에 물리적 이미지를 디지털 형식으로 변환할 수 있는 새로운 기술이 등장하면서, 기계가 어떻게 시각 정보를 처리할 수 있을지에 대한 관심이 촉발되었습니다. 1966년 매사추세츠 공과대학교(MIT)의 Summer Vision Project는 이를 더욱 발전시켰습니다. 프로젝트가 완전히 성공한 것은 아니었지만, 이미지에서 전경과 배경을 분리할 수 있는 시스템을 만드는 것을 목표로 했습니다. 비전 AI 커뮤니티의 많은 사람들에게 이 프로젝트는 과학 분야로서의 컴퓨터 비전이 공식적으로 시작된 지점으로 여겨집니다.

Link to this section객체 탐지의 역사 이해하기#

1990년대 후반과 2000년대 초반에 컴퓨터 비전이 발전함에 따라 객체 탐지 방법은 템플릿 매칭과 같은 기본 기술에서 더 발전된 접근 방식으로 전환되었습니다. 널리 사용된 방법 중 하나는 얼굴 탐지와 같은 작업에 폭넓게 쓰인 Haar Cascade였습니다. 이는 슬라이딩 윈도우로 이미지를 스캔하여 이미지의 각 섹션에서 가장자리나 텍스처와 같은 특정 특징을 확인한 다음, 이러한 특징을 결합하여 얼굴과 같은 객체를 탐지하는 방식으로 작동했습니다. Haar Cascade는 이전 방법들보다 훨씬 빨랐습니다.

얼굴 감지를 위한 Haar Cascade 사용

그림 2. 얼굴 탐지를 위한 Haar Cascade 사용.

이와 함께 HOG(Histogram of Oriented Gradients) 및 SVM(Support Vector Machines)과 같은 방법도 도입되었습니다. HOG는 슬라이딩 윈도우 기법을 사용하여 이미지의 작은 섹션 내에서 빛과 그림자가 어떻게 변하는지 분석함으로써 모양을 기반으로 객체를 식별하도록 도왔습니다. 이어 SVM은 이러한 특징들을 분류하여 객체의 정체를 결정했습니다. 이러한 방법들은 정확도를 향상시켰지만, 실제 환경에서는 여전히 어려움을 겪었으며 오늘날의 기술에 비해 속도가 느렸습니다.

Link to this section실시간 객체 탐지의 필요성#

2010년대에 딥러닝CNN(Convolutional Neural Networks)의 부상은 객체 탐지 분야에 큰 변화를 가져왔습니다. CNN을 통해 컴퓨터는 방대한 양의 데이터로부터 중요한 특징을 자동으로 학습할 수 있게 되었으며, 이로 인해 탐지 정확도가 크게 향상되었습니다.

R-CNN(Region-based Convolutional Neural Networks)과 같은 초기 모델은 정밀도 측면에서 큰 발전을 이루어 이전 방법들보다 더 정확하게 객체를 식별할 수 있게 되었습니다.

하지만 이러한 모델들은 이미지를 여러 단계로 처리하기 때문에 속도가 느려 자율주행 자동차비디오 감시와 같은 실시간 응용 분야에 적용하기에는 비실용적이었습니다.

속도 향상에 초점을 맞추어 더 효율적인 모델들이 개발되었습니다. Fast R-CNN 및 Faster R-CNN과 같은 모델은 관심 영역을 선택하는 방식을 개선하고 탐지에 필요한 단계 수를 줄임으로써 효율성을 높였습니다. 이로 인해 객체 탐지 속도는 빨라졌으나, 여전히 즉각적인 결과가 필요한 많은 실제 응용 프로그램을 충족하기에는 부족했습니다. 실시간 탐지에 대한 수요 증가는 속도와 정확도 간의 균형을 맞출 수 있는 훨씬 빠르고 효율적인 솔루션의 개발을 촉진했습니다.

R-CNN, Fast R-CNN 및 Faster R-CNN의 속도 비교

그림 3. R-CNN, Fast R-CNN 및 Faster R-CNN 속도 비교.

Link to this sectionYOLO (You Only Look Once) 모델: 주요 이정표#

YOLO is an object detection model that redefined computer vision by enabling real-time detection of multiple objects in images and videos, rendering it quite unique from previous detection methods. Instead of analyzing each detected object individually, YOLO’s architecture treats object detection as a single task, predicting both the location and class of objects in one go using CNNs.

이 모델은 이미지를 그리드로 나누어 작동하며, 각 부분은 해당 영역 내의 객체를 감지하는 역할을 합니다. 각 섹션에 대해 여러 번의 예측을 수행한 뒤 신뢰도가 낮은 결과를 필터링하여 정확한 결과만 남깁니다.

YOLO 작동 방식 개요

그림 4. YOLO 작동 방식 개요.

컴퓨터 비전 애플리케이션에 YOLO가 도입되면서 이전 모델보다 훨씬 더 빠르고 효율적으로 객체 감지가 가능해졌습니다. 속도와 정확도 덕분에 YOLO는 제조, 의료, 로봇 공학과 같은 산업 분야의 실시간 솔루션을 위한 인기 있는 선택지가 되었습니다.

또 하나 주목할 중요한 점은 YOLO가 오픈 소스였기 때문에 개발자와 연구자들이 지속적으로 개선할 수 있었고, 이로 인해 훨씬 더 발전된 버전들이 탄생했다는 것입니다.

Link to this sectionYOLO에서 YOLO11로의 여정#

YOLO 모델은 각 버전의 발전을 기반으로 시간이 지남에 따라 꾸준히 향상되어 왔습니다. 성능 향상과 더불어 이러한 개선 사항들은 다양한 수준의 기술적 경험을 가진 사람들이 모델을 더 쉽게 사용할 수 있도록 만들었습니다.

예를 들어, Ultralytics YOLOv5가 도입되었을 때 모델 배포PyTorch를 통해 더 간단해졌으며, 이를 통해 더 많은 사용자가 고급 AI를 활용할 수 있게 되었습니다. 이는 정확도와 사용 편의성을 동시에 제공하여 전문적인 코딩 지식이 없더라도 더 많은 사람이 객체 감지를 구현할 수 있도록 지원했습니다.

YOLO 모델의 진화

그림 5. YOLO 모델의 발전.

Ultralytics YOLOv8은 인스턴스 세그멘테이션과 같은 작업에 대한 지원을 추가하고 모델의 유연성을 높임으로써 이러한 발전을 이어갔습니다. 기본 작업부터 복잡한 작업까지 YOLO를 사용하기가 더 쉬워졌으며, 다양한 시나리오에서 유용하게 활용될 수 있게 되었습니다.

최신 모델인 Ultralytics YOLO11을 통해 추가적인 최적화가 이루어졌습니다. 매개변수 수를 줄이면서 정확도를 높였기 때문에 실시간 작업에 더 효율적입니다. 숙련된 개발자이든 AI 초보자이든, YOLO11은 쉽게 접근할 수 있는 고급 객체 탐지 접근 방식을 제공합니다.

Link to this sectionYOLO11 알아보기: 새로운 기능 및 개선 사항#

Ultralytics의 연례 하이브리드 이벤트인 YOLO Vision 2024 (YV24)에서 출시된 YOLO11은 YOLOv8과 동일한 컴퓨터 비전 작업, 즉 객체 탐지, 인스턴스 세그멘테이션, 이미지 분류 및 자세 추정(pose estimation)을 지원합니다. 따라서 사용자는 워크플로를 수정할 필요 없이 이 새로운 모델로 쉽게 전환할 수 있습니다. 또한 YOLO11의 업그레이드된 아키텍처는 예측의 정밀도를 더욱 높였습니다. 실제로 YOLO11m은 YOLOv8m보다 22% 적은 매개변수로 COCO 데이터셋에서 더 높은 평균 정밀도(mAP)를 달성합니다.

YOLO11은 또한 스마트폰과 기타 엣지 디바이스부터 강력한 클라우드 시스템에 이르기까지 다양한 플랫폼에서 효율적으로 실행되도록 설계되었습니다. 이러한 유연성은 실시간 애플리케이션을 위해 다양한 하드웨어 설정 전반에서 원활한 성능을 보장합니다. 또한 YOLO11은 더 빠르고 효율적이어서 컴퓨팅 비용을 절감하고 추론 시간을 단축합니다. Ultralytics Python 패키지를 사용하든 노코드 Ultralytics HUB를 사용하든 기존 워크플로우에 YOLO11을 쉽게 통합할 수 있습니다.

Link to this sectionYOLO 모델과 객체 탐지의 미래#

고급 객체 탐지가 실시간 애플리케이션 및 엣지 AI에 미치는 영향은 이미 산업 전반에서 체감되고 있습니다. 석유 및 가스, 의료, 소매와 같은 분야가 점점 더 AI에 의존함에 따라 빠르고 정확한 객체 탐지에 대한 수요는 계속 증가하고 있습니다. YOLO11은 제한된 컴퓨팅 성능을 가진 장치에서도 고성능 탐지를 가능하게 함으로써 이러한 요구에 부응하고자 합니다.

엣지 AI가 성장함에 따라 YOLO11과 같은 객체 탐지 모델은 속도와 정확도가 중요한 환경에서 실시간 의사 결정을 위한 필수 요소가 될 것입니다. 설계와 적응성 측면에서의 지속적인 개선을 통해 객체 탐지의 미래는 다양한 애플리케이션 전반에 걸쳐 더 많은 혁신을 가져올 것으로 보입니다.

Link to this section핵심 요약#

객체 탐지는 단순한 방법에서 오늘날 우리가 보는 고급 딥러닝 기술로 진화하며 먼 길을 걸어왔습니다. YOLO 모델은 이러한 발전의 중심에서 다양한 산업 전반에 걸쳐 더 빠르고 정확한 실시간 탐지를 제공해 왔습니다. YOLO11은 이러한 유산을 계승하여 효율성을 개선하고 계산 비용을 절감하며 정확도를 향상시킴으로써 다양한 실시간 애플리케이션을 위한 신뢰할 수 있는 선택지가 되었습니다. AI와 컴퓨터 비전의 지속적인 발전으로 객체 탐지의 미래는 밝아 보이며, 속도, 정밀도, 적응성 측면에서 더 많은 개선의 여지가 남아 있습니다.

AI에 대해 궁금하신가요? 저희 커뮤니티에 가입하여 계속 학습하세요! GitHub 저장소를 확인하여 저희가 제조의료와 같은 산업에서 AI를 사용하여 혁신적인 솔루션을 만드는 방법을 알아보세요. 🚀

Explore solutions

Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.