Yolo 비전 선전
선전
지금 참여하기
용어집

객체 감지

이미지나 동영상에서 물체를 식별하고 위치를 파악하는 YOLO 같은 최첨단 모델을 통해 물체 감지의 강력한 기능을 알아보세요. 실제 활용 사례를 살펴보세요!

객체 감지는 소프트웨어를 가능하게 하는 컴퓨터 비전(CV)의 핵심 기능으로, 소프트웨어 시스템이 이미지가 무엇을 나타내는지 인식할 뿐만 아니라 이미지 내에서 특정 항목의 인스턴스를 찾을 수 있게 해주는 중요한 기능입니다. 표준 분류는 표준 분류는 전체 시각적 입력에 단일 레이블을 할당하는 반면, 객체 감지는 경계선을 예측하여 보다 세분화된 보다 세분화된 이해를 제공합니다. 특정 클래스 레이블과 함께 식별된 엔티티 주변의 경계 상자를 예측하여 보다 세밀한 이해를 제공합니다. 신뢰도 점수를 제공합니다. 이 기술은 감각적인 고급 인공 지능(AI)의 감각적 기반 역할을 하며 기계가 물리적 세계의 복잡성을 인식하고 해석하며 상호 작용할 수 있게 해줍니다. 자동화된 품질 관리부터 공장의 자동화된 품질 관리부터 첨단 감시까지, 이 기술은 비정형 픽셀 데이터를 실행 가능한 인사이트로 변환합니다.

물체 감지의 메커니즘

최신 탐지기는 주로 딥 러닝(DL) 아키텍처, 특히 컨볼루션 신경망(CNN)을 사용하여 특징의 공간 계층 구조를 학습합니다. 일반적인 아키텍처는 다음과 같이 구성됩니다. 입력 이미지에서 필수적인 시각적 특징을 추출하는 입력 이미지에서 필수적인 시각적 특징을 추출합니다. 그런 다음 이러한 특징은 감지 헤드에 의해 처리됩니다. 바운딩 박스의 좌표와 클래스 멤버십 확률을 출력합니다.

고성능을 달성하기 위해 모델은 다음과 같은 대규모 라벨이 지정된 컬렉션에 대해 훈련됩니다. COCO 데이터 세트와 같은 대규모 레이블 컬렉션을 기반으로 모델을 학습시킵니다. 추론하는 동안 알고리즘은 종종 동일한 객체에 대해 겹치는 상자를 여러 개 생성합니다. 다음과 같은 기법이 사용됩니다. 비최대 억제(NMS) 와 같은 기술은 를 적용하여 이러한 중복을 필터링하여 신뢰도가 가장 높고 가장 좋은 상자만 유지합니다. 가장 신뢰도가 높은 상자만 유지합니다. 기준 진실.

모델은 일반적으로 두 가지 유형으로 분류됩니다:

  • 2단계 물체 감지기: Faster R-CNN과 같은 시스템은 먼저 관심 영역을 제안한 다음 이를 classify . 역사적으로 정확하지만 계산 비용이 많이 들 수 있습니다.
  • 1단계 물체 감지기: 다음을 포함한 최신 아키텍처 Ultralytics YOLO11, 를 포함한 최신 아키텍처는 한 번의 패스로 바운딩 박스와 클래스 확률을 예측합니다. 이 접근 방식은 다음과 같은 경우에 최적화되어 있습니다. 실시간 추론에 최적화되어 있어 속도와 정확성의 균형을 제공합니다. 앞으로 Ultralytics 현재 개발 중인 엔드투엔드 탐지 기능을 더욱 세분화하여 효율성을 더욱 개선하는 것을 목표로 하고 있습니다.

관련 이력서 작업과 구별

객체 감지를 유사한 컴퓨터 비전 작업과 구별하는 것이 중요합니다. 컴퓨터 비전 작업과 구별하는 것이 중요합니다.

  • 이미지 분류: 이미지에 무엇이 있는지(예: '개')는 식별하지만 이미지의 위치나 개수는 식별하지 않습니다.
  • 인스턴스 세분화: 감지와 마찬가지로 객체의 위치를 찾지만, 상자 대신 객체의 정확한 모양을 나타내는 픽셀 단위의 픽셀 단위의 완벽한 마스크를 생성합니다.
  • 개체 추적: 이것은 탐지 기능을 감지 기능을 시간적 영역으로 확장하여 감지된 오브젝트에 고유 ID를 할당하고 궤적을 추적합니다.

실제 애플리케이션

물체 감지는 다양한 산업 분야에서 혁신적인 기술을 구현하는 엔진입니다.

  • 자율 시스템: 자동차 산업에서 자율 주행 차량은 감지 모델을 활용하여 을 활용하여 보행자, 교통 표지판, 다른 차량을 수 밀리초 내에 식별합니다. 이 분야의 선두주자인 웨이모와 테슬라 오토파일럿과 같은 업계 리더들은 이러한 기능을 사용하여 복잡한 환경을 안전하게 탐색합니다.
  • 의료 진단: In 의료 AI, 탐지 모델은 종양이나 골절과 같은 X-레이 또는 CT 스캔에서 관심 영역을 강조 표시하여 방사선과 의사를 지원합니다. 조직 의료 이미지 분석이 어떻게 의료 이미지 분석으로 진단 오류를 줄이는 방법을 적극적으로 연구하고 있습니다.
  • 리테일 분석: 매장 활용 AI를 활용하여 결제 프로세스를 자동화하고 재고를 모니터링합니다. Amazon Go와 유사한 시스템에서는 감지 기능을 사용하여 고객이 진열대에서 어떤 상품을 선택하는지 track .

구현 예시

다음 코드 스니펫은 사전 학습된 YOLO11 모델을 사용하여 객체 감지를 수행하는 방법을 보여줍니다. ultralytics 패키지를 사용합니다. 이 간단한 워크플로에서는 모델을 로드하고 이미지에 대한 추론을 실행하여 객체를 식별합니다.

from ultralytics import YOLO

# Load a pretrained YOLO11 model (n-scale for speed)
model = YOLO("yolo11n.pt")

# Run inference on a remote image source
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results with bounding boxes and labels
results[0].show()

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기