Yolo 비전 선전
선전
지금 참여하기
용어집

컴퓨터 비전(CV)

컴퓨터 비전(CV)의 기초를 탐구하세요. Ultralytics Ultralytics 어떻게 객체 탐지, 분할 등을 가능하게 하는지 알아보세요.

컴퓨터 비전(CV)은 인공 지능(AI) 의 정교한 분야로, 컴퓨터와 시스템이 디지털 이미지, 동영상 및 기타 시각적 입력에서 의미 있는 정보를 도출할 수 있게 합니다. 인간 시각은 주변 환경을 즉각적으로 인지하고 이해하는 선천적 능력을 지니지만, 컴퓨터는 패턴을 인식하고 픽셀을 해석하도록 훈련되어야 합니다. 머신 러닝(ML), 특히 딥 러닝(DL) 알고리즘을 활용함으로써 CV 시스템은 시각적 데이터를 수집하고 처리하여 해당 정보를 바탕으로 권장 사항을 제시하거나 조치를 취할 수 있습니다.

컴퓨터 비전 작동 방식

컴퓨터는 본질적으로 이미지를 픽셀을 나타내는 수치 값의 배열로 인식합니다. 현대 컴퓨터 비전은 인간의 뇌 신경세포 연결 패턴을 모방하도록 설계된 컨볼루션 신경망(CNN)에 크게 의존합니다. 이러한 신경망은 특징 추출이라는 과정을 통해 단순한 경계선과 질감부터 복잡한 형태와 사물에 이르기까지 계층적 특징을 식별하는 법을 학습합니다.

이러한 모델이 효과적으로 작동하려면 방대한 양의 훈련 데이터가 필요합니다. 예를 들어 자동차를 인식하려면 모델이 다양한 조건의 자동차로 구성된 수천 장의 라벨링된 이미지를 처리해야 합니다. Ultralytics 같은 도구는 이러한 워크플로를 간소화하여 사용자가 데이터셋에 주석을 달고, 클라우드에서 모델을 훈련시키며, 효율적으로 배포할 수 있도록 합니다.

컴퓨터 비전의 핵심 작업

컴퓨터 비전은 단일 기능이 아니라 각각 특정 문제를 해결하는 서로 다른 작업들의 집합체입니다:

  • 이미지 분류: 이 작업은 전체 이미지에 클래스 레이블을 할당하여 "이 사진에 무엇이 있나요?"라는 질문에 답합니다(예: 고양이와 개를 구분하는 것).
  • 물체 탐지: 한 단계 더 나아가, 탐지 기술은 이미지 내 개별 물체를 식별하고 그 주위에 경계 상자를 그립니다. 이는 물체 계수나 특정 특징 위치 파악에 필수적입니다.
  • 인스턴스 분할: 이는 검출된 각 객체에 대해 정밀한 픽셀 단위 마스크를 제공하여 동일 클래스의 개별 인스턴스를 분리합니다. 의료 영상 분석과 같이 높은 정밀도가 요구되는 응용 분야에 필수적입니다.
  • 자세 추정: 이는 물체 상의 특정 키포인트(예: 인체의 관절)를 탐지하여 track 자세를 track 포함합니다.

실제 애플리케이션

컴퓨터 비전의 유용성은 사실상 모든 산업 분야에 걸쳐 있으며, 이전에는 인간의 눈이 필요했던 작업을 자동화합니다.

  • 제조 및 품질 관리: 산업 환경에서 컴퓨터 비전은 흔히 머신 비전으로 불립니다. 이는 조립 라인에서 제품의 미세한 결함을 인간 검사원보다 더 빠르고 정확하게 탐지하여 품질 검사를 자동화하는 데 사용됩니다. 예를 들어, 제조 분야의 인공지능은 장비의 실시간 모니터링을 통해 고장을 예방할 수 있게 합니다.
  • 자율주행 기술: 자율주행 차량은 안전한 주행을 위해 컴퓨터 비전(CV)에 전적으로 의존합니다. 카메라와 라이다 센서에서 입력된 데이터를 처리함으로써, 이 차량들은 실시간으로 보행자, 다른 차량 및 교통 표지판을 식별하기 위한 3D 객체 감지 기능을 수행합니다. 이는 높은 수준의 차량 자동화를 달성하는 데 있어 핵심적인 요소입니다.
  • 의료 및 진단: 방사선 전문의는 CV를 활용해 X선, MRI, CT 스캔에서 이상 징후를 식별하는 데 도움을 받습니다. 의료 AI는 육안으로 놓칠 수 있는 관심 영역을 강조함으로써 종양 식별과 같은 조기 질병 발견에 기여합니다.

컴퓨터 비전 vs. 이미지 처리

CV와 이미지 처리의 차이를 구분하는 것이 중요하지만, 이들은 종종 함께 작동합니다.

  • 이미지 처리란 이미지를 조작하여 향상시키거나 정보를 추출하는 과정입니다(예: 밝기, 대비 조정 또는 Adobe Photoshop과 같은 필터 적용). 출력은 일반적으로 또 다른 이미지입니다.
  • 컴퓨터 비전은 이미지를 입력으로 받아 정보나 해석(예: "이 방에 세 사람이 있습니다")을 출력합니다. 컴퓨터 비전은 신경망 분석을 위해 이미지를 준비하기 위해 이미지 처리 기술을 사용합니다.

Python으로 컴퓨터 비전 구현하기

현대 라이브러리는 강력한 CV 모델 구현을 손쉽게 접근 가능하게 만들었습니다. 아래 예시는 최첨단 모델을 로드하는 방법을 보여줍니다. YOLO26 이미지 내 detect 모델 사용하여 ultralytics 패키지입니다.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with bounding boxes
results[0].show()

이 간단한 스크립트는 사전 훈련된 모델을 활용하여 복잡한 추론 작업을 수행함으로써 현대 AI 도구의 접근성을 보여줍니다. 정적 이미지를 넘어선 개발자를 위해 컴퓨터 비전은 보안 및 스포츠 분석에 사용되는 영상 이해 및 실시간 추적 시스템에도 활용됩니다. OpenCV과 같은 라이브러리를 통합함으로써 개발자는 시각적 세계를 포착하고 처리하며 분석하는 포괄적인 애플리케이션을 구축할 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기