YOLO Vision 2025를 놓치지 마세요!
2025년 9월 25일
10:00 — 18:00 BST
하이브리드 이벤트
Yolo Vision 2024
용어집

컴퓨터 비전(CV)

컴퓨터 비전으로 AI의 잠재력을 활용하십시오! 객체 감지, 의료, 자율 주행 자동차 등에서의 역할을 탐구하십시오. 지금 자세히 알아보십시오!

컴퓨터 비전(CV)은 컴퓨터가 시각적 세계를 해석하고 이해하도록 훈련하는 인공 지능(AI) 분야입니다. 카, 비디오 및 딥러닝 모델의 디지털 이미지를 사용하여 기계는 객체를 정확하게 식별하고 분류한 다음 "보는" 것에 반응할 수 있습니다. 목표는 컴퓨터가 인간의 시각을 복제할 수 있도록 하는 것이며, 이는 방대한 양의 시각 데이터를 처리하고 분석하여 이해하는 것을 포함합니다. 이 분야는 딥러닝의 발전과 대규모 데이터 세트의 가용성 덕분에 빠르게 성장했습니다.

컴퓨터 비전 작동 방식

컴퓨터 비전은 시각적 데이터에 머신 러닝(ML) 알고리즘을 적용하여 작동합니다. 객체를 인식하도록 명시적으로 프로그래밍하는 대신 CV 모델은 수천 또는 수백만 개의 레이블이 지정된 이미지에서 패턴을 식별하는 방법을 학습합니다. 예를 들어, 고양이를 인식하도록 모델을 훈련하려면 고양이의 특징을 스스로 구별할 수 있을 때까지 수많은 고양이 이미지를 제공해야 합니다.

최신 CV는 딥러닝 모델, 특히 합성곱 신경망(CNNs)에 크게 의존합니다. CNN은 이미지 데이터 처리에 매우 효과적인 신경망 유형입니다. 필터(또는 커널)를 이미지에 적용하여 엣지, 텍스처 및 모양과 같은 중요한 특징을 강조하는 특징 맵을 생성하는 방식으로 작동합니다. 이러한 네트워크는 많은 일반적인 컴퓨터 비전 작업을 강화하여 기계가 시각 정보를 점점 더 정확하게 분석할 수 있도록 합니다.

컴퓨터 비전 vs. 이미지 처리

컴퓨터 비전과 이미지 처리는 밀접하게 관련되어 있지만 동일하지 않습니다. 이미지 처리는 CV의 하위 집합으로, 디지털 이미지를 조작하여 이미지를 개선하거나 유용한 정보를 추출하는 데 중점을 둡니다. 여기에는 이미지 선명하게 하기, 흐리게 하기 또는 필터링과 같은 작업이 포함됩니다. 대조적으로 컴퓨터 비전은 이미지의 내용을 해석하고 이해하는 것을 목표로 한 단계 더 나아갑니다. 예를 들어 이미지 처리는 사진의 품질을 개선하는 데 사용될 수 있지만, 컴퓨터 비전은 해당 사진 내의 사람, 객체 및 장면을 식별하는 데 사용됩니다. 자세한 내용은 디지털 이미지 처리 개요에서 자세한 내용을 확인할 수 있습니다.

컴퓨터 비전의 주요 과제

컴퓨터 비전은 기계가 시각적 데이터를 분석하고 해석할 수 있도록 하는 몇 가지 주요 작업을 포함합니다.

  • 객체 감지: 여기에는 이미지 또는 비디오 내에서 객체를 식별하고 위치를 찾는 것이 포함됩니다. Ultralytics YOLO와 같은 모델은 감지된 각 객체 주위에 바운딩 박스를 그리고 클래스 레이블을 할당합니다.
  • Image Classification: 이 작업은 미리 정의된 범주 세트에서 전체 이미지에 단일 레이블을 할당하는 것을 포함합니다. 예를 들어 이미지를 "고양이" 또는 "개"를 포함하는 것으로 분류합니다.
  • 이미지 분할(Image Segmentation): 객체 감지와 달리 분할은 이미지의 각 픽셀을 분류합니다. 이미지 내용에 대한 훨씬 더 자세한 이해를 제공합니다. 하위 작업에는 인스턴스 분할(Instance segmentation)시맨틱 분할(Semantic segmentation)이 포함됩니다.
  • 자세 추정(Pose Estimation): 이는 공간에서 사람 또는 객체의 위치와 방향을 결정하는 데 사용됩니다. 로봇 공학, 증강 현실 및 인간 활동 분석에 널리 사용됩니다.
  • 객체 추적(Object Tracking): 이 작업은 비디오 시퀀스에서 시간 경과에 따라 하나 이상의 객체를 추적하는 것을 포함합니다. 감시 및 자율 탐색과 같은 애플리케이션에 매우 중요합니다.

실제 애플리케이션

컴퓨터 비전 애플리케이션은 다양한 분야에서 점점 더 널리 사용되고 있습니다.

  • 자율 주행 차량: CV는 자율 주행 자동차가 주변 환경을 인식하고, 보행자 및 다른 차량을 감지하고, 교통 표지판을 읽고, 안전하게 탐색할 수 있도록 하는 데 매우 중요합니다. WaymoTesla와 같은 회사는 CV 시스템에 크게 의존합니다. 자동차 AI 솔루션에 대해 자세히 알아보십시오.
  • Healthcare: 의료 영상 분석에서 CV는 방사선 전문의가 X-ray, CT 스캔 및 MRI에서 종양이나 골절과 같은 이상 징후를 감지하는 데 도움이 됩니다. 또한 로봇 수술 및 환자 모니터링에도 사용됩니다. Radiology: Artificial Intelligence에서 그 영향에 대해 자세히 알아보십시오. YOLO11이 종양 감지에 사용되는 방법도 확인할 수 있습니다.
  • 보안 및 감시: CV는 침입 감지, 개인 추적 및 군중 행동 분석을 위한 자동화된 모니터링 시스템을 지원합니다. 보안 경보 시스템 구축 방법에 대한 가이드를 참조하십시오.
  • 소매(Retail): 애플리케이션에는 선반 모니터링을 통한 재고 관리, 고객 행동 분석 및 Amazon Go와 같은 계산대 없는 결제 시스템이 포함됩니다.
  • 제조: CV는 품질 관리, 결함 감지, 조립 라인 모니터링 및 로봇 자동화에 사용됩니다. YOLO11을 사용한 스마트 제조 솔루션 제작에 대해 알아보세요.
  • 농업(Agriculture): 이 기술은 작물 모니터링, 질병 감지, 잡초 식별 및 자동 수확을 통해 정밀 농업을 가능하게 합니다. 실시간 작물 건강 모니터링에 대해 읽어보십시오.

도구 및 프레임워크

다양한 도구와 프레임워크를 통해 컴퓨터 비전 모델의 개발 및 배포가 더 쉬워졌습니다. PyTorch(PyTorch 공식 사이트 방문) 및 TensorFlow(TensorFlow 공식 사이트 방문)와 같은 라이브러리는 모델 구축의 기본입니다. OpenCV와 같은 오픈 소스 라이브러리는 실시간 컴퓨터 비전을 위한 방대한 함수 컬렉션을 제공합니다.

Ultralytics HUB와 같은 플랫폼은 데이터 세트 관리 및 맞춤형 모델 학습에서부터 배포에 이르기까지 CV 프로젝트의 전체 수명 주기를 간소화합니다. ONNX와 같은 표준화된 형식을 사용하면 서로 다른 프레임워크 간의 상호 운용성을 보장하는 데 도움이 됩니다. 이러한 기술이 발전함에 따라 산업 전반에 걸쳐 혁신을 계속 주도할 것입니다.

Ultralytics 커뮤니티에 참여하세요

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기
클립보드에 링크가 복사되었습니다.