컴퓨터 비전(CV)의 기초를 탐구하세요. Ultralytics Ultralytics 어떻게 객체 탐지, 분할 등을 가능하게 하는지 알아보세요.
컴퓨터 비전(CV)은 인공 지능(AI) 의 정교한 분야로, 컴퓨터와 시스템이 디지털 이미지, 동영상 및 기타 시각적 입력에서 의미 있는 정보를 도출할 수 있게 합니다. 인간 시각은 주변 환경을 즉각적으로 인지하고 이해하는 선천적 능력을 지니지만, 컴퓨터는 패턴을 인식하고 픽셀을 해석하도록 훈련되어야 합니다. 머신 러닝(ML), 특히 딥 러닝(DL) 알고리즘을 활용함으로써 CV 시스템은 시각적 데이터를 수집하고 처리하여 해당 정보를 바탕으로 권장 사항을 제시하거나 조치를 취할 수 있습니다.
컴퓨터는 본질적으로 이미지를 픽셀을 나타내는 수치 값의 배열로 인식합니다. 현대 컴퓨터 비전은 인간의 뇌 신경세포 연결 패턴을 모방하도록 설계된 컨볼루션 신경망(CNN)에 크게 의존합니다. 이러한 신경망은 특징 추출이라는 과정을 통해 단순한 경계선과 질감부터 복잡한 형태와 사물에 이르기까지 계층적 특징을 식별하는 법을 학습합니다.
이러한 모델이 효과적으로 작동하려면 방대한 양의 훈련 데이터가 필요합니다. 예를 들어 자동차를 인식하려면 모델이 다양한 조건의 자동차로 구성된 수천 장의 라벨링된 이미지를 처리해야 합니다. Ultralytics 같은 도구는 이러한 워크플로를 간소화하여 사용자가 데이터셋에 주석을 달고, 클라우드에서 모델을 훈련시키며, 효율적으로 배포할 수 있도록 합니다.
컴퓨터 비전은 단일 기능이 아니라 각각 특정 문제를 해결하는 서로 다른 작업들의 집합체입니다:
컴퓨터 비전의 유용성은 사실상 모든 산업 분야에 걸쳐 있으며, 이전에는 인간의 눈이 필요했던 작업을 자동화합니다.
CV와 이미지 처리의 차이를 구분하는 것이 중요하지만, 이들은 종종 함께 작동합니다.
현대 라이브러리는 강력한 CV 모델 구현을 손쉽게 접근 가능하게 만들었습니다. 아래 예시는 최첨단 모델을 로드하는 방법을 보여줍니다. YOLO26 이미지 내 detect 모델
사용하여 ultralytics 패키지입니다.
from ultralytics import YOLO
# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")
# Run inference on a standard example image
# The model identifies objects and their locations
results = model("https://ultralytics.com/images/bus.jpg")
# Display the resulting image with bounding boxes
results[0].show()
이 간단한 스크립트는 사전 훈련된 모델을 활용하여 복잡한 추론 작업을 수행함으로써 현대 AI 도구의 접근성을 보여줍니다. 정적 이미지를 넘어선 개발자를 위해 컴퓨터 비전은 보안 및 스포츠 분석에 사용되는 영상 이해 및 실시간 추적 시스템에도 활용됩니다. OpenCV과 같은 라이브러리를 통합함으로써 개발자는 시각적 세계를 포착하고 처리하며 분석하는 포괄적인 애플리케이션을 구축할 수 있습니다.