컴퓨터 비전으로 AI의 잠재력을 활용하십시오! 객체 감지, 의료, 자율 주행 자동차 등에서의 역할을 탐구하십시오. 지금 자세히 알아보십시오!
컴퓨터 비전(CV)은 인공지능(AI)의 혁신적인 분야로 인공지능(AI)의 혁신적인 분야로 컴퓨터가 시각 세계를 인식하고 해석하며 이해할 수 있도록 지원하는 혁신적인 인공지능(AI) 분야입니다. 디지털 이미지, 비디오 및 기타 시각적 입력을 처리함으로써 다른 시각적 입력을 처리함으로써 기계는 의미 있는 정보를 추출하고 이를 기반으로 조치를 취하거나 추천을 할 수 있습니다. 분석합니다. 인간의 시각은 눈과 뇌에 의존하여 주변 환경을 즉각적으로 맥락화하는 반면, 컴퓨터 비전은 은 고급 소프트웨어와 머신 러닝(ML) 알고리즘을 사용하여 이 기능을 복제하여 이전에는 사람의 시각이 필요했던 작업을 시스템에서 자동화할 수 있습니다.
컴퓨터 비전의 핵심은 시각적 데이터를 이해하기 위한 데이터에 의존합니다. 초기 시도에는 객체를 정의하기 위해 수동으로 규칙을 코딩하는 방식이 사용되었지만, 최신 CV는 딥 러닝(DL) 과 방대한 양의 훈련 데이터를 기반으로 합니다. 오늘날 가장 일반적으로 사용되는 아키텍처는 이미지를 픽셀 단위로 처리하는 컨볼루션 신경망(CNN)입니다. 이러한 네트워크는 초기 레이어에서 가장자리와 텍스처와 같은 낮은 수준의 특징을 식별하고 초기 레이어에서 가장자리와 질감과 같은 낮은 수준의 특징을 식별하고 이를 결합하여 더 깊은 레이어에서 얼굴이나 차량과 같은 복잡한 개념을 인식합니다. 이 과정에는 모델에 다양한 카테고리를 효과적으로 구분하는 방법을 가르치기 위해 방대한 레이블이 지정된 데이터 세트가 필요합니다. 다양한 카테고리를 효과적으로 구분하는 방법을 모델에 학습시켜야 합니다.
컴퓨터 비전은 단일 작업이 아니라 다양한 문제를 해결하는 특정 작업의 집합입니다:
흔히 컴퓨터 비전과 디지털 이미지 처리와 혼동하는 것이 일반적이지만, 이 둘은 서로 다른 용도로 사용됩니다. 이미지 처리는 입력 이미지를 조작하여 품질을 개선하거나 또는 정보를 '이해'하지 않고도 정보를 추출하는 데 중점을 둡니다. 일반적인 예로는 밝기 조정 필터 적용 또는 노이즈 감소 등이 있습니다. 이와는 대조적입니다, CV는 이미지 이해에 중점을 두며, 인간의 인지를 모방하여 이미지가 나타내는 내용을 해석하는 것이 목표입니다.
컴퓨터 비전은 거의 모든 산업에 걸쳐 효율성과 안전성을 높이는 데 활용되고 있습니다:
개발자는 다음을 사용하여 강력한 컴퓨터 비전 작업을 구현할 수 있습니다. ultralytics Python 패키지. 예제
는 YOLO11 모델-최신
모든 표준 사용 사례에 권장되는 안정적인 버전으로 이미지에서 물체를 detect 수 있습니다.
from ultralytics import YOLO
# Load the pretrained YOLO11 model (nano version for speed)
model = YOLO("yolo11n.pt")
# Run inference on an online image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results to see bounding boxes and labels
results[0].show()
CV 에코시스템은 강력한 오픈 소스 라이브러리를 통해 지원됩니다. OpenCV 는 수천 개의 알고리즘을 제공하는 기본 라이브러리로서 수천 개의 알고리즘을 제공하는 기본 라이브러리입니다. 딥러닝 모델 구축 및 학습을 위해 다음과 같은 프레임워크가 제공됩니다. PyTorch 와 TensorFlow 과 같은 프레임워크는 업계 표준입니다. Ultralytics 이러한 기반을 기반으로 구축되어 배포하기 쉬운 최첨단 모델을 제공합니다. 앞으로 Ultralytics 플랫폼은 데이터 관리부터 배포까지 전체 Vision AI 라이프사이클을 관리할 수 있는 포괄적인 환경을 제공합니다.

