용어집

확장성

인공지능(AI)에서 확장성의 중요성을 살펴보세요. Ultralytics Ultralytics 어떻게 효율적이고 고성능의 모델 배포를 가능하게 하는지 알아보세요.

확장성은 시스템, 네트워크 또는 프로세스가 자원을 추가함으로써 증가하는 작업량을 처리할 수 있는 능력을 의미합니다. 인공지능(AI) 및 머신러닝(ML)의 맥락에서 확장성은 수요 증가에 따라 모델이나 인프라가 성능 수준을 유지할 수 있는 능력을 설명합니다. 이러한 수요는 일반적으로 훈련 시 더 큰 데이터셋, 추론 시 더 높은 사용자 트래픽, 또는 계산 작업의 복잡성 증가로 나타납니다. 확장 가능한 아키텍처는 컴퓨터 비전 모델을 단일 임베디드 장치에 배포하든, 클라우드 클러스터를 통해 수백만 개의 API 요청을 처리하든, 무거운 부하 하에서도 추론 지연 시간이 낮게 유지되도록 보장하며 원활한 확장을 가능하게 합니다.

인공지능에서 확장성의 중요성

확장성을 고려한 설계는 성공적인 머신러닝 운영(MLOps)의 핵심 요소입니다. 통제된 연구 환경에서 완벽하게 작동하는 모델도 실제 운영 환경에서 발생하는 고속 데이터 스트림에 노출되면 실패할 수 있습니다. 빅데이터를 효과적으로 관리하려면 클러스터에 더 많은 머신을 추가하는 수평적 확장 또는 기존 머신에 RAM이나 GPU와 같은 성능을 추가하는 수직적 확장이 가능한 시스템이 필요합니다.

확장 가능한 AI 시스템의 주요 장점은 다음과 같습니다:

신뢰성: 확장 가능한 시스템은 예상치 못한 트래픽 급증 시에도 일관된 서비스 가동 시간을 보장하여 중요 애플리케이션의 중단을 방지합니다.
비용 효율성: 동적 확장 기능은 사용량이 적은 기간 동안 리소스를 축소할 수 있게 해주며, 이는 AWS나 Google 같은 클라우드 컴퓨팅 플랫폼에서 흔히 관리되는 기능입니다.
미래 대비: 확장 가능한 인프라를 통해 비전 트랜스포머(ViT)와 같은 더 새롭고 복잡한 알고리즘을 하드웨어 생태계를 완전히 개편하지 않고도 수용할 수 있습니다.

확장성을 달성하기 위한 전략

확장 가능한 AI 솔루션을 만들려면 모델 아키텍처와 배포 인프라를 모두 최적화해야 합니다.

분산 훈련: 훈련 데이터셋이 단일 프로세서로 처리하기에 너무 커지면, 분산 훈련은 작업 부하를 여러 개의 그래픽스 처리 장치(GPU)에 분할합니다. PyTorch 같은 프레임워크는 개발자가 계산을 병렬화할 수 있게 하여, 기초 모델 훈련에 필요한 시간을 크게 단축합니다. Ultralytics 같은 도구들은 클라우드 훈련 리소스를 자동으로 관리함으로써 이 과정을 단순화합니다.
효율적인 모델 아키텍처: 적절한 모델 아키텍처 선택은 처리량에 매우 중요합니다. 최신 Ultralytics 기존 모델보다 더 작고 빠르게 설계되어 에지 AI 장치부터 대규모 서버 팜에 이르기까지 다양한 하드웨어에서 기본적으로 확장 가능합니다.
컨테이너화와 오케스트레이션: Docker를 사용한 애플리케이션 패키징은 서로 다른 환경에서도 일관되게 실행되도록 보장합니다. 대규모 컨테이너 클러스터 관리를 위해 Kubernetes는 컨테이너화된 애플리케이션의 배포, 확장 및 관리를 자동화합니다.
모델 최적화: 모델 양자화 및 정리 같은 기법은 모델의 메모리 사용량과 계산 비용을 줄입니다. NVIDIA TensorRT 는 추론 속도를 더욱 가속화하여 기존 하드웨어에서 더 높은 처리량을 가능하게 합니다.

코드 예시: 확장 가능한 배치 추론

추론 중 확장성을 개선하는 효과적인 방법 중 하나는 입력을 순차적으로 처리하는 대신 배치 단위로 처리하는 것이다. 이는 GPU 극대화하고 전체 처리량을 증가시킨다.

from ultralytics import YOLO

# Load a scalable YOLO26 model (smaller 'n' version for speed)
model = YOLO("yolo26n.pt")

# Define a batch of images (URLs or local paths)
# Processing multiple images at once leverages parallel computation
batch_images = ["https://ultralytics.com/images/bus.jpg", "https://ultralytics.com/images/zidane.jpg"]

# Run inference on the batch
results = model(batch_images)

# Print the number of detections for the first image
print(f"Detected {len(results[0].boxes)} objects in the first image.")

실제 애플리케이션

확장성은 AI 기술이 이론적 연구에서 글로벌 산업 도구로 전환할 수 있게 합니다.

스마트 제조: 제조 분야의 인공지능(AI) 영역에서 자동 검사 시스템은 고속 조립 라인에서 시간당 수천 개의 부품을 분석해야 합니다. 확장 가능한 객체 탐지 시스템은 생산 속도가 증가함에 따라 품질 관리 프로세스가 병목 현상 없이 높은 정확도를 유지하도록 보장합니다.
소매 추천 엔진: 주요 전자상거래 플랫폼은 추천 시스템을 활용하여 수백만 건의 개인화된 제품 제안을 즉시 제공합니다. 확장 가능한 인프라를 통해 이러한 플랫폼은 트래픽이 100배 급증하는 블랙 프라이데이 같은 대규모 이벤트를 Microsoft 또는 유사 공급자를 통해 추가 서버 노드를 동적으로 프로비저닝함으로써 처리할 수 있습니다.

확장성 vs. 관련 개념

비록 종종 혼용되지만, 확장성은 성능 및 효율성과는 별개의 개념이다.

확장성 대 성능: 성능은 일반적으로 특정 시점에서의 시스템 속도 또는 정확도를 의미합니다(예: 초당 프레임 수). 확장성은 작업 부하가 증가함에 따라 해당 성능을 유지하는 시스템의 능력을 설명합니다.
확장성 대 효율성: 효율성은 특정 작업을 완료하는 데 사용되는 자원을 측정합니다 (예: 추론당 에너지 소비량). 시스템은 효율적이지만 확장성이 없을 수 있습니다(병렬 작업을 처리할 수 없는 경우), 또는 확장성은 있지만 비효율적일 수 있습니다(성장을 처리하기 위해 과도한 자원을 사용하는 경우).
확장성 대 유연성: 유연성은 시스템이 다양한 유형의 작업을 처리할 수 있게 합니다. 예를 들어 YOLO11 검출, 분할, 자세 추정 등을 처리합니다. 확장성은 동일한 작업을 더 많이 처리하는 데 특별히 초점을 맞춥니다.

확장성

산업 전반의 워크플로우를 간소화하기 위한 Ultralytics YOLO 모델 교육

혁신을 강화하는 유연한 엔터프라이즈 라이선스 솔루션

Ultralytics YOLO 몇 초 만에 AI 모델 훈련하기

인공지능에서 확장성의 중요성

확장성을 달성하기 위한 전략

코드 예시: 확장 가능한 배치 추론

실제 애플리케이션

확장성 vs. 관련 개념

이 카테고리에서 더 읽어보기

컴퓨터 비전으로 구현된 12가지 항공 이미지 활용 사례

단안 깊이 추정이란 무엇인가? 개요

Ultralytics YOLO 활용한 AI 위협 탐지 기술 분석

Ultralytics 커뮤니티 가입