YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics 용어집으로 돌아가기

SigLIP

비전-언어 모델을 위한 메모리 효율적인 시그모이드 손실(Sigmoid Loss) 접근 방식인 SigLIP을 알아보십시오. Ultralytics YOLO 프로젝트를 위해 확장성과 학습을 어떻게 개선하는지 확인해 보십시오.

SigLIP(Sigmoid Loss for Language Image Pre-Training)은 vision-language models을 학습시키기 위한 매우 효율적인 접근 방식입니다. Google Research 연구원들이 처음 도입한 이 방법은 AI 모델이 이미지와 해당 텍스트 설명 간의 관계를 학습하는 방식을 근본적으로 변화시킵니다. SigLIP은 기존의 확률 함수를 더 간단한 이진 분류 방식으로 대체함으로써 개발자가 메모리 오버헤드를 크게 줄이고 계산 효율성을 높여 대규모 멀티모달 아키텍처를 학습시킬 수 있도록 합니다.

Link to this section아키텍처 이해하기#

시각적 데이터와 텍스트 데이터를 쌍으로 묶는 표준 machine learning 파이프라인에서, 모델은 일반적으로 올바른 학습을 위해 주어진 배치 내의 모든 데이터에 대한 전역적인 관점에 의존합니다. SigLIP은 모든 이미지-텍스트 쌍을 독립적인 이진 분류 문제로 처리하여 이러한 병목 현상을 제거합니다. 표준 sigmoid 함수를 사용하여 모델은 특정 이미지와 텍스트 설명이 일치하는지 또는 일치하지 않는지를 단순히 예측합니다.

이러한 loss function에 대한 국소적 접근 방식은 model training 중 필요한 메모리가 이차 함수가 아닌 선형으로 확장됨을 의미합니다. 결과적으로 엔지니어는 PyTorch와 같은 프레임워크에서 지원하는 표준 하드웨어 구성에서 훨씬 더 큰 배치 크기를 활용할 수 있으며, GPU 리소스를 기하급수적으로 늘리지 않고도 다양한 datasets에서 향상된 성능을 얻을 수 있습니다.

Link to this sectionSigLIP과 CLIP의 차이점#

최신 AI 아키텍처를 탐색할 때 SigLIP을 이전 모델인 CLIP (Contrastive Language-Image Pre-training)과 구분하는 것이 필수적입니다.

  • CLIP: 소프트맥스 손실 함수에 의존하며, 모델이 배치 내의 모든 텍스트 설명과 이미지를 동시에 비교해야 합니다. 이는 배치 크기가 증가함에 따라 deep learning 학습 중 심각한 메모리 병목 현상을 유발합니다.
  • SigLIP: 쌍별 시그모이드 손실을 활용합니다. 단일 이미지-텍스트 쌍이 실제 일치하는지 아니면 잘못된 일치인지 평가하기만 하면 되므로, artificial intelligence 워크플로를 최적화할 때 여러 장치에 분산 배포하기가 매우 쉽고 확장성이 뛰어납니다.

Link to this section실제 애플리케이션 사례#

SigLIP의 메모리 효율적인 설계는 기술 산업 전반에 걸쳐 다양한 실용적 애플리케이션을 위한 강력한 기반을 제공합니다.

  • Zero-Shot Image Classification: SigLIP은 학습 중에 명시적으로 본 적이 없는 새로운 클래스로 이미지를 분류하는 데 탁월합니다. 이는 카테고리가 자주 변경되는 동적 image classification 시스템에 매우 유용하며, 지속적인 수동 데이터 라벨링의 필요성을 제거합니다.
  • Semantic Search Engines: SigLIP은 매우 정확한 멀티모달 임베딩을 생성함으로써 고급 검색 시스템을 구동합니다. 사용자는 복잡한 텍스트 쿼리를 입력하여 방대하고 비정형화된 이미지 데이터베이스를 높은 정밀도로 검색할 수 있습니다.

이러한 유형의 복잡한 비전 작업을 위해 사용자 지정 데이터를 관리할 때, 팀은 종종 Ultralytics Platform을 사용하여 클라우드 데이터셋 주석을 간소화하고 고속 에지 추론을 위해 Ultralytics YOLO26과 같은 고급 모델을 배포하기 전에 텍스트 및 이미지 통찰력을 원활하게 통합합니다.

Link to this section구현 예시#

SigLIP이 근본적인 수준에서 손실을 계산하는 방법을 이해하려면 기본 PyTorch 연산을 사용하여 프로세스를 시뮬레이션할 수 있습니다. 이 스니펫은 쌍별 시그모이드 접근 방식이 기존의 다중 클래스 확률 로직을 어떻게 대체하는지 보여줍니다.

import torch
import torch.nn.functional as F

# Simulate image and text embeddings from a vision-language model
image_embeddings = torch.randn(4, 256)
text_embeddings = torch.randn(4, 256)

# Calculate pairwise similarities (logits)
logits = torch.matmul(image_embeddings, text_embeddings.T)

# SigLIP uses a binary formulation: 1 for positive pairs, -1 for negative pairs
labels = torch.eye(4) * 2 - 1
loss = -F.logsigmoid(labels * logits).mean()

print(f"Calculated SigLIP Loss: {loss.item():.4f}")

이러한 간소화된 접근 방식을 활용함으로써 IEEE 및 ACM과 같은 기관에 게시하는 연구원들을 포함한 광범위한 AI 커뮤니티는 멀티모달 학습의 경계를 계속 확장하고 있으며, 차세대 비전 AI를 위한 새로운 model training tips 및 모범 사례를 확립하고 있습니다.

Explore solutions

Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.