YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics 용어집으로 돌아가기

Mixture of Experts (MoE)

Mixture of Experts(MoE) 아키텍처를 살펴보십시오. 게이팅 네트워크와 희소 계층이 고성능 AI 및 컴퓨터 비전을 위해 신경망을 어떻게 확장하는지 알아보십시오.

Mixture of Experts (MoE) is a specialized architectural design in deep learning that allows models to scale to massive sizes without a proportional increase in computational cost. Unlike a standard dense neural network (NN), where every parameter is active for every input, an MoE model employs a technique called conditional computation. This approach dynamically activates only a small subset of the network's components—referred to as "experts"—based on the specific characteristics of the input data. By doing so, MoE architectures enable the creation of powerful foundation models that can possess trillions of parameters while maintaining the inference latency and operational speed of much smaller systems.

Link to this sectionMoE의 핵심 메커니즘#

Mixture of Experts 모델의 효율성은 표준 밀집 레이어를 희소(sparse) MoE 레이어로 대체하는 것에서 비롯됩니다. 이 레이어는 일반적으로 정보를 효율적으로 처리하기 위해 함께 작동하는 두 가지 주요 요소로 구성됩니다.

  • 전문가(Experts): 이는 독립적인 하위 네트워크로, 대개 단순한 피드포워드 신경망(FFN)입니다. 각 전문가는 데이터의 서로 다른 측면을 처리하는 데 특화되어 있습니다. 자연어 처리(NLP) 맥락에서 한 전문가는 문법 처리에 능숙해질 수 있고, 다른 전문가는 사실 관계 검색이나 코드 구문에 집중할 수 있습니다.
  • 게이팅 네트워크(라우터): 라우터는 데이터에 대한 교통 관제사 역할을 합니다. 이미지 패치나 텍스트 토큰과 같은 입력이 레이어에 들어오면, 라우터는 소프트맥스 함수를 사용하여 확률 점수를 계산합니다. 그런 다음 가장 높은 점수를 받은 "Top-K" 전문가(보통 하나 또는 두 명)에게만 해당 입력을 전달합니다. 이는 모델이 가장 관련성이 높은 파라미터에만 에너지를 소비하도록 보장합니다.

Link to this section모델 앙상블과의 차이점#

두 개념 모두 다수의 하위 모델을 사용하지만, Mixture of Experts를 모델 앙상블과 구별하는 것은 매우 중요합니다. 전통적인 앙상블에서는 그룹 내의 모든 모델이 동일한 입력을 처리하며, 정확도를 최대화하기 위해 결과의 평균을 내거나 투표를 진행합니다. 이 방식은 모델 수에 비례하여 계산 비용이 증가합니다.

반면, MoE는 서로 다른 입력이 서로 다른 경로를 통과하는 단일 통합 모델입니다. 희소(sparse) MoE는 모든 추론 단계에서 전체 파라미터의 일부만 실행하여 확장성과 효율성을 목표로 합니다. 이를 통해 밀집 앙상블과 관련된 엄청난 비용 없이도 방대한 양의 학습 데이터에 대한 학습이 가능합니다.

Link to this section실제 애플리케이션 사례#

MoE 아키텍처는 특히 다중 작업 기능과 광범위한 지식 유지가 필요한 시나리오에서 현대적인 고성능 AI의 초석이 되었습니다.

  1. 다국어 언어 모델: Mistral AI의 Mixtral 8x7B와 같은 유명한 모델들은 MoE를 활용하여 다양한 언어 작업에서 뛰어난 성능을 발휘합니다. 토큰을 전문화된 전문가에게 라우팅함으로써, 이러한 시스템은 유사한 활성 파라미터 수를 가진 밀집 모델보다 더 뛰어난 성능으로 단일 모델 구조 내에서 번역, 요약 및 코딩 작업을 처리할 수 있습니다.

  2. 확장 가능한 컴퓨터 비전: 컴퓨터 비전(CV) 영역에서 연구자들은 MoE를 적용하여 거대한 비전 백본을 구축합니다. Vision MoE (V-MoE) 아키텍처는 전문가가 독특한 시각적 특징을 인식하는 데 어떻게 특화될 수 있는지 보여주며, ImageNet과 같은 벤치마크에서 성능을 효과적으로 확장합니다. YOLO26과 같이 고도로 최적화된 밀집 모델은 예측 가능한 메모리 점유율 덕분에 여전히 실시간 엣지 탐지의 표준으로 남아 있지만, MoE 연구는 서버 측 시각적 이해의 경계를 계속 넓히고 있습니다.

Link to this section라우팅 로직 예시#

게이팅 네트워크가 어떻게 전문가를 선택하는지 이해하기 위해, 이 단순화된 PyTorch 예시를 고려해 보십시오. 이는 주어진 입력에 대해 가장 관련성이 높은 전문가를 선택하는 라우팅 메커니즘을 보여줍니다.

import torch
import torch.nn as nn

# A simple router deciding between 4 experts for input dimension of 10
num_experts = 4
input_dim = 10
router = nn.Linear(input_dim, num_experts)

# Batch of 2 inputs
input_data = torch.randn(2, input_dim)

# Calculate scores and select the top-1 expert for each input
logits = router(input_data)
probs = torch.softmax(logits, dim=-1)
weights, indices = torch.topk(probs, k=1, dim=-1)

print(f"Selected Expert Indices: {indices.flatten().tolist()}")

Link to this section학습 및 배포 시의 과제#

장점에도 불구하고, MoE 모델은 학습 과정에 고유한 문제를 발생시킵니다. 주요 이슈는 **로드 밸런싱(load balancing)**입니다. 라우터가 일부 "인기 있는" 전문가를 선호하고 다른 전문가를 무시하게 되어 용량 낭비가 발생할 수 있습니다. 이를 완화하기 위해 연구자들은 보조 손실 함수를 사용하여 모든 전문가의 균등한 사용을 장려합니다.

Furthermore, deploying these massive models requires sophisticated hardware setups. Since the total parameter count is high (even if active parameters are low), the model often requires significant VRAM, necessitating distributed training across multiple GPUs. Frameworks like Microsoft DeepSpeed help manage the parallelism required to train these systems efficiently. For managing datasets and training workflows for such complex architectures, tools like the Ultralytics Platform provide essential infrastructure for logging, visualization, and deployment.

Explore solutions

Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.
더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.
더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.
더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.
더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.
더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.
더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.
더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.
더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.
더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.
더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.
더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.
더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.
더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.
더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.
더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.
더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.
더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.
더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.
더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.
더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.
더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.