Yolo 비전 선전
선전
지금 참여하기
용어집

기반 모델

인공지능(AI)에서 파운데이션 모델의 힘을 탐구하세요. Ultralytics 활용하여 Ultralytics 같은 대규모 모델을 맞춤형 작업에 적용하는 방법을 알아보세요.

파운데이션 모델은 인공지능(AI) 분야에서 중요한 패러다임 전환을 의미합니다. 이는 방대한 양의 데이터로 훈련된 대규모 머신러닝 모델로, 종종 수십억 개의 매개변수를 포함하며 다양한 하위 작업에 적용될 수 있습니다. 기존 머신러닝(ML) 모델이 특정 꽃 종류 분류처럼 단일 목적에 맞춰 구축되는 것과 달리, 파운데이션 모델은 자원 집약적인 사전 훈련 단계에서 광범위한 패턴, 구조 및 관계를 학습합니다. 이러한 광범위한 지식 기반을 통해 개발자는 전이 학습을 통해 모델을 새로운 문제에 적용할 수 있으며, 최첨단 결과를 달성하는 데 필요한 시간과 데이터를 크게 절감할 수 있습니다.

핵심 메커니즘: 사전 훈련과 적응

파운데이션 모델의 힘은 사전 훈련과 미세 조정이라는 두 단계 개발 과정에 있습니다. 사전 훈련 단계에서 모델은 인터넷의 방대한 부분, 다양한 이미지 라이브러리, 광범위한 코드 저장소 등 대규모 데이터셋에 노출됩니다. 이 단계에서는 종종 자기지도 학습 기법을 활용하는데, 모델이 데이터 구조 자체로부터 자체 라벨을 생성함으로써 수동 데이터 주석 작업의 병목 현상을 제거합니다. 예를 들어, 언어 모델은 문장 내 다음 단어를 예측하는 법을 배우는 반면, 비전 모델은 경계, 질감, 그리고 객체 영속성을 이해하는 법을 배웁니다.

사전 훈련된 모델은 다목적 출발점 역할을 합니다. 미세 조정이라는 과정을 통해 개발자는 더 작고 도메인 특화 데이터셋으로 모델의 가중치를 조정할 수 있습니다. 이 기능은 제한된 컴퓨팅 자원을 가진 조직도 강력한 아키텍처를 활용할 수 있게 하여 AI 민주화의 핵심입니다. 현대적인 워크플로는 종종 Ultralytics 같은 도구를 활용하여 이 적응 과정을 간소화함으로써, 신경망을 처음부터 구축할 필요 없이 맞춤형 데이터셋에 대한 효율적인 훈련을 가능하게 합니다.

실제 애플리케이션

파운데이션 모델은 다양한 산업 분야의 혁신을 위한 중추 역할을 합니다. 일반화 능력 덕분에 자연어 처리부터 고급 컴퓨터 비전에 이르기까지 다양한 작업에 적용할 수 있습니다.

  • 의료 분야의 컴퓨터 비전: 특화된 비전 파운데이션 모델을 미세 조정하여 의료 영상 분석을 지원할 수 있습니다. 일반 이미지로 훈련된 모델을 MRI 영상에서 detect X선에서 버클 골절을식별하도록 적응시킬 수 있습니다. 이 응용 사례는 일반적인 시각적 이해가 어떻게 생명을 구하는 진단 도구로 전환되는지 보여줍니다.
  • 산업 자동화: 제조업에서 Ultralytics 같은 비전 모델은 물체 탐지를 위한 기초 아키텍처 역할을 합니다. 공장에서는 이러한 모델을 활용해 품질 검사를 자동화하며, 조립 라인에서 결함을 고속·고정밀도로 탐지합니다. 모델이 사전에 보유한 물체 경계에 대한 지식은 이러한 스마트 제조 솔루션의 도입을 가속화합니다.

기술적 구현 예시

개발자는 기초 모델을 활용하여 최소한의 코드로 복잡한 작업을 수행할 수 있습니다. 다음 예시는 사전 훈련된 YOLO26 모델(실시간 애플리케이션에 최적화된 비전 기초 모델)을 로드하고 이미지에서 객체 탐지를 수행하는 방법을 보여줍니다.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")

# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

주요 용어 차별화

인공지능 분야에서 "파운데이션 모델"을 관련 개념과 구분하여 이해하는 것은 각 모델의 구체적인 역할을 파악하는 데 도움이 됩니다:

  • 대규모 언어 모델(LLM): LLM은 텍스트 처리 및 생성을 위해 특별히 설계된 기초 모델의 한 유형입니다. 모든 LLM은 기초 모델이지만, 모든 기초 모델이 LLM은 아닙니다. 이 범주에는 SAM Segment Anything Model) 과 같은 비전 모델 및 다중 모달 시스템도 포함됩니다.
  • 전이 학습: 이는 기초 모델을 새로운 작업에 적용하는 기법입니다. 기초 모델은 산출물(저장된 신경망)이며, 전이 학습은 해당 산출물의 지식을 특정 용도(예: 농업에서의 해충 방제)에 맞게 업데이트하는 과정입니다.
  • 생성형 AI: 이는 새로운 콘텐츠(텍스트, 이미지, 코드)를 생성할 수 있는 시스템을 의미합니다. 많은 파운데이션 모델이 생성형 AI 애플리케이션을 구동하지만, 분류나 객체 추적과 같은 엄밀히 말해 "생성형"이 아닌 판별 작업에도 활용될 수 있습니다.

향후 방향 및 영향

파운데이션 모델의 진화는 단일 시스템이 텍스트, 이미지, 오디오, 센서 데이터의 정보를 동시에 처리하고 연관시킬 수 있는 다중 모달 AI로 나아가고 있습니다. 스탠퍼드 인간 중심 인공지능 연구소(HAI)와같은 기관의 연구는 이러한 시스템이 인간과 유사한 방식으로 세계에 대해 추론할 수 있는 잠재력을 강조합니다. 이러한 모델이 더욱 효율적으로 발전함에 따라 엣지 컴퓨팅 기기에서의 배포가 점차 실현 가능해져 스마트폰, 드론, IoT 센서에 강력한 AI 기능을 직접 제공하게 됩니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기