Yolo 비전 선전
선전
지금 참여하기
용어집

대규모 언어 모델(LLM)

대규모 언어 모델(LLM)의 기본 원리를 탐구하세요. 트랜스포머 아키텍처, 토큰화, 그리고 LLM을 Ultralytics 26과 결합하는 방법을 알아보세요.

대규모 언어 모델(LLM) 은 방대한 데이터셋으로 훈련된 정교한 유형의 인공지능(AI) 으로, 인간 언어를 이해하고 생성하며 조작합니다. 이러한 모델들은 복잡한 언어 패턴, 문법, 의미 관계를 포착하기 위해 수십억 개의 매개변수를 가진 신경망을 활용하는 딥러닝(DL)의 중요한 진화를 나타냅니다. 대부분의 현대 LLM은 핵심적으로 트랜스포머 아키텍처를 기반으로 하여 순차적 처리 대신 데이터 시퀀스를 병렬 처리합니다. 이 아키텍처는 자기 주의( self-attention) 메커니즘을 활용하여 문장 내 단어 간 거리와 무관하게 상호 간의 상대적 중요도를 가중치 부여할 수 있게 합니다.

LLM의 핵심 메커니즘

LLM의 기능은 토큰화에서 시작됩니다. 이 과정은 원시 텍스트를 토큰(단어 또는 하위 단어)이라 불리는 더 작은 단위로 분해하는 것입니다. 모델 훈련 단계에서 시스템은 인터넷, 서적, 기사에서 페타바이트 규모의 텍스트를 분석합니다. 비지도 학습을 통해 시퀀스 내 다음 토큰을 예측함으로써 언어의 통계적 구조를 효과적으로 학습합니다.

초기 훈련 이후 개발자들은 종종 의료 분석이나 코딩 지원과 같은 특정 작업을 위해 모델을 전문화하기 위해 미세 조정을 적용합니다. 이러한 적응성 때문에 스탠퍼드 기초 모델 연구 센터와 같은 기관들은 classify "기초 모델" classify 특정 응용 프로그램이 구축되는 광범위한 기반입니다.

실제 애플리케이션

LLM은 이론적 연구를 넘어 다양한 산업 분야에서 실질적이고 영향력 있는 응용 분야로 확장되었습니다:

  • 지능형 가상 비서: 현대적인 고객 서비스는 대규모 언어 모델(LLM) 기반 챗봇에 크게 의존합니다. 기존 규칙 기반 시스템과 달리, 이러한 에이전트는 미묘한 뉘앙스가 담긴 질의를 처리할 수 있습니다. 정확도를 높이고 환각 현상을 줄이기 위해 개발자들은 검색 강화 생성(RAG) 기술을 통합하여, 모델이 답변하기 전에 최신 회사 문서를 참조할 수 있도록 합니다.
  • 다중 모달 시각-언어 시스템: AI의 최전선은 텍스트와 시각 데이터를 연결합니다. 시각-언어 모델(VLMs)은 사용자가 자연어로 이미지를 검색할 수 있게 합니다. 예를 들어, 언어 인터페이스를 YOLO26과 같은 강력한 탐지기와 결합하면 시스템이 음성 명령을 기반으로 실시간 영상 피드에서 물체를 식별하고 설명할 수 있습니다.

텍스트와 비전을 코드로 연결하다

표준 대규모 언어 모델(LLM)이 텍스트를 처리하는 동안, 업계는 다중 모달 AI로 전환되고 있습니다. 다음 예시는 언어적 프롬프트가 YOLO 모델을 활용해 컴퓨터 비전 작업을 제어하는 방식을 보여줍니다. 이 모델은 개방형 어휘 탐지를 위한 텍스트 설명자를 이해합니다.

from ultralytics import YOLOWorld

# Load a model capable of understanding natural language prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using text descriptions rather than fixed labels
model.set_classes(["person wearing a red helmet", "blue industrial machine"])

# Run inference to detect these specific text-defined objects
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Show results
results[0].show()

관련 개념 구분하기

LLM을 더 광범위하거나 유사한 용어와 구분하는 것이 중요합니다:

  • LLM 대 자연어 처리(NLP): NLP는 컴퓨터와 인간 언어 간의 상호작용을 다루는 포괄적인 학문 분야입니다. LLM은 해당 분야에서 최첨단 결과를 달성하기 위해 사용되는 특정 도구 또는 기술입니다.
  • LLM 대 생성형 AI: 생성형 AI는 새로운 콘텐츠를 생성할 수 있는 모든 AI를 포괄하는 범주입니다. LLM은 이 범주의 텍스트 기반 하위 집합이며, Stable Diffusion과 같은 모델은 이미지 생성 하위 집합을 대표합니다.

과제 및 향후 전망

LLM은 뛰어난 능력에도 불구하고 훈련 데이터에 존재하는 편견을 무의식적으로 재생산할 수 있어 AI 편향성 문제에 직면해 있습니다. 또한 GPT-4나 Google 같은 모델 훈련에 필요한 막대한 연산 능력은 에너지 소비에 대한 우려를 불러일으킵니다. 현재 연구는 이러한 시스템을 에지 하드웨어에서 실행할 수 있을 만큼 효율적으로 만들기 위한 모델 양자화에 집중되고 있습니다.

더 깊은 기술적 통찰을 위해, 원본 논문 Attention Is All You Need는 트랜스포머의 기초 이론을 제공합니다. 또한 어떻게 NVIDIA 이 이러한 대규모 워크로드를 위해 하드웨어를 최적화하는 방법도 살펴볼 수 있습니다.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기