Yolo 비전 선전
선전
지금 참여하기
용어집

대규모 언어 모델(LLM)

대규모 언어 모델(LLM)이 고급 NLP로 AI를 혁신하여 챗봇, 콘텐츠 생성 등에 전력을 공급합니다. 주요 개념을 알아보세요!

대규모 언어 모델(LLM) 은 정교한 유형의 인공 지능(AI) 알고리즘 딥러닝 기술을 적용하여 새로운 콘텐츠를 이해하고, 요약하고, 생성하고, 예측합니다. 이 모델은 다음과 같이 구성된 방대한 데이터 세트를 학습합니다. 수십억 개의 단어로 구성된 방대한 데이터 세트를 학습하여 인간 언어의 뉘앙스를 파악할 수 있습니다. 핵심 LLM의 핵심은 트랜스포머 아키텍처입니다, 자기 주의 메커니즘을 활용하여 시퀀스에서 여러 단어의 중요도를 시퀀스에서 서로 다른 단어의 중요도를 평가하여 긴 문장이나 문단. 이 기능은 최신 자연어 처리(NLP)의 초석이 됩니다. 자연어 처리(NLP).

핵심 메커니즘 및 교육

LLM 개발에는 사전 교육과 미세 조정의 두 가지 주요 단계가 포함됩니다. 미세 조정. 사전 훈련 동안 모델은 방대한 데이터에 대한 방대한 말뭉치에 대한 비지도 학습을 수행합니다. 레이블이 없는 텍스트로 문법, 사실, 추론 능력을 학습합니다. 이 프로세스는 다음 사항에 크게 의존합니다. 토큰화, 즉 텍스트를 토큰이라는 작은 작은 단위로 나누는 토큰화에 크게 의존합니다. 그런 다음 개발자는 라벨이 지정된 학습 데이터를 사용하여 특정 작업에 맞게 모델을 조정합니다, 의료 진단이나 법률 분석과 같은 특정 작업에 맞게 모델을 조정합니다. 다음과 같은 조직 스탠포드 기초 모델 연구 센터(CRFM)와 같은 조직에서는 이러한 적응형 시스템을 적응형 시스템을 파운데이션 모델로 분류하는 이유는 광범위한 적용 가능성.

실제 애플리케이션

LLM은 연구실에서 산업 전반의 수많은 애플리케이션을 지원하는 실용적인 도구로 전환되었습니다. 일관된 텍스트를 생성하고 정보를 처리하는 능력으로 인해 널리 채택되었습니다.

  • 대화형 상담원 및 챗봇: 고급 다음과 같은 모델로 구동되는 챗봇 GPT-4 또는 메타 라마와 같은 모델로 구동되는 고급 챗봇은 고객 지원, 이메일 초안 작성, 개인 비서 역할을 하며 개인 비서 역할을 합니다. 이러한 시스템은 종종 다음을 활용합니다. 검색 증강 생성(RAG) 를 활용하여 최신 외부 정보에 액세스하여 다음과 같은 위험을 줄입니다. 환각.
  • 코드 생성 및 디버깅: 다음과 같은 도구 GitHub Copilot과 같은 도구는 LLM을 활용하여 다음과 같은 방법으로 개발자를 지원합니다. 코드 조각 자동 완성, 주석을 함수형 코드로 변환, 복잡한 로직 설명 등을 통해 개발자를 지원합니다. 소프트웨어 개발 라이프사이클을 가속화합니다.

멀티모달 AI의 LLM

LLM은 텍스트에 특화되어 있지만, 이 분야는 다음과 같은 방향으로 발전하고 있습니다. 텍스트와 이미지, 오디오 등 다른 데이터 유형과 통합하는 멀티모달 AI로 발전하고 있습니다. 이는 언어 모델링과 컴퓨터 비전(CV). 예를 들어 비전 언어 모델(VLM) 은 이미지를 분석하고 이미지에 대한 질문에 답할 수 있습니다.

이러한 맥락에서 다음과 같은 객체 감지 모델은 Ultralytics YOLO11 와 같은 객체 감지 모델은 시각적 이해를 제공하여 텍스트 추론을 보완하는 시각적 이해를 제공합니다. 다음과 같은 특수 모델은 detect 통해 사용자는 개방형 어휘 텍스트 프롬프트를 사용하여 개방형 어휘 텍스트 프롬프트를 사용하여 언어적 개념과 시각적 인식을 효과적으로 결합할 수 있습니다.

from ultralytics import YOLOWorld

# Load a YOLO-World model capable of understanding text prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using natural language text
model.set_classes(["person wearing a hat", "red backpack"])

# Run inference to detect these specific text-defined objects
results = model("path/to/image.jpg")

# Display the detection results
results[0].show()

과제 및 고려 사항

이러한 힘에도 불구하고 LLM은 상당한 도전에 직면해 있습니다. 다음과 같은 문제점을 나타낼 수 있습니다. 학습 데이터에서 파생된 AI의 편향성, 이로 인한 불공정하거나 왜곡된 결과를 초래할 수 있습니다. 또한, 이러한 모델을 실행하는 데 드는 막대한 계산 비용으로 인해 모델 정량화 및 최적화 모델 정량화 및 최적화 기술에 대한 연구를 촉진했습니다. NVIDIA. 이러한 한계를 이해하는 것은 제너레이티브 AI를 책임감 있게 배포하는 데 있어 매우 중요합니다.

관련 개념

  • 자연어 처리(NLP): 컴퓨터와 인간의 언어 간의 상호 작용에 초점을 맞춘 광범위한 AI 분야입니다. LLM은 이 분야의 구체적이고 이 분야의 강력한 도구입니다.
  • 컴퓨터 비전: 텍스트를 처리하는 LLM과 달리 CV는 기계가 시각 정보를 해석할 수 있게 해줍니다. 다음과 같은 모델 YOLO11 와 같은 모델은 멀티태스킹 애플리케이션의 멀티모달 애플리케이션의 LLM.
  • 토큰화: 텍스트를 모델이 처리할 수 있는 숫자 입력으로 변환하는 과정입니다. 이는 모든 모델의 기본적인 기본적인 전처리 단계입니다. 딥러닝 언어 모델의 기본적인 전처리 단계입니다.

LLM의 기본 아키텍처에 대한 자세한 내용은 다음 문서를 참조하세요. 주의만 기울이면 됩니다에서 트랜스포머 모델에 대한 트랜스포머 모델. 엔터프라이즈급 모델에 대한 추가 리소스는 다음을 통해 확인할 수 있습니다. IBM 리서치Google 딥마인드.

Ultralytics 커뮤니티 가입

AI의 미래에 동참하세요. 글로벌 혁신가들과 연결하고, 협력하고, 성장하세요.

지금 참여하기