Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Mô hình ngôn ngữ lớn (Large Language Model - LLM)

Khám phá cách Mô hình Ngôn ngữ Lớn (LLM) tạo ra cuộc cách mạng trong AI với NLP nâng cao, cung cấp sức mạnh cho chatbot, tạo nội dung, v.v. Tìm hiểu các khái niệm chính!

Mô hình Ngôn ngữ Lớn (LLM) là một loại thuật toán Trí tuệ Nhân tạo (AI) phức tạp, áp dụng các kỹ thuật học sâu để hiểu, tóm tắt, tạo và dự đoán nội dung mới. Các mô hình này được đào tạo trên các tập dữ liệu khổng lồ bao gồm hàng tỷ từ ngữ từ sách, bài báo và trang web, cho phép chúng nắm bắt được các sắc thái của ngôn ngữ con người. Trọng tâm chức năng của LLM là kiến trúc Transformer , sử dụng cơ chế tự chú ý để cân nhắc tầm quan trọng của các từ khác nhau trong một chuỗi, tạo điều kiện cho việc hiểu ngữ cảnh của các câu và đoạn văn dài. Khả năng này khiến chúng trở thành nền tảng của Xử lý Ngôn ngữ Tự nhiên (NLP) hiện đại.

Cơ chế cốt lõi và đào tạo

Việc phát triển một LLM bao gồm hai giai đoạn chính: tiền huấn luyện và tinh chỉnh . Trong quá trình tiền huấn luyện, mô hình tham gia vào quá trình học không giám sát trên một khối lượng lớn văn bản chưa được gắn nhãn để học ngữ pháp, dữ kiện và khả năng lập luận. Quá trình này chủ yếu dựa vào mã hóa , trong đó văn bản được chia nhỏ thành các đơn vị nhỏ hơn gọi là mã thông báo. Sau đó, các nhà phát triển áp dụng tinh chỉnh bằng cách sử dụng dữ liệu huấn luyện đã được gắn nhãn để điều chỉnh mô hình cho các tác vụ cụ thể, chẳng hạn như chẩn đoán y tế hoặc phân tích pháp lý. Các tổ chức như Trung tâm Nghiên cứu Mô hình Nền tảng Stanford (CRFM) classify những hệ thống thích ứng này được coi là Mô hình Nền tảng vì khả năng ứng dụng rộng rãi của chúng.

Các Ứng dụng Thực tế

Các chương trình LLM đã chuyển đổi từ phòng thí nghiệm nghiên cứu sang các công cụ thực tiễn hỗ trợ vô số ứng dụng trong nhiều ngành công nghiệp. Khả năng tạo ra văn bản mạch lạc và xử lý thông tin của chúng đã dẫn đến việc áp dụng rộng rãi.

  • Tác nhân Đàm thoại và Chatbot : Các chatbot tiên tiến được hỗ trợ bởi các mô hình như GPT-4 hoặc Meta Llama cung cấp dịch vụ hỗ trợ khách hàng, soạn thảo email và hoạt động như trợ lý cá nhân. Các hệ thống này thường sử dụng Công nghệ Thế hệ Tăng cường Truy xuất (RAG) để truy cập thông tin bên ngoài mới nhất, giảm nguy cơ ảo giác .
  • Tạo mã và gỡ lỗi : Các công cụ như GitHub Copilot tận dụng LLM để hỗ trợ các nhà phát triển bằng cách tự động hoàn thiện các đoạn mã, chuyển đổi các bình luận thành mã chức năng và giải thích logic phức tạp, do đó đẩy nhanh vòng đời phát triển phần mềm.

Thạc sĩ Luật về AI đa phương thức

Trong khi chương trình Thạc sĩ Luật (LLM) chuyên về văn bản, lĩnh vực này đang phát triển theo hướng AI đa phương thức , tích hợp văn bản với các loại dữ liệu khác như hình ảnh và âm thanh. Điều này thu hẹp khoảng cách giữa mô hình hóa ngôn ngữ và Thị giác máy tính (CV) . Ví dụ, Mô hình Ngôn ngữ Thị giác (VLM) có thể phân tích hình ảnh và trả lời các câu hỏi về hình ảnh đó.

Trong bối cảnh này, các mô hình phát hiện đối tượng như Ultralytics YOLO11 cung cấp khả năng hiểu trực quan bổ sung cho lý luận văn bản của LLM. Các mô hình chuyên biệt như YOLO -World cho phép người dùng detect các đối tượng sử dụng lời nhắc văn bản từ vựng mở, kết hợp hiệu quả các khái niệm ngôn ngữ với nhận dạng hình ảnh.

from ultralytics import YOLOWorld

# Load a YOLO-World model capable of understanding text prompts
model = YOLOWorld("yolov8s-world.pt")

# Define custom classes using natural language text
model.set_classes(["person wearing a hat", "red backpack"])

# Run inference to detect these specific text-defined objects
results = model("path/to/image.jpg")

# Display the detection results
results[0].show()

Những thách thức và cân nhắc

Mặc dù sở hữu sức mạnh vượt trội, các LLM vẫn phải đối mặt với những thách thức đáng kể. Chúng có thể biểu hiện sai lệch trong AI được rút ra từ dữ liệu huấn luyện, dẫn đến kết quả đầu ra không công bằng hoặc bị lệch. Ngoài ra, chi phí tính toán khổng lồ khi chạy các mô hình này đã thúc đẩy việc nghiên cứu các kỹ thuật lượng tử hóa và tối ưu hóa mô hình để làm cho chúng hiệu quả hơn trên phần cứng như NVIDIA . Việc hiểu rõ những hạn chế này là rất quan trọng để triển khai AI Tạo sinh một cách có trách nhiệm.

Các Khái Niệm Liên Quan

  • Xử lý Ngôn ngữ Tự nhiên (NLP) : Lĩnh vực rộng hơn của AI tập trung vào sự tương tác giữa máy tính và ngôn ngữ con người. Thạc sĩ Luật (LLM) là một công cụ chuyên biệt và mạnh mẽ trong lĩnh vực này.
  • Thị giác Máy tính : Không giống như LLM xử lý văn bản, CV cho phép máy móc diễn giải thông tin trực quan. Các mô hình như YOLO11 tỏ ra vượt trội ở khía cạnh này, mặc dù chúng ngày càng chồng chéo với LLM trong các ứng dụng đa phương thức.
  • Tokenization : Quá trình chuyển đổi văn bản thành dữ liệu số mà mô hình có thể xử lý. Đây là bước tiền xử lý cơ bản cho bất kỳ mô hình ngôn ngữ học sâu nào .

Để tìm hiểu thêm về kiến trúc nền tảng của LLM, bài báo "Attention Is All You Need" cung cấp định nghĩa gốc về mô hình Transformer. Bạn có thể tìm thêm tài nguyên về các mô hình cấp doanh nghiệp thông qua IBM ResearchGoogle DeepMind .

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay