Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Mô hình nền tảng

Khám phá cách các mô hình nền tảng cách mạng hóa AI với kiến trúc có khả năng mở rộng, huấn luyện trước trên diện rộng và khả năng thích ứng cho các ứng dụng đa dạng.

Mô hình nền tảng đại diện cho một sự thay đổi mô hình quan trọng trong lĩnh vực Trí tuệ Nhân tạo (AI) . Đó là một mô hình học máy quy mô lớn được huấn luyện trên một lượng dữ liệu khổng lồ—thường bao gồm hàng tỷ tham số—có thể được điều chỉnh cho nhiều nhiệm vụ khác nhau. Không giống như các mô hình Học máy (ML) truyền thống, thường được xây dựng cho một mục đích cụ thể, duy nhất như phân loại một loại hoa cụ thể, mô hình nền tảng học các mẫu, cấu trúc và mối quan hệ rộng lớn trong giai đoạn tiền huấn luyện tốn nhiều tài nguyên. Cơ sở kiến ​​thức rộng lớn này cho phép các nhà phát triển áp dụng mô hình cho các vấn đề mới thông qua học chuyển giao , giảm đáng kể thời gian và dữ liệu cần thiết để đạt được kết quả tiên tiến nhất.

Các cơ chế cốt lõi: Chuẩn bị trước và thích nghi

Sức mạnh của một mô hình nền tảng nằm ở quy trình phát triển hai giai đoạn: huấn luyện sơ bộ và tinh chỉnh. Trong giai đoạn huấn luyện sơ bộ, mô hình được tiếp xúc với các tập dữ liệu khổng lồ, chẳng hạn như phần lớn dữ liệu trên internet, các thư viện hình ảnh đa dạng hoặc các kho mã nguồn mở rộng. Giai đoạn này thường sử dụng học tự giám sát , một kỹ thuật trong đó mô hình tự tạo ra nhãn từ cấu trúc dữ liệu, loại bỏ nút thắt cổ chai của việc chú thích dữ liệu thủ công. Ví dụ, một mô hình ngôn ngữ có thể học cách dự đoán từ tiếp theo trong một câu, trong khi một mô hình thị giác học cách hiểu các cạnh, kết cấu và tính bền vững của đối tượng.

Sau khi được huấn luyện sơ bộ, mô hình đóng vai trò là điểm khởi đầu linh hoạt. Thông qua một quy trình gọi là tinh chỉnh , các nhà phát triển có thể điều chỉnh trọng số của mô hình trên một tập dữ liệu nhỏ hơn, chuyên biệt theo lĩnh vực. Khả năng này rất quan trọng đối với việc dân chủ hóa AI , vì nó cho phép các tổ chức có nguồn lực tính toán hạn chế tận dụng các kiến ​​trúc mạnh mẽ. Các quy trình làm việc hiện đại thường sử dụng các công cụ như Nền tảng Ultralytics để hợp lý hóa quá trình thích ứng này, cho phép huấn luyện hiệu quả trên các tập dữ liệu tùy chỉnh mà không cần phải xây dựng mạng nơ-ron từ đầu.

Các Ứng dụng Thực tế

Các mô hình nền tảng đóng vai trò xương sống cho những đổi mới trong nhiều ngành công nghiệp khác nhau. Khả năng khái quát hóa của chúng cho phép áp dụng vào nhiều nhiệm vụ, từ xử lý ngôn ngữ tự nhiên đến thị giác máy tính tiên tiến.

  • Thị giác máy tính trong chăm sóc sức khỏe: Các mô hình nền tảng thị giác chuyên biệt có thể được tinh chỉnh để hỗ trợ phân tích hình ảnh y tế . Một mô hình ban đầu được huấn luyện trên các hình ảnh tổng quát có thể được điều chỉnh để... detect Ứng dụng này giúp phát hiện khối u trên ảnh chụp MRI hoặc xác định các vết nứt gãy trên ảnh chụp X-quang. Nó minh họa cách hiểu biết trực quan tổng quát có thể được chuyển hóa thành các công cụ chẩn đoán cứu sống.
  • Tự động hóa công nghiệp: Trong sản xuất, các mô hình thị giác như Ultralytics YOLO26 đóng vai trò là kiến ​​trúc nền tảng cho việc phát hiện đối tượng. Các nhà máy sử dụng các mô hình này để tự động hóa việc kiểm tra chất lượng , phát hiện các khuyết tật trên dây chuyền lắp ráp với tốc độ và độ chính xác cao. Kiến thức sẵn có của mô hình về ranh giới đối tượng giúp đẩy nhanh quá trình triển khai các giải pháp sản xuất thông minh này.

Ví dụ về triển khai kỹ thuật

Các nhà phát triển có thể tận dụng các mô hình nền tảng để thực hiện các tác vụ phức tạp với lượng mã tối thiểu. Ví dụ sau đây minh họa cách tải mô hình YOLO26 đã được huấn luyện trước — một mô hình nền tảng thị giác được tối ưu hóa cho các ứng dụng thời gian thực — và thực hiện phát hiện đối tượng trên hình ảnh.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")

# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Phân biệt các thuật ngữ chính

Việc phân biệt "Mô hình nền tảng" với các khái niệm liên quan trong lĩnh vực trí tuệ nhân tạo sẽ giúp hiểu rõ vai trò cụ thể của chúng:

  • Mô hình ngôn ngữ lớn (LLM) : LLM là một loại mô hình nền tảng được thiết kế đặc biệt để xử lý và tạo ra văn bản. Mặc dù tất cả các LLM đều là mô hình nền tảng, nhưng không phải tất cả các mô hình nền tảng đều là LLM; loại này cũng bao gồm các mô hình thị giác như SAM (Segment Anything Model) và các hệ thống đa phương thức.
  • Học chuyển giao (Transfer Learning ): Đây là kỹ thuật được sử dụng để áp dụng một mô hình nền tảng cho một nhiệm vụ mới. Mô hình nền tảng là sản phẩm (mạng nơ-ron đã được lưu), trong khi học chuyển giao là quá trình cập nhật kiến ​​thức của sản phẩm đó cho một trường hợp sử dụng cụ thể, chẳng hạn như kiểm soát dịch hại trong nông nghiệp .
  • Trí tuệ nhân tạo tạo sinh (Generative AI ): Thuật ngữ này đề cập đến các hệ thống có khả năng tạo ra nội dung mới (văn bản, hình ảnh, mã). Nhiều mô hình nền tảng hỗ trợ các ứng dụng trí tuệ nhân tạo tạo sinh, nhưng chúng cũng có thể được sử dụng cho các nhiệm vụ phân loại như phân loại đối tượng hoặc theo dõi đối tượng , những nhiệm vụ này không hoàn toàn thuộc phạm trù "tạo sinh".

Định hướng tương lai và tác động

Sự phát triển của các mô hình nền tảng đang hướng tới trí tuệ nhân tạo đa phương thức , nơi một hệ thống duy nhất có thể xử lý và liên kết thông tin từ văn bản, hình ảnh, âm thanh và dữ liệu cảm biến cùng một lúc. Nghiên cứu từ các tổ chức như Viện Trí tuệ Nhân tạo hướng đến Con người (HAI) của Đại học Stanford nhấn mạnh tiềm năng của các hệ thống này trong việc suy luận về thế giới giống con người hơn. Khi các mô hình này trở nên hiệu quả hơn, việc triển khai trên các thiết bị điện toán biên ngày càng khả thi, mang lại khả năng trí tuệ nhân tạo mạnh mẽ trực tiếp đến điện thoại thông minh, máy bay không người lái và cảm biến IoT.

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay