Khám phá cách các mô hình nền tảng cách mạng hóa AI với kiến trúc có khả năng mở rộng, huấn luyện trước trên diện rộng và khả năng thích ứng cho các ứng dụng đa dạng.
Mô hình nền tảng đại diện cho một sự thay đổi mô hình quan trọng trong lĩnh vực Trí tuệ Nhân tạo (AI) . Đó là một mô hình học máy quy mô lớn được huấn luyện trên một lượng dữ liệu khổng lồ—thường bao gồm hàng tỷ tham số—có thể được điều chỉnh cho nhiều nhiệm vụ khác nhau. Không giống như các mô hình Học máy (ML) truyền thống, thường được xây dựng cho một mục đích cụ thể, duy nhất như phân loại một loại hoa cụ thể, mô hình nền tảng học các mẫu, cấu trúc và mối quan hệ rộng lớn trong giai đoạn tiền huấn luyện tốn nhiều tài nguyên. Cơ sở kiến thức rộng lớn này cho phép các nhà phát triển áp dụng mô hình cho các vấn đề mới thông qua học chuyển giao , giảm đáng kể thời gian và dữ liệu cần thiết để đạt được kết quả tiên tiến nhất.
Sức mạnh của một mô hình nền tảng nằm ở quy trình phát triển hai giai đoạn: huấn luyện sơ bộ và tinh chỉnh. Trong giai đoạn huấn luyện sơ bộ, mô hình được tiếp xúc với các tập dữ liệu khổng lồ, chẳng hạn như phần lớn dữ liệu trên internet, các thư viện hình ảnh đa dạng hoặc các kho mã nguồn mở rộng. Giai đoạn này thường sử dụng học tự giám sát , một kỹ thuật trong đó mô hình tự tạo ra nhãn từ cấu trúc dữ liệu, loại bỏ nút thắt cổ chai của việc chú thích dữ liệu thủ công. Ví dụ, một mô hình ngôn ngữ có thể học cách dự đoán từ tiếp theo trong một câu, trong khi một mô hình thị giác học cách hiểu các cạnh, kết cấu và tính bền vững của đối tượng.
Sau khi được huấn luyện sơ bộ, mô hình đóng vai trò là điểm khởi đầu linh hoạt. Thông qua một quy trình gọi là tinh chỉnh , các nhà phát triển có thể điều chỉnh trọng số của mô hình trên một tập dữ liệu nhỏ hơn, chuyên biệt theo lĩnh vực. Khả năng này rất quan trọng đối với việc dân chủ hóa AI , vì nó cho phép các tổ chức có nguồn lực tính toán hạn chế tận dụng các kiến trúc mạnh mẽ. Các quy trình làm việc hiện đại thường sử dụng các công cụ như Nền tảng Ultralytics để hợp lý hóa quá trình thích ứng này, cho phép huấn luyện hiệu quả trên các tập dữ liệu tùy chỉnh mà không cần phải xây dựng mạng nơ-ron từ đầu.
Các mô hình nền tảng đóng vai trò xương sống cho những đổi mới trong nhiều ngành công nghiệp khác nhau. Khả năng khái quát hóa của chúng cho phép áp dụng vào nhiều nhiệm vụ, từ xử lý ngôn ngữ tự nhiên đến thị giác máy tính tiên tiến.
Các nhà phát triển có thể tận dụng các mô hình nền tảng để thực hiện các tác vụ phức tạp với lượng mã tối thiểu. Ví dụ sau đây minh họa cách tải mô hình YOLO26 đã được huấn luyện trước — một mô hình nền tảng thị giác được tối ưu hóa cho các ứng dụng thời gian thực — và thực hiện phát hiện đối tượng trên hình ảnh.
from ultralytics import YOLO
# Load a pre-trained YOLO26 foundation model
# 'n' stands for nano, the smallest and fastest version
model = YOLO("yolo26n.pt")
# Perform inference on an image to detect objects
# The model uses its pre-trained knowledge to identify common objects
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
Việc phân biệt "Mô hình nền tảng" với các khái niệm liên quan trong lĩnh vực trí tuệ nhân tạo sẽ giúp hiểu rõ vai trò cụ thể của chúng:
Sự phát triển của các mô hình nền tảng đang hướng tới trí tuệ nhân tạo đa phương thức , nơi một hệ thống duy nhất có thể xử lý và liên kết thông tin từ văn bản, hình ảnh, âm thanh và dữ liệu cảm biến cùng một lúc. Nghiên cứu từ các tổ chức như Viện Trí tuệ Nhân tạo hướng đến Con người (HAI) của Đại học Stanford nhấn mạnh tiềm năng của các hệ thống này trong việc suy luận về thế giới giống con người hơn. Khi các mô hình này trở nên hiệu quả hơn, việc triển khai trên các thiết bị điện toán biên ngày càng khả thi, mang lại khả năng trí tuệ nhân tạo mạnh mẽ trực tiếp đến điện thoại thông minh, máy bay không người lái và cảm biến IoT.