Khám phá cách các mô hình nền tảng cách mạng hóa AI với kiến trúc có khả năng mở rộng, huấn luyện trước trên diện rộng và khả năng thích ứng cho các ứng dụng đa dạng.
Mô hình nền tảng là một hệ thống Học máy (ML) quy mô lớn được đào tạo trên một lượng lớn dữ liệu rộng, có thể được điều chỉnh cho nhiều tác vụ hạ nguồn. Được Viện Trí tuệ Nhân tạo Lấy Con người Làm Trung tâm Stanford (HAI) đặt ra, những mô hình này đại diện cho một sự thay đổi mô hình trong Trí tuệ Nhân tạo (AI), nơi một mô hình duy nhất học các mẫu chung, cú pháp và mối quan hệ ngữ nghĩa trong giai đoạn tiền đào tạo tốn nhiều tài nguyên. Sau khi được đào tạo, "nền tảng" này đóng vai trò là điểm khởi đầu linh hoạt mà các nhà phát triển có thể điều chỉnh cho các ứng dụng cụ thể thông qua tinh chỉnh , giảm đáng kể nhu cầu xây dựng các mô hình chuyên biệt từ đầu.
Sức mạnh của các mô hình nền tảng nằm ở quy mô và phương pháp học chuyển giao . Không giống như các mô hình truyền thống được đào tạo cho một mục đích duy nhất (như phân loại một loài hoa cụ thể), các mô hình nền tảng tiếp nhận các tập dữ liệu khổng lồ - thường bao gồm văn bản, hình ảnh hoặc âm thanh - bằng cách sử dụng các kỹ thuật học tự giám sát . Điều này cho phép chúng thể hiện "các thuộc tính nổi bật", cho phép chúng thực hiện các nhiệm vụ mà chúng không được lập trình rõ ràng để làm.
Các cơ chế chính bao gồm:
Các mô hình nền tảng đã thúc đẩy sự bùng nổ của AI tạo sinh và đang chuyển đổi nhiều ngành công nghiệp khác nhau:
Điều quan trọng là phải phân biệt các mô hình nền tảng với các thuật ngữ tương tự trong bối cảnh AI:
Việc sử dụng mô hình nền tảng thường liên quan đến việc tải các trọng số được đào tạo trước và đào tạo chúng thêm trên một tập dữ liệu tùy chỉnh nhỏ hơn. ultralytics thư viện hợp lý hóa quy trình này cho các nhiệm vụ thị giác, cho phép người dùng tận dụng các khả năng cơ bản của YOLO11 .
Ví dụ sau đây minh họa cách tải một chương trình được đào tạo trước YOLO11 mô hình (nền tảng) và tinh chỉnh nó cho một nhiệm vụ phát hiện cụ thể:
from ultralytics import YOLO
# Load a pre-trained YOLO11 model (acts as the foundation)
# 'yolo11n.pt' contains weights learned from the massive COCO dataset
model = YOLO("yolo11n.pt")
# Fine-tune the model on a specific dataset (Transfer Learning)
# This adapts the model's general vision capabilities to new classes
model.train(data="coco8.yaml", epochs=5)
Mặc dù mạnh mẽ, các mô hình nền tảng vẫn đặt ra những thách thức liên quan đến độ lệch dữ liệu và chi phí tính toán đào tạo cao. Bài báo quan trọng về các mô hình nền tảng nêu bật những rủi ro của việc đồng nhất hóa, khi một lỗi trong nền tảng lan truyền đến tất cả các quá trình điều chỉnh tiếp theo. Do đó, nghiên cứu về đạo đức và an toàn AI đang trở thành trọng tâm trong quá trình phát triển của chúng. Nhìn về tương lai, ngành công nghiệp đang hướng tới AI đa phương thức , nơi các mô hình nền tảng đơn lẻ có thể lập luận liền mạch trên video, văn bản và âm thanh, mở đường cho các phương tiện tự hành và robot toàn diện hơn.