Khám phá cách các mô hình nền tảng cách mạng hóa AI với kiến trúc có khả năng mở rộng, huấn luyện trước trên diện rộng và khả năng thích ứng cho các ứng dụng đa dạng.
Mô hình nền tảng (foundation model) là một mô hình Học máy (ML) quy mô lớn được huấn luyện trên một lượng lớn dữ liệu rộng, chưa được gắn nhãn và có thể được điều chỉnh cho một loạt các tác vụ hạ nguồn. Được đặt ra bởi Viện AI lấy con người làm trung tâm Stanford, khái niệm cốt lõi là "các thuộc tính mới nổi", trong đó mô hình phát triển một sự hiểu biết linh hoạt đáng ngạc nhiên về các mẫu, cú pháp và ngữ nghĩa từ dữ liệu mà nó được huấn luyện. Bản chất mục đích chung này cho phép nó đóng vai trò là một điểm khởi đầu mạnh mẽ, hoặc "nền tảng", để tạo ra các mô hình chuyên biệt hơn thông qua một quy trình gọi là tinh chỉnh (fine-tuning).
Đặc điểm xác định của các mô hình nền tảng (foundation models) là khả năng thích ứng của chúng, bắt nguồn từ mô hình học chuyển giao (transfer learning). Thay vì huấn luyện một mô hình mới từ đầu cho mọi vấn đề, các nhà phát triển có thể lấy một mô hình nền tảng tiền huấn luyện và điều chỉnh nó với một tập dữ liệu nhỏ hơn, dành riêng cho tác vụ. Điều này làm giảm đáng kể dữ liệu, tính toán và thời gian cần thiết để xây dựng hệ thống AI hiệu suất cao.
Các ứng dụng thực tế thể hiện tính linh hoạt của chúng:
Điều quan trọng là phải phân biệt mô hình nền tảng (foundation models) với các khái niệm liên quan:
Huấn luyện trước các mô hình nền tảng là một nỗ lực tốn nhiều tài nguyên, thường đòi hỏi hàng nghìn GPU và các nỗ lực kỹ thuật lớn, thường được thực hiện bởi các tổ chức lớn như Google AI và DeepMind. Tuy nhiên, sau khi được huấn luyện, các mô hình này được cung cấp để sử dụng rộng rãi hơn.
Các nền tảng như Ultralytics HUB cung cấp các công cụ để giúp người dùng điều chỉnh các khả năng cơ bản này bằng cách hợp lý hóa quy trình làm việc để huấn luyện các mô hình tùy chỉnh, quản lý bộ dữ liệu và triển khai các giải pháp, thường với điều chỉnh siêu tham số cẩn thận.
Các mô hình nền tảng đang thay đổi bối cảnh AI bằng cách dân chủ hóa quyền truy cập vào các khả năng mạnh mẽ. Sự trỗi dậy của chúng cũng mang đến những cuộc thảo luận quan trọng về đạo đức AI, sự thiên vị của tập dữ liệu và khoảng cách điện toán. Tương lai hướng tới các mô hình đa phương thức mạnh mẽ, hiệu quả hơn, có thể hiểu và xử lý thông tin từ văn bản, hình ảnh và âm thanh đồng thời, thúc đẩy làn sóng các trường hợp sử dụng AI tiếp theo.