Thuật ngữ

Mô hình nền tảng

Khám phá cách các mô hình nền tảng cách mạng hóa AI với kiến trúc có khả năng mở rộng, đào tạo trước rộng rãi và khả năng thích ứng cho nhiều ứng dụng khác nhau.

Mô hình nền tảng là một mô hình Học máy (ML) quy mô lớn được đào tạo trên một lượng lớn dữ liệu rộng, chưa được gắn nhãn, có thể được điều chỉnh cho nhiều tác vụ hạ nguồn khác nhau. Được Viện Trí tuệ Nhân tạo Lấy Con người Làm Trung tâm Stanford đặt ra, khái niệm cốt lõi là "thuộc tính nổi lên", trong đó mô hình phát triển khả năng hiểu biết linh hoạt đáng ngạc nhiên về các mẫu, cú pháp và ngữ nghĩa từ dữ liệu mà nó được đào tạo. Bản chất đa năng này cho phép nó đóng vai trò là điểm khởi đầu mạnh mẽ, hay "nền tảng", để tạo ra các mô hình chuyên biệt hơn thông qua một quy trình gọi là tinh chỉnh .

Đặc điểm và ứng dụng chính

Đặc điểm nổi bật của các mô hình nền tảng là khả năng thích ứng, bắt nguồn từ mô hình học chuyển giao . Thay vì đào tạo một mô hình mới từ đầu cho mọi vấn đề, các nhà phát triển có thể sử dụng một mô hình nền tảng đã được đào tạo trước và điều chỉnh nó với một tập dữ liệu nhỏ hơn, dành riêng cho từng tác vụ. Điều này giúp giảm đáng kể dữ liệu, tính toán và thời gian cần thiết để xây dựng các hệ thống AI hiệu suất cao.

Các ứng dụng thực tế thể hiện tính linh hoạt của chúng:

  1. Chatbot và Trợ lý Ảo Nâng cao: Mô hình Ngôn ngữ Lớn (LLM) như GPT-4 của OpenAI đóng vai trò là mô hình nền tảng cho ngôn ngữ. Nó được đào tạo trước trên một kho ngữ liệu khổng lồ từ internet để hiểu ngữ pháp, dữ kiện và kỹ năng lập luận. Sau đó, một công ty có thể tinh chỉnh nó bằng các tài liệu nội bộ và nhật ký tương tác với khách hàng để tạo ra một chatbot chuyên biệt có thể trả lời các câu hỏi cụ thể về sản phẩm hoặc dịch vụ của mình với độ chính xác cao.
  2. Phân tích hình ảnh y tế: Trong thị giác máy tính , một mô hình như Mô hình Phân đoạn Bất kỳ (SAM) của Meta AI là một mô hình nền tảng cho phân đoạn hình ảnh . Nó có thể xác định và phác thảo các đối tượng trong bất kỳ hình ảnh nào mà không cần bối cảnh trước. Các nhà nghiên cứu y tế sau đó có thể tinh chỉnh mô hình này trên một tập hợp ảnh chụp MRI hoặc CT nhỏ hơn để phân đoạn chính xác các cơ quan cụ thể hoặc phát hiện các bất thường như khối u, giúp tăng tốc chẩn đoán phân tích hình ảnh y tế .

Mô hình nền tảng so với các mô hình khác

Điều quan trọng là phải phân biệt các mô hình nền tảng với các khái niệm liên quan:

  • Mô hình tác vụ cụ thể: Theo truyền thống, ML liên quan đến việc đào tạo các mô hình từ đầu cho một mục đích duy nhất, chẳng hạn như đào tạo mô hình YOLO của Ultralytics chỉ để phát hiện các gói hàng trong logistics . Mặc dù hiệu quả, phương pháp này đòi hỏi dữ liệu được gắn nhãn đáng kể cho mỗi tác vụ mới. Các mô hình nền tảng cung cấp một giải pháp thay thế hiệu quả hơn.
  • Mô hình Ngôn ngữ Lớn (LLM): LLM là một loại mô hình nền tảng nổi bật tập trung vào các nhiệm vụ ngôn ngữ. Tuy nhiên, thuật ngữ "mô hình nền tảng" mang nghĩa rộng hơn, bao gồm các mô hình cho hình ảnh, âm thanh và các phương thức dữ liệu khác, như được trình bày chi tiết trong bài báo mang tính bước ngoặt "Về Cơ hội và Rủi ro của Mô hình Nền tảng".
  • Mô hình Thị giác Chuyên biệt: Trong khi các mô hình thị giác lớn như Vision Transformer (ViT) được coi là mô hình nền tảng, nhiều mô hình CV chuyên biệt lại không phải vậy. Ví dụ, mô hình YOLO11 được tinh chỉnh cho một ứng dụng cụ thể như AI trong ô tô là một mô hình chuyên biệt. Tuy nhiên, nó tận dụng một nền tảng được đào tạo trước, bao gồm kiến thức nền tảng thu được từ các tập dữ liệu lớn như COCO .

Đào tạo và tầm quan trọng trong tương lai

Việc đào tạo trước các mô hình nền tảng là một nỗ lực tốn nhiều tài nguyên, thường đòi hỏi hàng nghìn GPU và nỗ lực kỹ thuật khổng lồ, thường được thực hiện bởi các tổ chức lớn như Google AIDeepMind . Tuy nhiên, sau khi được đào tạo, các mô hình này có thể được sử dụng rộng rãi hơn.

Các nền tảng như Ultralytics HUB cung cấp các công cụ giúp người dùng điều chỉnh các khả năng cơ bản này bằng cách hợp lý hóa quy trình làm việc để đào tạo các mô hình tùy chỉnh , quản lý tập dữ liệu và triển khai các giải pháp, thường với việc điều chỉnh siêu tham số cẩn thận.

Các mô hình nền tảng đang chuyển đổi bối cảnh AI bằng cách dân chủ hóa việc tiếp cận các năng lực mạnh mẽ. Sự trỗi dậy của chúng cũng mang đến những cuộc thảo luận quan trọng về đạo đức AI , sự thiên vị dữ liệu và sự phân chia tính toán . Tương lai hướng đến các mô hình mạnh mẽ, hiệu quả và đa phương thức hơn, có thể hiểu và xử lý thông tin từ văn bản, hình ảnh và âm thanh đồng thời, thúc đẩy làn sóng ứng dụng AI tiếp theo.

Tham gia cộng đồng Ultralytics

Tham gia vào tương lai của AI. Kết nối, cộng tác và phát triển với những nhà đổi mới toàn cầu

Tham gia ngay
Liên kết đã được sao chép vào clipboard