Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Điều chỉnh hướng dẫn

Khám phá cách tinh chỉnh hướng dẫn giúp các mô hình AI phù hợp với ý định của con người. Tìm hiểu cách huấn luyện. Ultralytics YOLO26 và các mô hình khác tuân theo các chỉ thị cụ thể để thực hiện các tác vụ tốt hơn.

Điều chỉnh hướng dẫn là một kỹ thuật học máy chuyên biệt được sử dụng để huấn luyện các mô hình tuân theo các chỉ thị hoặc lệnh cụ thể của người dùng. Không giống như huấn luyện trước tiêu chuẩn, thường tập trung vào việc dự đoán từ tiếp theo trong một chuỗi hoặc nhận dạng các mẫu chung trong dữ liệu, điều chỉnh hướng dẫn tận dụng các tập dữ liệu được định dạng dưới dạng các nhiệm vụ trực tiếp. Bằng cách cho mô hình tiếp xúc với các cặp đầu vào-đầu ra được cấu trúc dưới dạng các lệnh rõ ràng và các phản hồi chính xác tương ứng của chúng, các nhà phát triển có thể biến một mô hình nền tảng đa năng thành một trợ lý hướng nhiệm vụ, có khả năng phản hồi cao. Phương pháp này được sử dụng rộng rãi trong Trí tuệ nhân tạo tạo sinh để điều chỉnh các mô hình phù hợp với ý định của con người, đảm bảo đầu ra có liên quan, an toàn và có thể thực hiện được.

Cách thức hoạt động của việc điều chỉnh hướng dẫn

Quá trình này bao gồm việc cập nhật trọng số mô hình bằng cách sử dụng một tập dữ liệu hướng dẫn được chọn lọc kỹ lưỡng. Các tập dữ liệu này bao gồm nhiều lĩnh vực khác nhau, từ giải phương trình toán học đến phân tích hình ảnh. Trong quá trình huấn luyện, mô hình học được mối quan hệ cấu trúc giữa cách diễn đạt mệnh lệnh của một hướng dẫn (ví dụ: "Tóm tắt văn bản này" hoặc "Xác định các đối tượng trong hình ảnh này") và định dạng đầu ra mong muốn. Nghiên cứu gần đây, chẳng hạn như các nghiên cứu về FLAN (Fine-tuned Language Net) của... Google Điều này chứng minh rằng các mô hình được điều chỉnh theo hướng dẫn thể hiện khả năng học tập không cần dữ liệu huấn luyện được cải thiện đáng kể trên các nhiệm vụ chưa từng thấy.

Các Ứng dụng Thực tế

Việc tinh chỉnh hướng dẫn đã mở khóa những khả năng mang tính đột phá trên cả hai phương thức văn bản và hình ảnh:

  • Trợ lý AI tương tác: Các chatbot hiện đại phụ thuộc rất nhiều vào việc tinh chỉnh hướng dẫn để xử lý các đoạn hội thoại phức tạp và thực hiện logic nhiều bước. Việc tinh chỉnh này đảm bảo rằng khi người dùng yêu cầu hệ thống định dạng dữ liệu dưới dạng đối tượng JSON, mô hình sẽ tuân thủ nghiêm ngặt ràng buộc đó thay vì tạo ra các đoạn hội thoại không cần thiết. Nghiên cứu của OpenAI về InstructGPT nhấn mạnh cách kỹ thuật này giảm thiểu các kết quả đầu ra không cần thiết và cải thiện sự phù hợp.
  • Mô hình Ngôn ngữ Thị giác (VLM): Trong thị giác máy tính , việc điều chỉnh lệnh được sử dụng để xây dựng các hệ thống thị giác linh hoạt, có thể nhận lệnh. Thay vì một quy trình phát hiện đối tượng cứng nhắc chỉ phát hiện một tập hợp các lớp cố định, một mô hình thị giác được điều chỉnh lệnh có thể xử lý một lệnh như "Tìm sản phẩm bị lỗi trên dây chuyền lắp ráp" và điều chỉnh tiêu điểm của nó một cách linh hoạt.

Để quản lý các tập dữ liệu chất lượng cao cần thiết cho các quy trình làm việc nâng cao này, các nhóm thường sử dụng Nền tảng Ultralytics , giúp đơn giản hóa việc chú thích dữ liệu, tổ chức dự án và triển khai đào tạo dựa trên đám mây.

Phân biệt các khái niệm liên quan

Để thiết kế đúng cách các quy trình xử lý dữ liệu AI, điều quan trọng là phải phân biệt giữa việc tinh chỉnh hướng dẫn và các kỹ thuật tối ưu hóa mô hình tương tự:

  • Điều chỉnh bằng gợi ý so với điều chỉnh bằng hướng dẫn : Điều chỉnh bằng gợi ý là một phương pháp tiết kiệm tham số, tối ưu hóa một tập hợp nhỏ các "gợi ý mềm" (các tensor có thể học được) trong khi giữ nguyên mô hình cơ bản. Ngược lại, điều chỉnh bằng hướng dẫn thường liên quan đến việc cập nhật toàn bộ mô hình (hoặc các phần quan trọng của nó) bằng cách sử dụng học có giám sát trên các tập dữ liệu hướng dẫn.
  • Tinh chỉnh so với tinh chỉnh theo hướng dẫn : Tinh chỉnh truyền thống điều chỉnh mô hình cho phù hợp với một lĩnh vực cụ thể (ví dụ: tài liệu y khoa) mà không nhất thiết phải dạy nó cách tuân theo các lệnh. Tinh chỉnh theo hướng dẫn là một tập hợp con riêng biệt của tinh chỉnh, được thiết kế rõ ràng để cải thiện việc thực thi nhiệm vụ và hiểu ngôn ngữ tự nhiên trên nhiều loại hướng dẫn khác nhau.

Áp dụng mô hình vào thực tiễn

Đối với các nhà phát triển xây dựng các quy trình xử lý hình ảnh máy tính tùy chỉnh, việc điều chỉnh mô hình nền tảng cho phù hợp với các ràng buộc nhiệm vụ cụ thể là một yêu cầu phổ biến. Trong khi việc tinh chỉnh toàn bộ hướng dẫn đòi hỏi các tập dữ liệu khổng lồ chuyên biệt, thì việc điều chỉnh các mô hình mạnh mẽ như Ultralytics YOLO26 cho các nhiệm vụ cụ thể trong từng lĩnh vực sử dụng các nguyên tắc tương tự về thích ứng có giám sát.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")

# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)

Bằng cách tận dụng các phương pháp huấn luyện tiên tiến này, các nhà phát triển có thể triển khai các hệ thống AI mạnh mẽ, có khả năng diễn giải và thực thi các lệnh phức tạp một cách đáng tin cậy, thu hẹp khoảng cách giữa lý thuyết học sâu và phần mềm thực tiễn, hướng đến người dùng. Để tìm hiểu thêm về các cơ chế huấn luyện, hãy tham khảo tài liệu chính thức PyTorch về huấn luyện mạng nơ-ron .

Tham gia Ultralytics cộng đồng

Tham gia vào tương lai của AI. Kết nối, hợp tác và phát triển cùng với những nhà đổi mới toàn cầu

Tham gia ngay