Instruction Tuning

Khám phá cách tinh chỉnh hướng dẫn (instruction tuning) căn chỉnh các model AI theo ý định của con người. Tìm hiểu cách huấn luyện Ultralytics YOLO26 và các model khác để tuân theo các chỉ thị cụ thể cho các tác vụ tốt hơn.

Instruction tuning là một kỹ thuật machine learning chuyên biệt được sử dụng để huấn luyện các model tuân theo những chỉ thị hoặc lệnh cụ thể từ người dùng. Khác với quá trình tiền huấn luyện (pre-training) tiêu chuẩn, vốn thường tập trung vào việc dự đoán từ tiếp theo trong chuỗi hoặc nhận diện các mẫu hình chung trong dữ liệu, instruction tuning tận dụng các tập dữ liệu được định dạng thành các tác vụ trực tiếp. Bằng cách cho model tiếp cận các cặp đầu vào-đầu ra được cấu trúc như các lệnh rõ ràng cùng phản hồi chính xác tương ứng, các lập trình viên có thể biến một foundation model đa năng thành một trợ lý định hướng tác vụ có khả năng phản hồi cao. Phương pháp này được sử dụng rộng rãi trong Generative AI để căn chỉnh các model theo ý định của con người, đảm bảo kết quả đầu ra phù hợp, an toàn và có thể thực thi.

Link to this sectionCách thức hoạt động của Instruction Tuning#

Quá trình này bao gồm việc cập nhật model weights của model bằng cách sử dụng một tập dữ liệu hướng dẫn đã qua chọn lọc kỹ lưỡng. Các tập dữ liệu này bao quát nhiều lĩnh vực đa dạng, từ giải các phương trình toán học đến phân tích hình ảnh. Trong quá trình huấn luyện, model học được mối quan hệ cấu trúc giữa cách diễn đạt mệnh lệnh của một hướng dẫn (ví dụ: "Tóm tắt văn bản này" hoặc "Xác định các đối tượng trong hình ảnh này") và định dạng đầu ra mong muốn. Các nghiên cứu gần đây, chẳng hạn như nghiên cứu về FLAN (Fine-tuned Language Net) của Google, chứng minh rằng các model được instruction tuning cho thấy khả năng zero-shot learning được cải thiện đáng kể trên các tác vụ chưa từng gặp trước đó.

Link to this sectionCác ứng dụng trong thực tế#

Instruction tuning đã mở ra những khả năng mang tính chuyển đổi trên cả phương thức văn bản và hình ảnh:

Trợ lý AI tương tác: Các chatbot hiện đại dựa nhiều vào instruction tuning để xử lý các cuộc hội thoại phức tạp và thực thi logic đa bước. Việc tinh chỉnh này đảm bảo rằng khi người dùng yêu cầu hệ thống định dạng dữ liệu thành đối tượng JSON, model sẽ tuân thủ nghiêm ngặt ràng buộc đó thay vì tạo ra nội dung hội thoại dư thừa. Nghiên cứu của OpenAI về InstructGPT làm nổi bật cách kỹ thuật này giảm thiểu các đầu ra độc hại và cải thiện khả năng căn chỉnh.
Vision-Language Models (VLM): Trong computer vision, instruction tuning được sử dụng để xây dựng các hệ thống thị giác linh hoạt, có thể nhận prompt. Thay vì một pipeline object detection cứng nhắc chỉ phát hiện một tập hợp các lớp cố định, một vision model đã qua instruction tuning có thể xử lý một lệnh như "Tìm sản phẩm lỗi trên dây chuyền lắp ráp" và điều chỉnh tiêu điểm của nó một cách linh hoạt.

Để quản lý các tập dữ liệu chất lượng cao cần thiết cho các quy trình làm việc nâng cao này, các nhóm thường sử dụng Ultralytics Platform, giúp đơn giản hóa việc chú thích dữ liệu, tổ chức dự án và triển khai huấn luyện trên nền tảng đám mây.

Link to this sectionPhân biệt các khái niệm liên quan#

Để kiến trúc các pipeline AI một cách đúng đắn, điều quan trọng là phải phân biệt instruction tuning với các kỹ thuật tối ưu hóa model tương tự:

Prompt Tuning so với Instruction Tuning: Prompt tuning là một phương pháp hiệu quả về tham số giúp tối ưu hóa một tập hợp nhỏ các "soft prompt" (các tensor có thể học được) trong khi vẫn giữ nguyên base model. Ngược lại, instruction tuning thường liên quan đến việc cập nhật toàn bộ model (hoặc các phần đáng kể của nó) bằng cách sử dụng supervised learning trên các tập dữ liệu hướng dẫn.
Fine-Tuning so với Instruction Tuning: Fine-tuning truyền thống thích nghi một model với một lĩnh vực cụ thể (ví dụ: tài liệu y khoa) mà không nhất thiết phải dạy nó cách tuân theo các mệnh lệnh. Instruction tuning là một tập con riêng biệt của fine-tuning được thiết kế rõ ràng để cải thiện khả năng thực thi tác vụ và natural language understanding trên một loạt các hướng dẫn đa dạng.

Link to this sectionThích nghi Model trong Thực tiễn#

Đối với các lập trình viên đang xây dựng các pipeline computer vision tùy chỉnh, việc thích nghi một foundation model với các ràng buộc tác vụ cụ thể là một yêu cầu phổ biến. Mặc dù full instruction tuning đòi hỏi các tập dữ liệu lớn chuyên biệt, việc thích nghi các model mạnh mẽ như Ultralytics YOLO26 cho các tác vụ trong lĩnh vực cụ thể cũng sử dụng các nguyên tắc thích nghi có giám sát tương tự.

from ultralytics import YOLO

# Load a pre-trained YOLO26 foundation model
model = YOLO("yolo26n.pt")

# Adapt the model weights to a custom task dataset using the PyTorch backend
# This process aligns the model's predictive capabilities with user-defined classes
results = model.train(data="custom_task.yaml", epochs=50, imgsz=640)

Bằng cách tận dụng các phương pháp luận huấn luyện tiên tiến này, các lập trình viên có thể triển khai các hệ thống AI mạnh mẽ giúp diễn giải và thực thi các lệnh phức tạp một cách đáng tin cậy, thu hẹp khoảng cách giữa deep learning lý thuyết và phần mềm thực tế, lấy người dùng làm trung tâm. Để đọc thêm về các cơ chế huấn luyện, hãy khám phá tài liệu chính thức của PyTorch về huấn luyện mạng thần kinh.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Instruction Tuning

Link to this sectionCách thức hoạt động của Instruction Tuning#

Link to this sectionCác ứng dụng trong thực tế#

Link to this sectionPhân biệt các khái niệm liên quan#

Link to this sectionThích nghi Model trong Thực tiễn#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!