Khám phá phương pháp gợi ý Chuỗi suy nghĩ (Chain-of-Thought - CoT) để tăng cường khả năng suy luận của AI. Tìm hiểu cách chia nhỏ nhiệm vụ thành các bước logic giúp cải thiện việc tạo mã. Ultralytics YOLO26.
Phương pháp gợi ý Chuỗi suy nghĩ (Chain-of-Thought - CoT) là một kỹ thuật tiên tiến trong kỹ thuật tạo lời nhắc, cho phép các mô hình ngôn ngữ lớn (LLM) giải quyết các nhiệm vụ suy luận phức tạp bằng cách chia nhỏ chúng thành các bước logic trung gian. Thay vì yêu cầu mô hình cung cấp câu trả lời cuối cùng ngay lập tức, CoT khuyến khích hệ thống tạo ra một "chuỗi suy nghĩ" mô phỏng quá trình giải quyết vấn đề của con người. Quá trình suy luận từng bước này cải thiện đáng kể hiệu suất trong các nhiệm vụ liên quan đến số học, logic ký hiệu và suy luận thông thường, làm thay đổi cách chúng ta tương tác với các hệ thống Trí tuệ nhân tạo (AI) .
Các mô hình ngôn ngữ tiêu chuẩn thường gặp khó khăn với các bài toán nhiều bước vì chúng cố gắng ánh xạ trực tiếp đầu vào đến đầu ra chỉ trong một lần xử lý. Cách tiếp cận "hộp đen" này có thể dẫn đến lỗi, đặc biệt khi bước nhảy logic quá lớn. Phương pháp gợi ý theo chuỗi suy luận giải quyết vấn đề này bằng cách chèn các bước suy luận giữa câu hỏi đầu vào và đầu ra cuối cùng.
Quá trình này thường diễn ra theo hai cách:
Bằng cách tạo ra các lập luận trung gian một cách rõ ràng, mô hình có nhiều cơ hội hơn để tự sửa lỗi và cung cấp sự minh bạch về cách nó đi đến kết luận. Điều này rất quan trọng để giảm thiểu ảo giác trong các mô hình học tập tuyến tính (LLM) , nơi mà nếu không có điều này, các mô hình có thể tự tin đưa ra những thông tin không chính xác.
Mặc dù ban đầu được phát triển cho logic dựa trên văn bản, phương pháp gợi ý bằng chuỗi suy nghĩ (Chain-of-Thought prompting) có những ứng dụng mạnh mẽ khi kết hợp với các lĩnh vực trí tuệ nhân tạo khác, chẳng hạn như thị giác máy tính và tạo mã.
Các nhà phát triển sử dụng CoT để hướng dẫn các LLM viết các kịch bản phần mềm phức tạp cho các tác vụ như phát hiện đối tượng. Thay vì một yêu cầu mơ hồ như "viết mã để tìm ô tô", một lời nhắc CoT có thể cấu trúc yêu cầu như sau: "Đầu tiên, nhập các thư viện cần thiết. Thứ hai, tải mô hình đã được huấn luyện trước. Thứ ba, xác định nguồn hình ảnh. Cuối cùng, chạy vòng lặp dự đoán." Cách tiếp cận có cấu trúc này đảm bảo mã được tạo ra cho các mô hình như YOLO26 là chính xác về mặt cú pháp và logic.
Trong lĩnh vực xe tự hành , các hệ thống phải xử lý dữ liệu hình ảnh và đưa ra các quyết định quan trọng về an toàn. Phương pháp Chuỗi tư duy cho phép hệ thống diễn đạt logic của nó: "Tôi detect Một người đi bộ gần vạch kẻ đường. Người đi bộ đang quay mặt về phía đường. Đèn giao thông đang xanh đối với tôi, nhưng người đi bộ có thể bước ra bất cứ lúc nào. Do đó, tôi sẽ giảm tốc độ và chuẩn bị dừng lại." Điều này giúp các quyết định của AI có thể giải thích được và phù hợp với các nguyên tắc Trí tuệ nhân tạo có thể giải thích (XAI) .
Mặc dù CoT chủ yếu là một kỹ thuật xử lý ngôn ngữ tự nhiên, nhưng nó có thể được triển khai bằng lập trình để đảm bảo tương tác nhất quán với các mô hình thị giác. Tiếp theo là... Python Ví dụ này minh họa cách một nhà phát triển có thể cấu trúc một lời nhắc để hướng dẫn một LLM (được mô phỏng ở đây) tạo ra mã suy luận hợp lệ cho Nền tảng Ultralytics .
# Example of structuring a Chain-of-Thought prompt for an LLM
# This prompt guides the model to write a valid YOLO26 inference script
cot_prompt = """
Task: Write a Python script to detect objects using YOLO26.
Chain of Thought:
1. Import the YOLO class from the 'ultralytics' library.
2. Load the 'yolo26n.pt' model weights (the latest nano model).
3. Load a sample image using a URL or local path.
4. Run the predict() function and save the results.
Based on these steps, generate the Python code below:
"""
# In a real application, you would send 'cot_prompt' to an LLM API
print(f"Structured Prompt for LLM:\n{cot_prompt}")
Điều quan trọng là phải phân biệt phương pháp gợi ý bằng chuỗi suy nghĩ (Chain-of-Thought prompting) với các thuật ngữ tương tự trong lĩnh vực Học máy (Machine Learning - ML) :
Khi các mô hình nền tảng tiếp tục phát triển, việc sử dụng phương pháp gợi ý chuỗi suy nghĩ (Chain-of-Thought prompting) đang trở thành một phương pháp thực hành tốt nhất để khai thác tối đa tiềm năng của chúng. Nghiên cứu từ các nhóm như Google DeepMind cho thấy rằng khi mô hình tăng kích thước, khả năng thực hiện suy luận chuỗi suy nghĩ của chúng được cải thiện đáng kể. Sự phát triển này đang mở đường cho các tác nhân tự động đáng tin cậy hơn, có khả năng xử lý các quy trình công việc phức tạp trong các ngành công nghiệp từ chăm sóc sức khỏe đến sản xuất thông minh .