Thuật ngữ

Gợi ý chuỗi suy nghĩ

Tăng cường lý luận AI với nhắc nhở chuỗi suy nghĩ! Tăng cường độ chính xác, tính minh bạch và khả năng ghi nhớ ngữ cảnh cho các tác vụ phức tạp, nhiều bước.

Xe lửa YOLO mô hình đơn giản
với Ultralytics TRUNG TÂM

Tìm hiểu thêm

Nhắc nhở Chuỗi suy nghĩ (CoT) là một kỹ thuật nâng cao được sử dụng chủ yếu với các Mô hình ngôn ngữ lớn (LLM) để cải thiện khả năng thực hiện các nhiệm vụ lý luận phức tạp của chúng. Thay vì chỉ yêu cầu câu trả lời cuối cùng, CoT khuyến khích mô hình tạo ra các bước trung gian hoặc một 'chuỗi suy nghĩ' dẫn đến giải pháp một cách hợp lý. Phương pháp này mô phỏng các quy trình giải quyết vấn đề của con người và giúp các mô hình giải quyết các vấn đề đòi hỏi số học, lý lẽ thông thường hoặc lý luận tượng trưng hiệu quả hơn, thường dẫn đến độ chính xác tốt hơn đáng kể. Kỹ thuật này được nêu bật đáng chú ý trong nghiên cứu từ Google AI .

Cách thức hoạt động của chuỗi suy nghĩ

CoT hướng dẫn mô hình AI bằng cách chỉ rõ cách phân tích vấn đề. Có hai biến thể chính:

  1. Few-Shot CoT: Lời nhắc bao gồm một vài ví dụ (ảnh) trong đó mỗi ví dụ bao gồm một câu hỏi, một quy trình lý luận từng bước chi tiết (chuỗi suy nghĩ) và câu trả lời cuối cùng. Mô hình học hỏi từ những ví dụ này để áp dụng một quy trình lý luận tương tự cho câu hỏi thực tế được hỏi. Đây là một hình thức học tập few-shot được áp dụng cho các lộ trình lý luận.
  2. Zero-Shot CoT: Cách tiếp cận đơn giản hơn này không yêu cầu cung cấp ví dụ. Thay vào đó, một hướng dẫn đơn giản như "Hãy suy nghĩ từng bước" được thêm vào câu hỏi. Gợi ý này khuyến khích mô hình diễn đạt quá trình lý luận của mình trước khi đưa ra câu trả lời cuối cùng. Nó tận dụng các khả năng vốn có của mô hình đã học được trong quá trình đào tạo trước mở rộng của nó.

Bằng cách đưa ra các bước lý luận bên ngoài, CoT làm cho quy trình của mô hình minh bạch hơn và cho phép gỡ lỗi dễ dàng hơn về nơi lý luận có thể sai. Nó trái ngược với lời nhắc tiêu chuẩn, thường yêu cầu câu trả lời trực tiếp và có thể thất bại trong các tác vụ đòi hỏi nhiều bước logic.

Lợi ích và ứng dụng

Lợi ích chính của việc nhắc nhở CoT là khả năng nâng cao khả năng lý luận của LLM đối với các nhiệm vụ phức tạp mà việc nhắc nhở tiêu chuẩn gặp khó khăn. Những lợi thế chính bao gồm:

  • Hiệu suất được cải thiện: Tăng đáng kể độ chính xác trong các nhiệm vụ như giải bài toán bằng lời, câu đố logic và trả lời câu hỏi nhiều bước.
  • Tính minh bạch được cải thiện: Chuỗi suy nghĩ được tạo ra cung cấp thông tin chi tiết về quá trình suy luận của mô hình, góp phần vào AI có thể giải thích được (XAI) .
  • Xử lý độ phức tạp tốt hơn: Cho phép các mô hình giải quyết các vấn đề đòi hỏi phải phân chia chúng thành các bước nhỏ hơn, dễ quản lý hơn.

Ví dụ thực tế:

  1. Hỗ trợ khách hàng phức tạp: Một chatbot AI sử dụng CoT có thể xử lý các vấn đề phức tạp của khách hàng, chẳng hạn như khắc phục sự cố kỹ thuật nhiều phần hoặc giải thích yêu cầu thanh toán phức tạp. Lời nhắc CoT hướng dẫn AI xác định vấn đề cốt lõi trước, sau đó nhớ lại các chính sách hoặc bước kỹ thuật có liên quan, kiểm tra lịch sử người dùng nếu cần và cuối cùng lập kế hoạch giải quyết từng bước cho khách hàng. Điều này hiệu quả hơn là trực tiếp đoán giải pháp. Các nền tảng như Salesforce Einstein tận dụng lý luận tương tự cho dịch vụ khách hàng.
  2. Phân tích và diễn giải dữ liệu: Khi được trình bày với một tập dữ liệu và một truy vấn phức tạp (ví dụ: "Xác định các yếu tố chính góp phần vào sự sụt giảm doanh số trong quý trước dựa trên báo cáo này"), một LLM sử dụng CoT có thể phác thảo kế hoạch phân tích của mình: đầu tiên, xác định các điểm dữ liệu có liên quan; thứ hai, thực hiện các phép tính hoặc so sánh cần thiết; thứ ba, tổng hợp các phát hiện; và cuối cùng, trình bày kết luận. Cách tiếp cận có cấu trúc này cải thiện độ tin cậy của thông tin phân tích dữ liệu do AI tạo ra.

CoT đặc biệt có giá trị trong các lĩnh vực đòi hỏi khả năng ra quyết định đáng tin cậy và phức tạp, chẳng hạn như hỗ trợ phân tích hình ảnh y tế hoặc mô hình tài chính, bổ sung cho những tiến bộ trong các lĩnh vực như thị giác máy tính (CV) được thúc đẩy bởi các mô hình như Ultralytics YOLO .

So sánh với các khái niệm liên quan

Việc nhắc nhở CoT có liên quan nhưng khác biệt với các kỹ thuật khác trong xử lý ngôn ngữ tự nhiên (NLP)học máy (ML) :

  • Kỹ thuật nhắc nhở : Đây là phương pháp chung để thiết kế các đầu vào hiệu quả (lời nhắc) cho các mô hình AI. CoT là một kỹ thuật kỹ thuật nhắc nhở cụ thể, nâng cao tập trung vào việc gợi ra lý luận. Các kỹ thuật khác có thể tập trung vào tính rõ ràng, cung cấp ngữ cảnh ( Làm giàu lời nhắc ) hoặc chỉ định định dạng.
  • Chuỗi nhắc nhở : Chuỗi nhắc nhở liên quan đến việc chia nhỏ một tác vụ phức tạp thành một chuỗi các lời nhắc đơn giản hơn, được kết nối với nhau, trong đó đầu ra của một lời nhắc trở thành đầu vào cho lời nhắc tiếp theo. Điều này thường đòi hỏi sự phối hợp bên ngoài (ví dụ: sử dụng các khuôn khổ như LangChain ). Ngược lại, CoT hướng đến việc đưa ra toàn bộ quá trình lý luận trong một tương tác nhắc nhở-phản hồi duy nhất.
  • Zero-shot Learning : Điều này đề cập đến khả năng của một mô hình thực hiện các nhiệm vụ mà nó không được đào tạo rõ ràng, mà không có bất kỳ ví dụ nào. Zero-shot CoT là một ứng dụng cụ thể của điều này, sử dụng một hướng dẫn chung ("Hãy suy nghĩ từng bước") để kích hoạt lý luận. Tuy nhiên, CoT thường hoạt động tốt hơn trong cài đặt few-shot, cung cấp các ví dụ lý luận cụ thể cho nhiệm vụ, không giống như zero-shot learning thuần túy.

Nhắc nhở CoT là một bước tiến quan trọng hướng tới việc xây dựng các hệ thống Trí tuệ nhân tạo (AI) có khả năng diễn giải và có năng lực hơn. Việc hiểu và sử dụng các kỹ thuật như vậy có thể có lợi khi phát triển các mô hình AI tinh vi, có khả năng tận dụng các nền tảng như Ultralytics HUB để quản lý đào tạotriển khai . Các kỹ thuật như Tự nhất quán có thể cải thiện CoT hơn nữa bằng cách lấy mẫu nhiều đường dẫn lý luận và chọn câu trả lời nhất quán nhất.

Đọc tất cả