Yolo Tầm nhìn Thâm Quyến
Thâm Quyến
Tham gia ngay
Bảng chú giải thuật ngữ

Cây Tư Duy (Tree of Thoughts - ToT)

Khám phá khung tư duy Cây Tư Duy (Tree of Thoughts - ToT) để nâng cao khả năng suy luận LLM. Tìm hiểu cách triển khai tìm kiếm có cấu trúc và logic đa bước với Ultralytics YOLO26.

Cây Tư Duy (Tree of Thoughts - ToT) là một khung lý luận tiên tiến được thiết kế để nâng cao khả năng giải quyết vấn đề của các Mô hình Ngôn ngữ Lớn (Large Language Models - LLMs) . Không giống như các phương pháp gợi ý tuyến tính truyền thống, ToT cho phép các mô hình khám phá nhiều con đường lý luận cùng một lúc, giống như việc khám phá các nhánh của một cái cây. Ở mỗi bước, mô hình tạo ra một số "suy nghĩ" khả thi hoặc các bước lý luận trung gian, đánh giá tính khả thi của chúng và chủ động quyết định con đường nào nên theo đuổi, tạm dừng hoặc từ bỏ. Cách tiếp cận này phản ánh quá trình giải quyết vấn đề của con người, nơi chúng ta thường xem xét nhiều khả năng khác nhau, kiểm tra giả thuyết trong đầu và quay lại nếu nhận ra một cách tiếp cận nào đó có sai sót.

Phân biệt giữa Cây tư duy và Chuỗi tư duy

Khi tìm hiểu các chiến lược gợi ý, điều quan trọng là phải phân biệt Cây tư duy (Tree of Thoughts - ToT) với Chuỗi suy luận (Chain-of-Thought Prompting - CoT). CoT hướng dẫn mô hình tuân theo một chuỗi các bước logic tuyến tính duy nhất để đi đến kết luận. Mặc dù rất hiệu quả đối với nhiều nhiệm vụ, CoT không thể phục hồi nếu mắc lỗi ngay từ đầu chuỗi. Ngược lại, ToT duy trì rõ ràng cấu trúc cây với nhiều đường dẫn suy luận. Bằng cách sử dụng các thuật toán tìm kiếm theo chiều rộng hoặc chiều sâu , ToT có thể quay lại từ các ngõ cụt và chuyển hướng đến các nhánh khả thi hơn, giúp nó mạnh mẽ hơn đáng kể đối với các nhiệm vụ Trí tuệ nhân tạo tạo sinh phức tạp.

Ứng dụng thực tiễn của cây tư duy

Khả năng nhìn xa trông rộng và đánh giá nhiều kết quả khác nhau khiến ToT trở nên vô cùng giá trị trong nhiều ngành công nghiệp đòi hỏi tư duy logic phức tạp.

  • Các tác nhân AI tự động sử dụng công nghệ lý thuyết (ToT) để lập kế hoạch chiến lược trong môi trường năng động. Ví dụ, trong lĩnh vực hậu cần, một tác nhân có thể lập ra nhiều kịch bản định tuyến khác nhau, đánh giá tác động dây chuyền của tắc nghẽn giao thông hoặc sự chậm trễ do thời tiết trước khi lựa chọn tuyến đường tối ưu.
  • Trong các quy trình xử lý hình ảnh máy tính tiên tiến, ToT (Total To To T) hỗ trợ suy luận hình ảnh nhiều bước. Khi được triển khai cùng với các mô hình phát hiện đối tượng tốc độ cao như Ultralytics YOLO26 , một mô hình suy luận có thể đánh giá một khung cảnh trực quan, tạo ra các giả thuyết về các mối nguy hiểm tiềm tàng về an toàn trong sản xuất thông minh và quay lại nếu việc kiểm tra trực quan kỹ hơn bác bỏ giả thuyết ban đầu.

Tích hợp dữ liệu thị giác vào các nhánh suy luận

Khi xây dựng các hệ thống suy luận, nhận thức thị giác đóng vai trò là đầu vào cảm giác cho cây logic của mô hình. Bạn có thể dễ dàng tích hợp dữ liệu phát hiện thời gian thực vào mô hình suy luận OpenAI hoặc tác nhân đánh giá các nhánh. Ví dụ sau đây minh họa cách trích xuất dữ liệu môi trường bằng YOLO26, có thể đóng vai trò là chức năng đánh giá nút trong khuôn khổ ToT rộng hơn.

from ultralytics import YOLO

# Load Ultralytics YOLO26 to analyze visual states for a reasoning tree
model = YOLO("yolo26n.pt")
results = model("https://ultralytics.com/images/bus.jpg")


def evaluate_thought_state(detections):
    # Returns True if a 'bus' is found, prompting the ToT agent to explore this logic branch
    return any(model.names[int(box.cls)] == "bus" for box in detections[0].boxes)


print(f"Is this reasoning branch viable? {evaluate_thought_state(results)}")

Tương lai của suy luận AI có cấu trúc

Khi các nhà nghiên cứu tại các tổ chức như Google DeepMind tiếp tục tinh chỉnh việc đánh giá theo phương pháp heuristic, việc tích hợp ToT vào quy trình làm việc AI hàng ngày đang được đẩy nhanh. Chúng ta đang tiến gần hơn đến trí tuệ nhân tạo tổng quát (AGI) , nơi các mô hình kết hợp liền mạch việc học đa phương thức với tìm kiếm có cấu trúc. Các nhóm xây dựng các ứng dụng thế hệ tiếp theo này dựa vào cơ sở hạ tầng mạnh mẽ, chẳng hạn như Nền tảng Ultralytics , để quản lý các tập dữ liệu phức tạp cần thiết để huấn luyện cả lớp nhận thức và lớp suy luận của các hệ thống AI hiện đại. Đối với những người muốn tìm hiểu sâu hơn về toán học đằng sau các đồ thị tính toán động hỗ trợ các mô hình này, tài liệu chính thức PyTorch vẫn là một nguồn tài liệu vô giá.

Tăng sức mạnh với Ultralytics YOLO

Nhận AI thị giác tiên tiến cho các dự án của bạn. Tìm giấy phép phù hợp với mục tiêu của bạn ngay hôm nay.

Tìm hiểu các tùy chọn cấp phép