Agentic Workflows

Khám phá cách các luồng công việc tác nhân (agentic workflows) cho phép các tác nhân AI tự chủ giải quyết các tác vụ phức tạp. Học cách tích hợp các công cụ thị giác tiên tiến như Ultralytics YOLO26.

Các quy trình làm việc dạng tác nhân đại diện cho một cách tiếp cận mang tính chuyển đổi trong trí tuệ nhân tạo (AI), nơi nhiều thực thể tự trị tương tác, đưa ra quyết định và thực hiện các tác vụ nhiều bước với sự can thiệp tối thiểu của con người. Khác với các pipeline học máy truyền thống tuân theo các đường dẫn thực thi tuyến tính, nghiêm ngặt, một quy trình làm việc dạng tác nhân có tính năng động cao. Nó cho phép một tác nhân thông minh hoặc một mạng lưới các tác nhân được phối hợp nhận thức môi trường, suy luận thông qua các vấn đề phức tạp và sử dụng các công cụ bên ngoài để đạt được các mục tiêu đã xác định trước. Khi các tổ chức mở rộng quy mô các sáng kiến AI của họ, các quy trình làm việc dạng tác nhân doanh nghiệp đang thay thế các tập lệnh cô lập, cho phép tự động hóa mạnh mẽ, có khả năng mở rộng trên nhiều ngành công nghiệp khác nhau.

Link to this sectionTìm hiểu về các quy trình làm việc dạng tác nhân#

Về cốt lõi, một quy trình làm việc dạng tác nhân chuyển dịch AI từ tạo lập thụ động sang giải quyết vấn đề chủ động. Điều này đòi hỏi sự chuyển đổi từ các tương tác đơn lẻ dựa trên prompt sang một vòng lặp lặp lại của việc lập kế hoạch, thực thi và quan sát. Bằng cách điều phối các vòng lặp này, các nhà phát triển có thể xây dựng các hệ thống có khả năng xử lý các trường hợp biên bất ngờ và tự sửa lỗi.

Để phân biệt rõ ràng các khái niệm có liên quan chặt chẽ: một tác nhân AI là thực thể tự trị cá nhân (thường được vận hành bởi một mô hình ngôn ngữ lớn (LLM)) có khả năng suy luận và hành động. Ngược lại, quy trình làm việc dạng tác nhân là quá trình kiến trúc tổng thể điều hành cách các tác nhân này cộng tác, chia sẻ bộ nhớ và sắp xếp thứ tự hành động của chúng. Hơn nữa, trong khi AI tạo sinh chủ yếu tạo nội dung trong một lần truyền tuyến tính dựa trên prompt của người dùng, các hệ thống tác nhân sử dụng các mô hình thiết kế tác nhân—chẳng hạn như tự phản ánh, lập kế hoạch và tranh luận đa tác nhân—để liên tục tinh chỉnh đầu ra của chúng cho đến khi mục tiêu được đáp ứng hoàn toàn.

Link to this sectionCác thành phần cốt lõi#

Một vài yếu tố nền tảng thúc đẩy sự thành công của các quy trình làm việc này:

Nền tảng LLM: Các công cụ suy luận trung tâm của quy trình làm việc. Các khung làm việc điều phối các mô hình hiện đại như GPT-4o của OpenAI để diễn giải ý định của người dùng và tạo ra các kế hoạch thực thi một cách linh hoạt.
Gọi hàm và sử dụng công cụ: Các tác nhân được trang bị các công cụ cụ thể để tương tác với thế giới bên ngoài. Điều này bao gồm việc truy vấn cơ sở dữ liệu, thực thi mã hoặc gọi các mô hình thị giác máy tính để phân tích dữ liệu hình ảnh. Tài liệu từ các nhà cung cấp như OpenAI về gọi hàm phác thảo cách các mô hình định dạng đầu ra để kích hoạt các API bên ngoài một cách đáng tin cậy.
Khung điều phối: Các thư viện như LangGraph, CrewAI, và Microsoft AutoGen cung cấp cơ sở hạ tầng quan trọng để kết nối các tác nhân, quản lý trạng thái hội thoại và định tuyến tác vụ một cách thông minh.
Quản lý bộ nhớ và ngữ cảnh: Để ngăn chặn ảo giác và duy trì tính nhất quán trên các quy trình nhiều bước, các quy trình làm việc lưu giữ bộ nhớ ngắn hạn (cửa sổ ngữ cảnh hội thoại hiện tại) và bộ nhớ dài hạn (cơ sở dữ liệu bền bỉ) để học hỏi từ các tương tác trong quá khứ.

Link to this sectionCác ứng dụng trong thực tế#

Các quy trình làm việc dạng tác nhân đang chủ động giải quyết các tác vụ phức tạp, mở trong thế giới thực:

Kiểm tra thị giác tự trị: Trong sản xuất, một hệ thống tác nhân có thể tự động hóa việc phát hiện lỗi. Một tác nhân điều phối sẽ kích hoạt công cụ máy ảnh để chụp ảnh, xử lý nó bằng mô hình phát hiện đối tượng và phân tích kết quả. Nếu phát hiện lỗi, tác nhân sẽ tự động ghi nhật ký phiếu bảo trì và định tuyến sản phẩm để kiểm tra thủ công, quản lý toàn bộ phản hồi của nhà máy.
Phân tích tài liệu thông minh: Trong các lĩnh vực tài chính và pháp lý, các quy trình làm việc được thiết kế để trích xuất dữ liệu có cấu trúc từ các tệp PDF không có cấu trúc. Các tác nhân áp dụng lặp đi lặp lại việc phát hiện bố cục, sử dụng kỹ thuật prompt có mục tiêu để tự sửa lỗi và xác minh các bảng đã trích xuất dựa trên các lược đồ tài chính dự kiến.
Vận hành tiếp thị năng động: Các nhóm tiếp thị có tư duy tiến bộ đang tái tạo các quy trình tiếp thị bằng cách triển khai các tác nhân tự động phân tích xu hướng hiện tại, tạo nội dung chiến dịch, thử nghiệm các biến thể nội dung quảng cáo và điều chỉnh chiến lược ngân sách dựa trên các số liệu hiệu suất theo thời gian thực.

Link to this sectionVí dụ: Xây dựng quy trình làm việc tác nhân thị giác#

Việc tích hợp trí tuệ thị giác vào một quy trình làm việc dạng tác nhân rất đơn giản khi sử dụng Ultralytics Platform và gói ultralytics Python. Trong ví dụ khái niệm này, một hệ thống tác nhân sử dụng YOLO26 làm công cụ nhận thức để kiểm tra dây chuyền sản xuất, cho phép logic cơ bản của quy trình làm việc tự động quyết định hành động tiếp theo dựa trên kết quả của chế độ dự đoán.

from ultralytics import YOLO

# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Agentic workflow step 1: Vision tool gathers environmental data
results = model.predict("factory_line.jpg")


# Agentic workflow step 2: Agent logic evaluates the visual detections
def decision_agent(detections):
    for obj in detections:
        # Check if the model detected a specific class, e.g., 'defect'
        if obj.names[int(obj.cls)] == "defect":
            return "Action: Trigger immediate maintenance alert."
    return "Action: Continue production line smoothly."


# Execute the agent's decision logic based on bounding box data
action = decision_agent(results[0].boxes)
print(action)

Bằng cách tận dụng các khung làm việc như PyTorch ở phía dưới, các công cụ thị giác này cung cấp nhận thức không gian có độ chính xác cao vào logic AI rộng hơn. Khi các tổ chức tác nhân tiếp tục trưởng thành, sự kết hợp giữa các mô hình suy luận tiên tiến và khả năng thị giác thời gian thực sẽ thúc đẩy thế hệ tự động hóa tự sửa lỗi, thông minh tiếp theo. Thông qua cải tiến liên tục nhờ học máy chủ động và điều phối tinh vi, các quy trình làm việc dạng tác nhân đảm bảo rằng các hệ thống AI thực hiện đáng tin cậy các chiến lược phức tạp từ đầu đến cuối.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Agentic Workflows

Link to this sectionTìm hiểu về các quy trình làm việc dạng tác nhân#

Link to this sectionCác thành phần cốt lõi#

Link to this sectionCác ứng dụng trong thực tế#

Link to this sectionVí dụ: Xây dựng quy trình làm việc tác nhân thị giác#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!