Agentic Workflows
Khám phá cách các quy trình làm việc agentic cho phép các tác nhân AI tự chủ giải quyết các tác vụ phức tạp. Tìm hiểu cách tích hợp các công cụ thị giác tiên tiến như Ultralytics YOLO26.
Agentic workflows đại diện cho một phương pháp mang tính chuyển đổi trong trí tuệ nhân tạo (AI), nơi nhiều thực thể tự trị tương tác, đưa ra quyết định và thực thi các tác vụ gồm nhiều bước với sự can thiệp tối thiểu của con người. Khác với các pipeline machine learning truyền thống tuân theo các lộ trình thực thi tuyến tính, nghiêm ngặt, agentic workflow có tính năng động cao. Nó cho phép một tác nhân thông minh hoặc một mạng lưới các tác nhân được phối hợp có thể nhận thức môi trường, suy luận qua các vấn đề phức tạp và sử dụng các công cụ bên ngoài để đạt được các mục tiêu đã xác định trước. Khi các tổ chức mở rộng quy mô các sáng kiến AI của họ, enterprise agentic workflows đang thay thế các tập lệnh cô lập, cho phép tự động hóa mạnh mẽ, có khả năng mở rộng trên nhiều ngành công nghiệp đa dạng.
Tìm hiểu về Agentic Workflows
Về cốt lõi, một agentic workflow chuyển đổi AI từ việc tạo nội dung thụ động sang giải quyết vấn đề chủ động. Điều này đòi hỏi sự chuyển đổi từ các tương tác prompt đơn lẻ sang một vòng lặp lặp đi lặp lại của việc lập kế hoạch, thực thi và quan sát. Bằng cách điều phối các vòng lặp này, các nhà phát triển có thể xây dựng các hệ thống có khả năng xử lý các trường hợp biên (edge case) bất ngờ và tự sửa lỗi của chính mình.
Để phân biệt rõ ràng các khái niệm có liên quan chặt chẽ: một AI agent là thực thể tự trị cá nhân (thường được hỗ trợ bởi một mô hình ngôn ngữ lớn (LLM)) có khả năng suy luận và hành động. Ngược lại, agentic workflow là quy trình kiến trúc bao trùm, quản lý cách các tác nhân này cộng tác, chia sẻ bộ nhớ và sắp xếp thứ tự các hành động của chúng. Hơn nữa, trong khi generative AI chủ yếu tạo nội dung trong một lần chuyển tiếp tuyến tính dựa trên prompt của người dùng, các hệ thống agentic sử dụng các mẫu thiết kế agentic—như tự phản ánh, lập kế hoạch và tranh luận giữa nhiều tác nhân—để liên tục tinh chỉnh đầu ra của chúng cho đến khi đạt được mục tiêu hoàn toàn.
Các thành phần cốt lõi
Một số yếu tố nền tảng thúc đẩy sự thành công của các quy trình này:
- LLM backbones: Các công cụ suy luận trung tâm của quy trình. Các framework điều phối các mô hình tiên tiến như GPT-4o của OpenAI để diễn giải ý định của người dùng và tạo ra các kế hoạch thực thi một cách linh hoạt.
- Function calling và sử dụng công cụ: Các tác nhân được trang bị các công cụ cụ thể để tương tác với thế giới bên ngoài. Điều này bao gồm truy vấn cơ sở dữ liệu, thực thi code hoặc gọi các mô hình computer vision để phân tích dữ liệu hình ảnh. Tài liệu từ các nhà cung cấp như OpenAI về function calling phác thảo cách các mô hình định dạng đầu ra để kích hoạt các API bên ngoài một cách đáng tin cậy.
- Các framework điều phối: Các thư viện như LangGraph, CrewAI và Microsoft AutoGen cung cấp cơ sở hạ tầng quan trọng để kết nối các tác nhân, quản lý trạng thái hội thoại và định tuyến tác vụ một cách thông minh.
- Quản lý bộ nhớ và ngữ cảnh: Để ngăn chặn ảo giác và duy trì tính nhất quán trên các quy trình gồm nhiều bước, các quy trình giữ lại bộ nhớ ngắn hạn (cửa sổ ngữ cảnh hội thoại hiện tại) và bộ nhớ dài hạn (cơ sở dữ liệu bền vững) để học hỏi từ các tương tác trong quá khứ.
Các ứng dụng thực tế
Agentic workflows đang tích cực giải quyết các tác vụ phức tạp, mở trong thế giới thực:
-
Kiểm tra hình ảnh tự trị: Trong sản xuất, một hệ thống agentic có thể tự động hóa việc phát hiện lỗi. Một tác nhân điều phối kích hoạt một công cụ camera để chụp ảnh, xử lý nó bằng cách sử dụng mô hình object detection và phân tích đầu ra. Nếu tìm thấy lỗi, tác nhân sẽ tự động đăng ký một phiếu bảo trì và định tuyến sản phẩm để kiểm tra thủ công, quản lý toàn bộ phản ứng của nhà máy.
-
Phân tích tài liệu thông minh: Trong lĩnh vực tài chính và pháp lý, các quy trình được thiết kế để trích xuất dữ liệu có cấu trúc từ các tệp PDF không có cấu trúc. Các tác nhân áp dụng lặp đi lặp lại việc phát hiện bố cục, sử dụng prompt engineering có mục tiêu để tự sửa lỗi và xác minh các bảng được trích xuất so với các lược đồ tài chính dự kiến.
-
Vận hành Marketing động: Các nhóm tiếp thị tư duy tiến bộ đang tái tạo các quy trình tiếp thị bằng cách triển khai các tác nhân tự động phân tích các xu hướng hiện tại, tạo ra các tài sản chiến dịch, kiểm tra các biến thể nội dung quảng cáo và điều chỉnh các chiến lược ngân sách dựa trên các số liệu hiệu suất thời gian thực.
Ví dụ: Xây dựng quy trình Vision-Agent
Việc tích hợp thị giác thông minh vào một agentic workflow rất đơn giản khi sử dụng Ultralytics Platform và gói ultralytics Python. Trong ví dụ khái niệm này, một hệ thống agentic sử dụng YOLO26 làm công cụ nhận thức để kiểm tra một dây chuyền sản xuất, cho phép logic cơ bản của quy trình tự động quyết định hành động tiếp theo dựa trên kết quả của predict mode.
from ultralytics import YOLO
# Load the recommended Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Agentic workflow step 1: Vision tool gathers environmental data
results = model.predict("factory_line.jpg")
# Agentic workflow step 2: Agent logic evaluates the visual detections
def decision_agent(detections):
for obj in detections:
# Check if the model detected a specific class, e.g., 'defect'
if obj.names[int(obj.cls)] == "defect":
return "Action: Trigger immediate maintenance alert."
return "Action: Continue production line smoothly."
# Execute the agent's decision logic based on bounding box data
action = decision_agent(results[0].boxes)
print(action)Bằng cách tận dụng các framework như PyTorch bên dưới, các công cụ thị giác này cung cấp nhận thức không gian có độ chính xác cao vào logic AI rộng hơn. Khi các tổ chức agentic tiếp tục trưởng thành, sự kết hợp giữa các mô hình suy luận tiên tiến và khả năng thị giác thời gian thực sẽ thúc đẩy thế hệ tiếp theo của tự động hóa thông minh, tự sửa lỗi. Thông qua việc cải tiến liên tục bằng active learning và điều phối phức tạp, agentic workflows đảm bảo rằng các hệ thống AI thực thi các chiến lược phức tạp một cách đáng tin cậy từ đầu đến cuối.






