Đón xem YOLO Vision 2025!
25 tháng 9, 2025
10:00 — 18:00 BST
Sự kiện kết hợp
Yolo Vision 2024

Agentic AI và computer vision: Tương lai của tự động hóa

Abirami Vina

4 phút đọc

12 tháng 2, 2025

Tìm hiểu cách các hệ thống AI đại diện sử dụng các mô hình thị giác máy tính để tự động phân tích dữ liệu trực quan, học hỏi từ kinh nghiệm và thích ứng với các điều kiện thay đổi.

Trí tuệ nhân tạo (AI) và thị giác máy tính giúp máy móc nhìn và hiểu thế giới. Nhờ những tiến bộ gần đây, chúng ta hiện đang chứng kiến một bước tiến vượt bậc - những đổi mới AI không chỉ nhận thức mà còn suy nghĩ, lập kế hoạch và hành động một cách độc lập. Trong một bài viết trước, chúng tôi đã thảo luận về cách Vision agents có thể xử lý dữ liệu trực quan, phân tích nó và hành động. 

Hôm nay, chúng ta sẽ khám phá một khái niệm tương tự: AI tác nhân. Các hệ thống AI tác nhân được thiết kế để hoạt động độc lập và có khả năng lý luận và giải quyết vấn đề giống như con người để đạt được các mục tiêu đã xác định. Không giống như các hệ thống AI truyền thống, tập trung vào việc hoàn thành các tác vụ riêng lẻ với các hướng dẫn được xác định trước, AI tác nhân có thể lập kế hoạch và hành động tự chủ để thực hiện các tác vụ. Các tác nhân này thậm chí có thể học hỏi từ các tương tác trước đó và thực hiện các quyết định mà không cần bất kỳ sự can thiệp nào của con người. 

Đối với thị giác máy tính, các hệ thống AI chủ động có thể tận dụng các kỹ thuật như phát hiện đối tượng bằng các mô hình thị giác máy tính như Ultralytics YOLO11 để phân tích dữ liệu trực quan trong thời gian thực, nhận dạng đối tượng, hiểu các mối quan hệ không gian và đưa ra các quyết định tự động dựa trên môi trường của chúng.

Agentic AI là gì?

Về cốt lõi, các hệ thống AI tác tử được thiết kế với tư duy tự chủ, định hướng mục tiêu, khả năng giải quyết vấn đề thích ứng và khả năng học hỏi liên tục. Chúng sử dụng các tác tử AI để hiểu môi trường của chúng, đưa ra quyết định và thực hiện các nhiệm vụ. Các tác tử AI này sử dụng các mô hình thị giác máy tính, các kỹ thuật học tăng cường và các mô hình ngôn ngữ lớn (LLM) để thực hiện các nhiệm vụ phức tạp. Điều này làm cho chúng trở nên lý tưởng để tự động hóa quy trình làm việc kinh doanh và tăng cường việc ra quyết định.

Ví dụ: trong một nhà kho, một hệ thống AI đại diện được trang bị thị giác máy tính có thể phát hiện các gói hàng, theo dõi hàng tồn kho và di chuyển xung quanh các chướng ngại vật mà không cần sự can thiệp của con người. Sử dụng học tăng cường, nó có thể cải thiện hiệu quả di chuyển theo thời gian, học các tuyến đường tốt nhất để tránh tắc nghẽn. Trong khi đó, một chatbot được hỗ trợ bởi LLM có thể hỗ trợ công nhân bằng cách trả lời các truy vấn và đề xuất các cải tiến hoạt động, làm cho toàn bộ quy trình làm việc hiệu quả hơn.

__wf_reserved_inherit
Hình 1. Tổng quan về cách thức hoạt động của AI agent.

Sự khác biệt chính giữa giải pháp AI truyền thống và giải pháp AI tác tử (agentic AI) là AI tác tử có thể suy nghĩ trước và thích ứng với các tình huống thay đổi. Các hệ thống thị giác máy tính truyền thống rất tốt trong việc nhận dạng đối tượng hoặc phân loại hình ảnh, nhưng chúng không thể điều chỉnh hành vi của mình một cách linh hoạt. Chúng cần con người can thiệp và giúp đào tạo lại hoặc tinh chỉnh các mô hình. Trong khi đó, AI tác tử sử dụng các kỹ thuật máy học tiên tiến để cải thiện theo thời gian bằng cách tương tác với môi trường của nó.

So sánh AI đại diện với các cải tiến AI tiên tiến khác

AI đang phát triển nhanh chóng, với các khái niệm mới như AI tạo sinh, tự động hóa tác nhân và thị giác máy tính đang được áp dụng nhanh chóng trong nhiều ngành công nghiệp khác nhau. Hãy so sánh những công nghệ này để hiểu rõ hơn điều gì làm nên sự khác biệt của AI tác nhân.

Sự khác biệt giữa AI tạo sinh và AI tác nhân

Nếu bạn đã sử dụng các công cụ như ChatGPT, bạn đã quen thuộc với AI tạo sinh. Nhánh AI này chuyên tạo nội dung, chẳng hạn như văn bản, hình ảnh hoặc code, dựa trên các yêu cầu của người dùng. Mặc dù AI tạo sinh tăng cường khả năng sáng tạo và khám phá ý tưởng, nhưng nó tuân theo các mẫu đã học và hoạt động trong các ràng buộc được xác định trước, thiếu khả năng đưa ra quyết định tự chủ hoặc theo đuổi các mục tiêu độc lập.

Ngược lại, Agentic AI chủ động theo đuổi các mục tiêu. Nó có thể thích ứng linh hoạt với môi trường của mình mà không cần sự can thiệp liên tục của con người. Thay vì chỉ tạo nội dung, nó hành động và giải quyết vấn đề một cách tự chủ.

Tự động hóa Agentic và Agentic AI có liên quan mật thiết với nhau

Tự động hóa Agentic và Agentic AI song hành với nhau, trong đó Agentic AI cung cấp trí thông minh để cung cấp năng lượng cho tự động hóa. Hãy xem xét một hệ thống an ninh dựa trên computer vision. 

Hệ thống AI chủ động phân tích tình huống, quyết định phản ứng tốt nhất và tự hành động. Ví dụ: nếu một camera an ninh AI tích hợp với thị giác máy tính phát hiện kẻ xâm nhập, hệ thống AI chủ động không chỉ gửi cảnh báo; nó kiểm tra xem người đó có phải là nhân viên hay không, khóa cửa nếu cần, theo dõi chuyển động của họ và thậm chí gửi một máy bay không người lái để giám sát họ.

Tự động hóa Agentic đảm bảo tất cả các hành động này hoạt động cùng nhau một cách trơn tru. Nó kết nối các hệ thống khác nhau, như camera an ninh, khóa cửa và máy bay không người lái, để chúng có thể phản hồi tự động và đồng bộ. Trong khi Agentic AI đưa ra quyết định, tự động hóa Agentic đảm bảo các quyết định đó được thực hiện hiệu quả mà không cần sự can thiệp của con người. 

__wf_reserved_inherit
Hình 2. So sánh AI chủ động và tự động hóa chủ động. Hình ảnh của tác giả.

Cách AI đại diện hoạt động

Bây giờ chúng ta đã hiểu rõ hơn về AI đại diện là gì, hãy khám phá cách nó hoạt động. 

Các hệ thống Agentic AI hoạt động thông qua một quy trình tuần hoàn gồm nhận thức, ra quyết định, hành động và thích ứng, giúp chúng học hỏi và cải thiện theo thời gian. Vòng lặp liên tục này cho phép các hệ thống này tự hoạt động và đạt được các mục tiêu phức tạp.

Sau đây là cái nhìn tổng quan về các bước liên quan đến vòng lặp liên tục:

  • Nhận thức: Hệ thống AI agentic thu thập và phân tích dữ liệu từ camera, cảm biến và tương tác của người dùng để hiểu rõ hơn về môi trường xung quanh.
  • Ra quyết định: Hệ thống đánh giá các tùy chọn khác nhau, dự đoán các kết quả có thể xảy ra và chọn hành động tốt nhất dựa trên lý luận và đánh giá rủi ro.
  • Hành động: Khi một quyết định được đưa ra, hệ thống thực hiện các tác vụ bằng cách điều khiển các thiết bị vật lý, tương tác với các hệ thống khác hoặc tạo ra các đầu ra.
  • Thích ứng (Adaptation): Hệ thống học hỏi từ kinh nghiệm bằng cách sử dụng phản hồi, áp dụng máy học và học tăng cường (reinforcement learning) để cải thiện hiệu suất theo thời gian, đặc biệt là trên các tác vụ phức tạp hơn.
__wf_reserved_inherit
Hình 3. Tìm hiểu cách thức hoạt động của AI tác nhân.

Các ứng dụng thực tế của AI đại diện

Tiếp theo, hãy xem qua một số ví dụ thực tế về AI đại diện đang hoạt động. Các hệ thống này đang được sử dụng trong các ngành công nghiệp khác nhau, giúp máy móc phân tích dữ liệu và đưa ra các quyết định độc lập để cải thiện kết quả.

Agentic AI trong khám phá thuốc

Khám phá thuốc bao gồm một số giai đoạn chính, từ xác định các mục tiêu sinh học liên quan đến bệnh tật đến sàng lọc các hợp chất tiềm năng, tối ưu hóa cấu trúc hóa học của chúng và tiến hành thử nghiệm tiền lâm sàng. Đây là một quá trình phức tạp và tốn thời gian, đòi hỏi phân tích dữ liệu và thử nghiệm rộng rãi để tìm ra các phương pháp điều trị hiệu quả và an toàn.

Agentic AI, được tích hợp với computer vision, đang giúp tự động hóa các bước quan trọng như tổng hợp hóa học, giúp quá trình này nhanh hơn và hiệu quả hơn. Tổng hợp hóa học là quá trình kết hợp các hợp chất hóa học khác nhau để tạo ra các chất mới, chẳng hạn như dược phẩm, thông qua các phản ứng được kiểm soát. Theo truyền thống, các nhà khoa học phải tự điều chỉnh các yếu tố như nhiệt độ, thành phần dung môi và thời gian kết tinh thông qua thử và sai.

Giờ đây, các hệ thống AI tác tử có thể theo dõi các phản ứng trong thời gian thực, phân tích các thay đổi trực quan như sự thay đổi màu sắc hoặc sự hình thành tinh thể và đưa ra quyết định ngay tại chỗ. Ví dụ: nếu hệ thống phát hiện thấy một phản ứng không tiến triển như mong đợi, nó có thể ngay lập tức điều chỉnh nhiệt độ hoặc thêm các hóa chất cần thiết để tối ưu hóa quy trình. Bằng cách liên tục học hỏi từ các phản ứng trong quá khứ, hệ thống cải thiện độ chính xác theo thời gian, giảm nhu cầu can thiệp thủ công và tăng tốc độ phát triển thuốc.

__wf_reserved_inherit
Hình 4. Một ví dụ về thiết lập phòng thí nghiệm tự động.

Tái tạo lại thương mại điện tử với AI đại diện

Agentic AI đang thay đổi cách chúng ta mua sắm trực tuyến bằng cách làm cho trải nghiệm trở nên cá nhân hóa, hiệu quả và tự động hơn. Thay vì chỉ đề xuất sản phẩm dựa trên các giao dịch mua trước đây, agentic AI có thể phân tích thói quen duyệt web, dự đoán những gì khách hàng có thể muốn tiếp theo và điều chỉnh các đề xuất sản phẩm theo thời gian thực. 

Với sự trợ giúp của thị giác máy tính, AI đại diện cũng có thể phân tích các tìm kiếm trực quan, nhận dạng hình ảnh sản phẩm để đưa ra các đề xuất chính xác hơn. Ví dụ: nếu ai đó thường xuyên xem giày thể thao, hệ thống AI đại diện có thể làm nổi bật các kiểu thịnh hành, đưa ra giảm giá hoặc đề xuất các phụ kiện phù hợp. Nó cũng có thể tối ưu hóa giá cả và khuyến mãi dựa trên nhu cầu, làm cho việc mua sắm trở nên năng động hơn.

Ngoài các đề xuất, AI đại diện đang cải thiện hậu cần thương mại điện tử bằng cách quản lý hàng tồn kho, dự đoán việc bổ sung hàng và tự động hóa việc thực hiện đơn hàng. Thị giác máy tính cho phép các hệ thống AI đại diện theo dõi mức tồn kho theo thời gian thực, xác định các mặt hàng bị đặt sai vị trí và đảm bảo các sản phẩm được phân loại chính xác. Nếu một mặt hàng đang bán hết nhanh chóng, hệ thống có thể kích hoạt việc bổ sung hàng hoặc đề xuất các lựa chọn thay thế. Bằng cách học hỏi và thích ứng theo thời gian, AI đại diện đang làm cho việc mua sắm trực tuyến trở nên nhanh hơn, thông minh hơn và liền mạch hơn cho cả khách hàng và doanh nghiệp.

Cách xây dựng một hệ thống AI chủ động (agentic) 

Sau khi xem xét các ví dụ thực tế về AI tác tử, hãy thảo luận về cách xây dựng một AI tác tử. 

Nếu bạn đang phát triển một ứng dụng dựa trên thị giác máy tính, việc sử dụng các mô hình mới nhất như Ultralytics YOLO11 có thể giúp hệ thống AI agentic của bạn hiểu rõ hơn về môi trường xung quanh. Với sự hỗ trợ cho nhiều tác vụ thị giác máy tính, YOLO11 có thể giúp các hệ thống AI agentic phân tích dữ liệu trực quan một cách chính xác.

Đây là cách bạn có thể xây dựng một hệ thống AI chủ động bằng YOLO11:

  • Xác định mục tiêu: Vạch ra rõ ràng mục đích, mục tiêu của tác nhân AI và các tác vụ cụ thể mà nó cần thực hiện để đạt được chức năng dự định.
  • Huấn luyện YOLO11: Thu thập dữ liệu hình ảnh và video liên quan, gắn nhãn và huấn luyện tùy chỉnh YOLO11 dựa trên ứng dụng cụ thể của bạn.
  • Tích hợp YOLO11: Kết nối YOLO11 với một framework AI cho phép phân tích và ra quyết định theo thời gian thực dựa trên dữ liệu trực quan được phát hiện.
  • Cho phép ra quyết định tự động: Thiết lập các mô hình logic hoặc máy học cho phép tác nhân AI thực hiện các hành động dựa trên kết quả phát hiện của YOLO11, chẳng hạn như kích hoạt cảnh báo, điều chỉnh cài đặt hoặc hướng dẫn hệ thống robot.
  • Kết hợp các vòng phản hồi: Triển khai một hệ thống tự học, trong đó YOLO11 tinh chỉnh độ chính xác của nó bằng cách huấn luyện lại với dữ liệu mới, cải thiện hiệu suất mô hình theo thời gian.
__wf_reserved_inherit
Hình 5. Cách xây dựng một hệ thống AI chủ động (agentic AI system) bằng YOLO11. Ảnh của tác giả.

Ưu và nhược điểm của một hệ thống AI đại diện

Dưới đây là một số lợi ích chính mà các hệ thống AI đại diện có thể mang lại cho các ngành công nghiệp khác nhau:

  • Tăng hiệu quả: Các hệ thống AI đại diện có thể tự động hóa các tác vụ phức tạp, tốn thời gian, giảm lỗi và giải phóng nhân viên để thực hiện các công việc có giá trị cao hơn.
  • Khả năng mở rộng: Các hệ thống này có thể dễ dàng thích ứng với các ngành khác nhau và phát triển để xử lý khối lượng công việc lớn hơn khi cần.
  • Giảm chi phí: Bằng cách giảm nhu cầu về lao động thủ công và tối ưu hóa hoạt động, AI đại diện giúp các doanh nghiệp cắt giảm chi phí và sử dụng tài nguyên hiệu quả hơn.

Mặc dù AI đại diện mang lại nhiều lợi ích trên các lĩnh vực khác nhau, nhưng điều quan trọng là phải nhận thức được những hạn chế tiềm ẩn đi kèm với nó. Dưới đây là một số mối quan tâm chính cần ghi nhớ:

  • Sự thiên vị trong AI: Các hệ thống AI chủ động có thể kế thừa những thành kiến từ dữ liệu huấn luyện, dẫn đến những kết quả không công bằng hoặc không chính xác, đặc biệt là trong các lĩnh vực như tuyển dụng và thực thi pháp luật.
  • Thiếu tính minh bạch: Nhiều mô hình AI hoạt động như "hộp đen", gây khó khăn cho việc hiểu cách chúng đưa ra quyết định, điều này có thể là một vấn đề trong các ngành như chăm sóc sức khỏe và tài chính.
  • Các thách thức về quy định: Sự phát triển của AI tác nhân đang diễn ra nhanh hơn các quy định, tạo ra sự không chắc chắn về mặt pháp lý và các tiêu chuẩn tuân thủ toàn cầu không nhất quán.

Nhìn chung, mặc dù các hệ thống AI chủ động mang lại nhiều lợi ích, nhưng điều quan trọng là phải cân bằng những lợi ích đó với các cân nhắc về đạo đức, tính minh bạch và quy định phù hợp để đảm bảo chúng được sử dụng có trách nhiệm.

Những điều cần nhớ

Khi kết hợp với các mô hình Vision AI như YOLO11, các hệ thống AI agentic có thể thay đổi cách thức hoạt động của tự động hóa. Từ xe tự lái đến mua sắm trực tuyến và chăm sóc sức khỏe, các hệ thống này giúp các doanh nghiệp hoạt động tự chủ và với tốc độ nhanh hơn. 

Tuy nhiên, những thách thức như sự thiên vị, thiếu minh bạch và các quy định không rõ ràng vẫn cần được giải quyết. Khi các hệ thống AI chủ động được cải thiện, việc tìm ra sự cân bằng phù hợp giữa đổi mới và trách nhiệm sẽ là chìa khóa để tận dụng tối đa những đổi mới này.

Tham gia cộng đồngkho lưu trữ GitHub của chúng tôi để tìm hiểu thêm về AI. Khám phá các ứng dụng khác nhau của AI trong sản xuấtcomputer vision trong chăm sóc sức khỏe trên các trang giải pháp của chúng tôi. Xem giấy phép Ultralytics YOLO của chúng tôi để bắt đầu với computer vision ngay hôm nay!

Hãy cùng nhau xây dựng tương lai
của AI!

Bắt đầu hành trình của bạn với tương lai của học máy

Bắt đầu miễn phí
Đã sao chép liên kết vào clipboard