Bảng chú giải thuật ngữ

Trí tuệ bầy đàn

Khám phá cách Trí tuệ bầy đàn thúc đẩy AI phi tập trung. Tìm hiểu về PSO, ACO và các ứng dụng thực tế sử dụng chúng. Ultralytics YOLO26 dành cho máy bay không người lái và thành phố thông minh.

Trí tuệ bầy đàn (Swarm Intelligence - SI) định nghĩa hành vi tập thể của các hệ thống phi tập trung, tự tổ chức, thường là tự nhiên hoặc nhân tạo. Khái niệm này lấy cảm hứng mạnh mẽ từ các hệ thống sinh học trong tự nhiên , chẳng hạn như đàn kiến, đàn chim, đàn cá và sự phát triển của vi khuẩn. Trong bối cảnh trí tuệ nhân tạo (AI) , hệ thống trí tuệ bầy đàn bao gồm một quần thể các tác nhân đơn giản tương tác cục bộ với nhau và với môi trường của chúng. Mặc dù không có cấu trúc kiểm soát tập trung nào quy định cách thức hoạt động của từng tác nhân, nhưng sự tương tác cục bộ giữa các tác nhân này dẫn đến sự xuất hiện của hành vi toàn cầu "thông minh", có khả năng giải quyết các nhiệm vụ phức tạp vượt quá khả năng của một cá thể đơn lẻ.

Các cơ chế và thuật toán cốt lõi

Sức mạnh của trí tuệ bầy đàn nằm ở khả năng giải quyết các vấn đề phi tuyến tính thông qua sự hợp tác. Các tác nhân trong hệ thống này tuân theo các quy tắc đơn giản—thường được mô tả là "tách biệt", "liên kết" và "gắn kết"—cho phép nhóm điều hướng trong môi trường năng động . Cách tiếp cận này đặc biệt hiệu quả trong các thuật toán tối ưu hóa, nơi không gian tìm kiếm rộng lớn và phức tạp.

Hai trong số những cách triển khai thuật toán nổi bật nhất bao gồm:

Tối ưu hóa bầy hạt (PSO): Lấy cảm hứng từ hành vi xã hội của đàn chim, PSO tối ưu hóa một bài toán bằng cách lặp đi lặp lại việc cố gắng cải thiện một giải pháp ứng cử viên dựa trên một thước đo chất lượng nhất định. Nó được sử dụng rộng rãi trong huấn luyện mạng nơ-ron và tìm kiếm các siêu tham số tối ưu. Bạn có thể tìm hiểu thêm về cơ chế của Tối ưu hóa bầy hạt để hiểu nền tảng toán học của nó.
Tối ưu hóa đàn kiến (ACO): Dựa trên hành vi tìm kiếm thức ăn của loài kiến, cụ thể là cách chúng tìm ra con đường ngắn nhất giữa tổ và nguồn thức ăn bằng cách sử dụng các vệt pheromone. ACO thường được áp dụng cho các bài toán định tuyến trong hoạt động viễn thông và hậu cần .

Trí tuệ bầy đàn trong thị giác máy tính

Trong lĩnh vực thị giác máy tính (CV) , trí tuệ bầy đàn đang cách mạng hóa cách máy móc nhận thức và diễn giải thế giới. Thay vì dựa vào một mô hình duy nhất, nguyên khối, các phương pháp dựa trên bầy đàn sử dụng nhiều tác nhân nhỏ gọn—thường được triển khai trên các thiết bị điện toán biên —để thu thập dữ liệu và thực hiện suy luận một cách cộng tác.

Các Ứng dụng Thực tế

Tìm kiếm và cứu hộ bằng máy bay không người lái tự hành: Trong các tình huống thảm họa, một máy bay không người lái đơn lẻ có thời lượng pin và tầm nhìn hạn chế. Tuy nhiên, một đàn máy bay không người lái tự hành có thể bao phủ các khu vực rộng lớn một cách hiệu quả. Được trang bị các mô hình phát hiện vật thể như YOLO26 , những máy bay không người lái này truyền đạt tọa độ phát hiện cho nhau. Nếu một máy bay không người lái phát hiện dấu hiệu sự sống, nó có thể ra hiệu cho những máy bay khác hội tụ và xác minh, tối ưu hóa đường đi tìm kiếm trong thời gian thực mà không cần sự hướng dẫn liên tục từ người điều khiển.
Quản lý giao thông thành phố thông minh: Quy hoạch đô thị hiện đại sử dụng trí tuệ nhân tạo (AI) trong các thành phố thông minh để giảm thiểu tắc nghẽn. Hệ thống camera giao thông hoạt động như một bầy đàn có thể giám sát các giao lộ trên toàn thành phố. Thay vì xử lý dữ liệu tập trung, vốn gây ra độ trễ, các tác nhân phân tán này sử dụng AI tại biên để điều chỉnh thời gian đèn giao thông một cách linh hoạt dựa trên lưu lượng giao thông cục bộ và dữ liệu từ các khu vực lân cận. Cách tiếp cận phi tập trung này cho phép toàn bộ mạng lưới giao thông tự tối ưu hóa, giảm thời gian chờ đợi và lượng khí thải.

Triển khai các tác nhân thị giác

Để triển khai một bầy đàn, mỗi tác nhân thường yêu cầu một mô hình nhanh, hiệu quả có khả năng chạy trên phần cứng công suất thấp. Ví dụ sau đây minh họa cách khởi tạo một mô hình nhẹ. Mẫu YOLO26n sử dụng ultralytics gói này thể hiện khả năng nhận thức thị giác của một tác nhân đơn lẻ trong một bầy đàn.

from ultralytics import YOLO

# Load a lightweight YOLO26 nano model optimized for edge agents
# This simulates one agent in a swarm initializing its vision system
model = YOLO("yolo26n.pt")

# Perform inference on a local image (what the agent 'sees')
# The agent would then transmit these results to neighbors
results = model.predict("path/to/image.jpg")

# Print the number of objects detected by this agent
print(f"Agent detected {len(results[0].boxes)} objects.")

Phân biệt trí tuệ bầy đàn

Điều quan trọng là phải phân biệt trí tuệ bầy đàn với các khái niệm trí tuệ nhân tạo liên quan khác:

So với Học tập kết hợp: Mặc dù cả hai đều bao gồm nhiều thành phần, học tập kết hợp thường kết hợp các dự đoán của các mô hình tĩnh khác nhau (như Rừng ngẫu nhiên) để cải thiện độ chính xác. Ngược lại, trí tuệ bầy đàn liên quan đến các tác nhân chủ động di chuyển trong không gian giải pháp hoặc môi trường vật lý, tương tác và thay đổi hành vi của chúng theo thời gian.
So với thuật toán tiến hóa: Thuật toán tiến hóa sử dụng các cơ chế như đột biến và lai ghép để phát triển quần thể qua nhiều thế hệ. Mặc dù SI cũng sử dụng quần thể, nhưng các cá thể trong bầy thường không chết hoặc sinh sản; chúng học hỏi và thích nghi vị trí của mình dựa trên thông tin từ các cá thể khác, một quá trình được gọi là stigmergy .

Tương lai của Trí tuệ nhân tạo hợp tác

Khi phần cứng ngày càng nhỏ gọn và Internet vạn vật (IoT) tiếp tục mở rộng, trí tuệ bầy đàn sẽ đóng vai trò then chốt trong tự động hóa phi tập trung. Các công cụ như Nền tảng Ultralytics tạo điều kiện thuận lợi cho tương lai này bằng cách cho phép các nhóm quản lý tập dữ liệu và huấn luyện các mô hình có thể dễ dàng triển khai cho các nhóm thiết bị, cho phép hình thành "tư duy tập thể" đồng bộ cần thiết cho robot bầy đàn tiên tiến và xe tự hành .

Trí tuệ bầy đàn

Xe lửa Ultralytics YOLO các mô hình để hợp lý hóa quy trình làm việc trên khắp các ngành công nghiệp

Giải pháp cấp phép doanh nghiệp linh hoạt để thúc đẩy sự đổi mới của bạn

Đào tạo các mô hình AI trong vài giây với Ultralytics YOLO

Các cơ chế và thuật toán cốt lõi

Trí tuệ bầy đàn trong thị giác máy tính

Các Ứng dụng Thực tế

Triển khai các tác nhân thị giác

Phân biệt trí tuệ bầy đàn

Tương lai của Trí tuệ nhân tạo hợp tác

Đọc thêm trong danh mục này

12 trường hợp sử dụng ảnh chụp từ trên không được hỗ trợ bởi thị giác máy tính

Ước lượng độ sâu đơn ảnh là gì? Tổng quan

Một cái nhìn về việc sử dụng Ultralytics YOLO các mô hình để phát hiện mối đe dọa AI

Tham gia Ultralytics cộng đồng