YOLO Vision Thâm Quyến
Thâm Quyến
Tham gia ngay
Thuật ngữ

Thị giác thần kinh

Khám phá thị giác thần kinh và cảm biến dựa trên sự kiện. Tìm hiểu cách kết hợp dữ liệu độ trễ thấp với Ultralytics YOLO26 trên Ultralytics Nền tảng cho trí tuệ nhân tạo hiệu quả.

Thị giác thần kinh mô phỏng là một mô hình thị giác máy tính tiên tiến được lấy cảm hứng từ hoạt động sinh học của mắt và não người. Không giống như các máy ảnh truyền thống dựa trên khung hình chụp ảnh tĩnh ở các khoảng thời gian cố định, các cảm biến thần kinh mô phỏng—thường được gọi là Cảm biến Thị giác Động (DVS) hoặc máy ảnh sự kiện—ghi lại sự thay đổi cường độ ánh sáng không đồng bộ ở cấp độ pixel. Điều này tạo ra một luồng sự kiện liên tục, thưa thớt thay vì các khung hình ảnh dư thừa. Khi AI tiếp tục phát triển vào năm 2025 và những năm tiếp theo, phương pháp lấy cảm hứng từ sinh học này đang trở nên rất quan trọng để phát triển các hệ thống thị giác có độ trễ thấp, tiết kiệm năng lượng, có khả năng hoạt động trong môi trường năng động cao.

Cơ chế hoạt động của thị giác thần kinh mô phỏng

Về bản chất, thị giác thần kinh mô phỏng dựa trên sự phối hợp giữa các cảm biến dựa trên sự kiện và các mạng thần kinh chuyên biệt. Khi một điểm ảnh phát hiện sự thay đổi độ sáng, nó ngay lập tức kích hoạt một "sự kiện" chứa tọa độ không gian của nó, dấu thời gian chính xác đến từng micro giây và cực tính của sự thay đổi (ánh sáng tăng hay giảm). Phương pháp này giảm đáng kể sự dư thừa dữ liệu, vì nền tĩnh hầu như không tiêu tốn băng thông.

Để xử lý hiệu quả các luồng sự kiện thưa thớt này, các kỹ sư thường triển khai Mạng nơ-ron xung (SNN) , hoạt động bằng cách giao tiếp thông qua các xung điện rời rạc thay vì các giá trị kích hoạt liên tục, mô phỏng sát với các nơ-ron sinh học. Kiến trúc này đòi hỏi ít năng lượng tính toán hơn đáng kể, khiến nó trở thành ứng cử viên lý tưởng cho AI biên và phần cứng điện toán biên có tài nguyên hạn chế.

So sánh Thị giác Thần kinh với Thị giác Máy tính Tiêu chuẩn

Trong khi các kiến ​​trúc phát hiện đối tượng thông thường dựa vào việc xử lý ma trận dày đặc cường độ điểm ảnh, thị giác thần kinh mô phỏng xử lý dữ liệu không gian-thời gian không đồng bộ. Sự khác biệt cơ bản này mang lại cho camera sự kiện những lợi thế độc đáo: độ phân giải thời gian ở mức micro giây, độ mờ chuyển động gần như bằng không và khả năng dải động cao (HDR) vượt trội, hoạt động tốt trong điều kiện ánh sáng khắc nghiệt.

Tuy nhiên, các mô hình thị giác tiêu chuẩn như Ultralytics YOLO26 vẫn là tiêu chuẩn ngành cho việc phát hiện đối tượngphân đoạn hình ảnh đa năng nhờ độ chính xác vượt trội trên dữ liệu hình ảnh dày đặc và khả năng tương thích rộng rãi với các bộ tăng tốc phần cứng hiện đại như GPU và TPU . Trong khi các mô hình tiêu chuẩn phân tích toàn bộ khung cảnh để hiểu ngữ cảnh, các hệ thống thần kinh mô phỏng chỉ tập trung vào các thay đổi động.

Các ứng dụng thực tiễn quan trọng

Tốc độ và hiệu quả vượt trội của thị giác thần kinh mô phỏng đã dẫn đến nhiều ứng dụng đột phá trong năm 2025 .

  • Máy bay không người lái và robot tự hành: Điều hướng tốc độ cao đòi hỏi phản xạ trong tích tắc. Máy bay không người lái được trang bị camera sự kiện có thể dễ dàng né tránh các chướng ngại vật di chuyển nhanh, một lĩnh vực mà thị giác máy tính tiêu chuẩn thường gặp khó khăn do hạn chế về tốc độ khung hình truyền thống.
  • Giám sát thông minh và IoT: Vì cảm biến sự kiện chỉ truyền dữ liệu khi có chuyển động xảy ra, chúng tiêu thụ một phần nhỏ năng lượng so với các hệ thống tiêu chuẩn. Điều này làm cho chúng trở nên hoàn hảo cho camera an ninh hoạt động liên tục và giám sát thành phố thông minh , nơi tiết kiệm năng lượng là tối quan trọng.
  • An toàn ô tô: Hệ thống hỗ trợ lái xe tiên tiến (ADAS) tận dụng các đặc tính HDR của cảm biến thần kinh để đảm bảo an toàn. detect Người đi bộ hoặc phương tiện giao thông khi ra khỏi đường hầm tối vào ánh sáng mặt trời chói chang, giúp tăng cường đáng kể sự an toàn cho xe tự lái .

Tích hợp các khái niệm thần kinh mô phỏng vào trí tuệ nhân tạo hiện đại

Mặc dù phần cứng SNN gốc vẫn đang trong giai đoạn hoàn thiện, cộng đồng thị giác máy tính ngày càng kết hợp dữ liệu dựa trên sự kiện với các khung học sâu truyền thống như PyTorchTensorFlow . Các nhà nghiên cứu thường chuyển đổi luồng sự kiện thô thành các khung giả hoặc tensor các biểu diễn này cho phép sử dụng các bộ dò không gian mạnh mẽ, hiện đại .

Ví dụ, bạn có thể tích lũy dữ liệu sự kiện về mặt toán học vào một khung hình và xử lý nó bằng mô hình YOLO26 được tối ưu hóa cao để đạt được khả năng suy luận nhanh chóng, tiết kiệm năng lượng tại biên. Để xây dựng, huấn luyện và mở rộng quy mô các đường dẫn xử lý dữ liệu lai này một cách dễ dàng, các nhóm doanh nghiệp dựa vào Nền tảng Ultralytics để quản lý tập dữ liệu từ đầu đến cuối, chú thích dữ liệu tự động và triển khai đám mây liền mạch.

from ultralytics import YOLO

# Load the highly efficient Ultralytics YOLO26 edge model
model = YOLO("yolo26n.pt")

# In a neuromorphic setup, sparse event data is often accumulated
# into pseudo-frames before processing with traditional neural networks.
# Here we simulate running inference on an accumulated event-frame.
results = model.predict(source="event_frame_accumulated.jpg", device="cpu", imgsz=320)

# Display bounding box detection results optimized for edge-compute
results[0].show()

Cách tiếp cận kết hợp này cho phép các kỹ sư tận dụng độ trễ cực thấp của cảm biến sự kiện cùng với độ chính xác mạnh mẽ, đã được kiểm chứng của các mô hình YOLO hiện đại, thúc đẩy thế hệ tiếp theo của các giải pháp học máy thông minh, hiệu quả cao.

Hãy cùng nhau xây dựng tương lai của trí tuệ nhân tạo!

Bắt đầu hành trình của bạn với tương lai của học máy