Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Quay lại Bảng thuật ngữ Ultralytics

AI Safety

Tìm hiểu các trụ cột cốt lõi của an toàn AI, bao gồm sự căn chỉnh và tính bền vững. Khám phá cách triển khai các mô hình đáng tin cậy với Ultralytics YOLO26 và đảm bảo độ tin cậy của AI.

An toàn AI là một lĩnh vực đa ngành tập trung vào việc đảm bảo các hệ thống Trí tuệ nhân tạo (AI) vận hành một cách đáng tin cậy, có thể dự đoán và mang lại lợi ích. Không giống như an ninh mạng, vốn bảo vệ hệ thống khỏi các cuộc tấn công bên ngoài, An toàn AI giải quyết các rủi ro vốn có trong thiết kế và vận hành của chính hệ thống đó. Điều này bao gồm việc ngăn chặn các hậu quả ngoài ý muốn phát sinh từ sự sai lệch mục tiêu, thiếu độ bền vững trong các môi trường mới hoặc lỗi trong khả năng khái quát hóa của Deep Learning (DL). Khi các model ngày càng trở nên tự chủ hơn, các nhà nghiên cứu tại các tổ chức như Center for Human-Compatible AI đang nỗ lực đảm bảo các công nghệ này phù hợp với ý định của con người và các tiêu chuẩn an toàn.

Link to this sectionCác trụ cột cốt lõi của AI an toàn#

Xây dựng một hệ thống an toàn đòi hỏi phải giải quyết một số thách thức kỹ thuật vượt ra ngoài các chỉ số độ chính xác đơn thuần. Những trụ cột này đảm bảo rằng các model Machine Learning (ML) vẫn nằm trong tầm kiểm soát ngay cả khi được triển khai trong các tình huống thực tế phức tạp.

  • Độ bền vững (Robustness): Một model an toàn phải duy trì được hiệu suất khi đối mặt với dữ liệu đầu vào bị hỏng hoặc những thay đổi trong môi trường. Điều này bao gồm việc phòng thủ chống lại các cuộc tấn công đối nghịch, nơi các thao tác tinh vi trên dữ liệu đầu vào có thể đánh lừa model khiến nó đưa ra các lỗi với độ tự tin cao.
  • Sự căn chỉnh (Alignment): Nguyên tắc này đảm bảo rằng các mục tiêu của AI khớp với ý định thực sự của người thiết kế. Sự sai lệch thường xảy ra trong Reinforcement Learning khi một hệ thống học cách "lách" hàm phần thưởng của nó—ví dụ như một robot dọn dẹp làm vỡ bình hoa để dọn dẹp đống đổ nát nhanh hơn. Các kỹ thuật như Reinforcement Learning from Human Feedback (RLHF) được sử dụng để giảm thiểu vấn đề này.
  • Khả năng diễn giải (Interpretability): Còn được gọi là AI có thể giải thích được (XAI), lĩnh vực này liên quan đến việc tạo ra sự minh bạch trong các model "hộp đen". Việc trực quan hóa các feature map cho phép các kỹ sư hiểu được quy trình ra quyết định, đảm bảo model không dựa vào các mối tương quan giả tạo.
  • Giám sát (Monitoring): Giám sát model liên tục là điều cần thiết để phát hiện data drift. Các giao thức an toàn phải kích hoạt cảnh báo hoặc các cơ chế dự phòng nếu dữ liệu thực tế bắt đầu chệch hướng đáng kể so với dữ liệu huấn luyện.

Link to this sectionCác ứng dụng trong thực tế#

An toàn AI là tối quan trọng trong các lĩnh vực rủi ro cao, nơi lỗi thuật toán có thể dẫn đến tổn hại về thể chất hoặc thiệt hại kinh tế đáng kể.

  1. Xe tự hành: Trong lĩnh vực AI trong ngành ô tô, các khung an toàn xác định cách một chiếc xe phản ứng với sự không chắc chắn. Nếu một model object detection không thể nhận diện vật cản với độ tự tin cao, hệ thống phải mặc định chuyển sang trạng thái an toàn—chẳng hạn như phanh—thay vì phỏng đoán. Các hướng dẫn về xe tự hành của NHTSA nhấn mạnh các cơ chế an toàn dự phòng này.

  2. Chẩn đoán y tế: Khi áp dụng AI trong chăm sóc sức khỏe, an toàn bao gồm việc giảm thiểu kết quả âm tính giả trong các chẩn đoán quan trọng. Các hệ thống thường được tinh chỉnh để có độ recall cao nhằm đảm bảo không bỏ sót tình trạng bệnh tiềm ẩn, thực sự hoạt động như một "ý kiến thứ hai" cho các bác sĩ. Các cơ quan quản lý như FDA Digital Health Center đặt ra các tiêu chuẩn nghiêm ngặt cho phần mềm như một thiết bị y tế (SaMD).

Link to this sectionTriển khai các ngưỡng an toàn#

Một trong những cơ chế an toàn cơ bản nhất trong thị giác máy tính là sử dụng các ngưỡng độ tự tin (confidence thresholds). Bằng cách lọc bỏ các dự đoán có xác suất thấp trong quá trình inference, các nhà phát triển ngăn chặn hệ thống hành động dựa trên thông tin yếu.

Ví dụ sau đây minh họa cách áp dụng bộ lọc an toàn sử dụng Ultralytics YOLO26, đảm bảo chỉ những kết quả phát hiện đáng tin cậy mới được xử lý.

from ultralytics import YOLO

# Load the YOLO26 model (latest standard for efficiency)
model = YOLO("yolo26n.pt")

# Run inference with a strict confidence threshold of 0.7 (70%)
# This acts as a safety gate to ignore uncertain predictions
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.7)

# Verify detections meet safety criteria
print(f"Safety Check: {len(results[0].boxes)} objects detected with >70% confidence.")

Link to this sectionAn toàn AI so với Đạo đức AI#

Mặc dù các thuật ngữ này thường được sử dụng thay thế cho nhau, chúng giải quyết các khía cạnh khác nhau của AI có trách nhiệm.

  • An toàn AI là một ngành kỹ thuật. Nó đặt câu hỏi, "Hệ thống này có hoạt động chính xác mà không gây ra tai nạn không?" Nó giải quyết các vấn đề như model hallucination và việc khám phá an toàn trong reinforcement learning.
  • Đạo đức AI là một khuôn khổ kỹ thuật xã hội. Nó đặt câu hỏi, "Chúng ta có nên xây dựng hệ thống này không, và nó có công bằng không?" Nó tập trung vào các vấn đề như algorithmic bias, quyền riêng tư và sự phân bổ công bằng các lợi ích, như đã được nêu trong Đạo luật AI của EU.

Link to this sectionTriển vọng tương lai#

Khi ngành công nghiệp hướng tới Artificial General Intelligence (AGI), nghiên cứu về an toàn đang trở nên ngày càng quan trọng. Các tổ chức có thể tận dụng Ultralytics Platform để quản lý tập dữ liệu và giám sát triển khai model, đảm bảo rằng các giải pháp AI của họ duy trì được sự bền vững, minh bạch và phù hợp với các tiêu chuẩn an toàn trong suốt vòng đời của chúng.

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.
Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.
Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.
Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.
Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning