Data Poisoning

Tìm hiểu về đầu độc dữ liệu (data poisoning) và tác động của nó đối với AI. Khám phá cách bảo mật các model Ultralytics YOLO26 và bảo vệ dữ liệu huấn luyện với Ultralytics Platform.

Đầu độc dữ liệu là một mối đe dọa an ninh mạng trong đó các tác nhân độc hại cố tình thao túng dữ liệu huấn luyện được sử dụng để xây dựng các mô hình Machine Learning (ML). Bằng cách làm hỏng tập dữ liệu trước khi mô hình được huấn luyện, những kẻ tấn công có thể chèn các cửa sau (backdoor) ẩn, gây ra các định kiến hoặc làm suy giảm hiệu suất tổng thể của mô hình. Khác với các hình thức khai thác bảo mật nhắm vào mã nguồn của hệ thống, các cuộc tấn công đầu độc dữ liệu nhắm vào chính quá trình học tập, khiến chúng cực kỳ khó phát hiện sau khi mô hình đã được triển khai vào môi trường sản xuất. Theo tổng quan về tình báo đe dọa của IBM, các cuộc tấn công này gây ra rủi ro nghiêm trọng cho tính toàn vẹn và độ tin cậy của các hệ thống trí tuệ nhân tạo.

Link to this sectionCơ chế của việc đầu độc AI#

Khi các tổ chức ngày càng phụ thuộc vào Deep Learning (DL) và Large Language Models (LLMs), họ thường thu thập một lượng lớn dữ liệu chưa được kiểm chứng từ internet. Thực tiễn này tạo ra cơ hội cho việc tiêm nhiễm dữ liệu, nơi những đối tượng xấu chèn các điểm dữ liệu giả mạo hoặc độc hại vào các kho lưu trữ công khai. Các nghiên cứu gần đây về đầu độc AI từ năm 2025 cho thấy một thực tế đáng báo động: ngay cả đối với các mô hình khổng lồ với hàng tỷ tham số, kẻ tấn công chỉ cần thao túng một số lượng mẫu tối thiểu, gần như không đổi, để thỏa hiệp hệ thống.

Đầu độc LLM xảy ra khi các cụm từ kích hoạt cụ thể được tiêm vào văn bản mà mô hình tiêu thụ trong quá trình huấn luyện. Sau khi được triển khai, mô hình có thể hoạt động bình thường cho đến khi người dùng nhập cụm từ kích hoạt, khiến hệ thống bỏ qua các giao thức an toàn hoặc tạo ra các đầu ra độc hại. Nghiên cứu năm 2025 của Anthropic về đầu độc LLM chứng minh rằng chỉ cần 250 tài liệu bị đầu độc là có thể tạo ra một cửa sau trong một mô hình 13 tỷ tham số.

Link to this sectionCác ứng dụng và ví dụ thực tế#

Đầu độc dữ liệu không chỉ giới hạn ở việc tạo văn bản mà còn tác động nặng nề đến các mô hình Computer Vision (CV). Dưới đây là hai ví dụ cụ thể về cách mối đe dọa này xuất hiện trong các ứng dụng thực tế:

Phá vỡ các mô hình nghệ thuật tạo sinh: Các công cụ như dự án Nightshade cho phép các nghệ sĩ kỹ thuật số thay đổi tinh vi các pixel trong tác phẩm nghệ thuật của họ trước khi tải lên trực tuyến. Khi một mô hình Generative AI thu thập những hình ảnh này để huấn luyện, các pixel đã thay đổi đóng vai trò như chất độc, khiến mô hình phân loại sai các yêu cầu (prompt) hoàn toàn—ví dụ như tạo ra hình ảnh con mèo khi được yêu cầu tạo hình chiếc xe hơi.
Thỏa hiệp xe tự lái: Trong hệ thống nhận diện đối tượng được sử dụng cho xe tự lái, kẻ tấn công có thể thay đổi tinh vi hình ảnh biển báo dừng trong tập dữ liệu huấn luyện mã nguồn mở. Bằng cách áp dụng nhiễu hình ảnh cụ thể, dữ liệu huấn luyện bị đầu độc dạy cho mô hình hiểu sai biển báo dừng thành biển báo giới hạn tốc độ, gây ra rủi ro an toàn thảm khốc.

Link to this sectionPhân biệt với tấn công đối nghịch#

Mặc dù có liên quan chặt chẽ, điều quan trọng là phải phân biệt đầu độc dữ liệu với Adversarial Attacks. Các cuộc tấn công đối nghịch xảy ra trong quá trình suy luận (inference)—kẻ tấn công thao túng dữ liệu đầu vào (như dán nhãn dán lên biển báo dừng thực tế) để đánh lừa một mô hình đã được huấn luyện sẵn. Ngược lại, đầu độc dữ liệu xảy ra trong quá trình huấn luyện, làm thay đổi cơ bản logic nội tại của mô hình từ gốc. Việc giải quyết cả hai đòi hỏi các giao thức AI Safety mạnh mẽ.

Link to this sectionGiảm thiểu rủi ro trong phát triển mô hình#

Việc phòng thủ chống lại các mối đe dọa này đòi hỏi giám sát mô hình nghiêm ngặt và sử dụng dữ liệu kiểm chứng tin cậy, nguyên bản để xác minh tính toàn vẹn của mô hình. Đánh giá một mô hình dựa trên một tập dữ liệu đã được xác minh có thể giúp các nhóm phát hiện các đợt giảm hiệu suất bất ngờ có thể cho thấy sự giả mạo. Các thực tiễn tốt nhất được nêu bởi nghiên cứu an toàn của OpenAI và Dự án Bảo mật GenAI của OWASP nhấn mạnh việc truy xuất nguồn gốc dữ liệu nghiêm ngặt và sử dụng các tập dữ liệu đã qua tuyển chọn thay vì thu thập dữ liệu web thô.

Khi xây dựng và kiểm thử mô hình, các nhóm nên tận dụng các khung công cụ đã được thiết lập như PyTorch hoặc TensorFlow cùng với các quy trình kiểm chứng toàn diện. Bạn có thể dễ dàng kiểm chứng mô hình Ultralytics YOLO26 của mình với một tập dữ liệu sạch, đáng tin cậy để đảm bảo độ chính xác chưa bị thỏa hiệp.

from ultralytics import YOLO

# Load a custom-trained Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")

# Validate the model on a trusted dataset to detect performance drops
# Sudden decreases in precision/recall may indicate data poisoning
metrics = model.val(data="clean_validation_data.yaml")

print(f"mAP50-95: {metrics.box.map}")  # Review core metrics

Đối với các dự án thị giác máy tính quy mô lớn, việc theo dõi các chỉ số này qua nhiều lượt huấn luyện là rất cần thiết. Các nhà phát triển có thể khám phá thông tin chuyên sâu về đánh giá mô hình để hiểu hiệu suất cơ sở và sử dụng Ultralytics Platform để chú thích, huấn luyện và quản lý dữ liệu một cách an toàn mà không cần dựa vào các nguồn bên ngoài chưa được xác minh. Kết hợp việc tuyển chọn dữ liệu an toàn với các kỹ thuật data augmentation có kiểm soát giúp đảm bảo mô hình của bạn duy trì cả độ chính xác và khả năng phục hồi trước các thao túng từ bên ngoài.

Explore solutions

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Data Poisoning

Link to this sectionCơ chế của việc đầu độc AI#

Link to this sectionCác ứng dụng và ví dụ thực tế#

Link to this sectionPhân biệt với tấn công đối nghịch#

Link to this sectionGiảm thiểu rủi ro trong phát triển mô hình#

Explore solutions

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

AI trong ngành Robot

AI trong Logistics

AI trong ngành Bán lẻ

AI trong chăm sóc sức khỏe

AI trong sản xuất

AI trong Ô tô

AI trong Nông nghiệp

Hãy cùng nhau xây dựng tương lai của AI!