Глоссарий

Безопасность данных

Изучите основные стратегии обеспечения безопасности данных для ИИ. Научитесь защищать модели Ultralytics , противостоять враждебным атакам и внедрять автоматическую редакцию.

Безопасность данных включает в себя защитные меры, стратегии и технологии, используемые для защиты цифровой информации от несанкционированного доступа, повреждения, кражи или нарушения на протяжении всего ее жизненного цикла. В контексте машинного обучения (ML) и искусственного интеллекта (ИИ) эта дисциплина имеет первостепенное значение для обеспечения надежности прогнозирующих систем и поддержания доверия пользователей. Она включает в себя обеспечение безопасности обширных наборов данных, необходимых для обучения, защиту проприетарных алгоритмов, определяющих поведение модели, и укрепление инфраструктуры, в которой работают эти модели. Комплексная стратегия безопасности учитывает «триаду CIA» — обеспечение конфиденциальности, целостности и доступности данных.

Роль безопасности в конвейерах искусственного интеллекта

По мере того как организации все чаще интегрируют компьютерное зрение (CV) и другие технологии искусственного интеллекта в критически важные рабочие процессы, расширяется поверхность атаки для потенциальных нарушений. Обеспечение безопасности конвейера искусственного интеллекта отличается от традиционной ИТ-безопасности, поскольку сами модели могут стать целью атак или манипуляций.

Защита интеллектуальной собственности: Современные архитектуры, такие как YOLO26, представляют собой значительные инвестиции в исследования и вычислительные ресурсы. Надежные протоколы безопасности, включая стандарты шифрования моделей, необходимы для предотвращения извлечения или кражи моделей конкурентами.
Защита от враждебных атак: без адекватных средств защиты нейронные сети уязвимы для враждебных атак. В таких сценариях злоумышленники вводят в входные данные незаметные, часто неощутимые помехи, чтобы заставить модель делать неверные классификации, что создает серьезные риски в системах, критичных с точки зрения безопасности, таких как автономное вождение.
Предотвращение «отравления данных»: меры безопасности должны предотвращать «отравление данных», когда злоумышленники вводят вредоносные образцы в учебные данные, чтобы скомпрометировать будущее поведение модели. Это особенно важно для систем, использующих активные циклы обучения, в которых модель постоянно обновляется на основе новых входных данных. Для более глубокого изучения этих угроз OWASP Machine Learning Security Top10 предоставляет стандартную для отрасли структуру.

Применение в реальном мире

Безопасность данных является основополагающим требованием для внедрения надежных систем искусственного интеллекта в чувствительных отраслях.

Соблюдение требований в сфере здравоохранения и анонимизация

В сфере искусственного интеллекта в здравоохранении обработка данных пациентов требует строгого соблюдения таких нормативных актов, как HIPAA. Когда больницы используют анализ медицинских изображений для detect или переломов, поток данных должен быть зашифрован как в состоянии покоя, так и при передаче. Кроме того, системы часто удаляют метаданные DICOM или используют Edge AI для обработки изображений локально на устройстве, гарантируя, что конфиденциальная личная информация (PII) никогда не покидает безопасную сеть учреждения.

Умный город: видеонаблюдение

Современные «умные» города полагаются на обнаружение объектов для управления транспортными потоками и повышения общественной безопасности. В соответствии со стандартами конфиденциальности, такими как GDPR, камеры безопасности часто используют функцию редактирования в режиме реального времени. Это гарантирует, что система может считать транспортные средства или detect , но при этом автоматически скрывает номерные знаки и лица для защиты личности граждан.

Техническая реализация: автоматизированная редакция

Одним из распространенных методов обеспечения безопасности данных в компьютерном зрении является автоматическое размывание конфиденциальных объектов во время вывода. Следующий Python демонстрирует, как использовать ultralytics с YOLO26 модель для detect на изображении и применения гауссового размытия к их ограничительным рамкам, что позволяет эффективно анонимизировать людей перед хранением или передачей данных.

import cv2
from ultralytics import YOLO

# Load the YOLO26 model (optimized for real-time inference)
model = YOLO("yolo26n.pt")
image = cv2.imread("street_scene.jpg")

# Perform object detection to find persons (class index 0)
results = model(image, classes=[0])

# Blur the detected regions to protect identity
for result in results:
    for box in result.boxes.xyxy:
        x1, y1, x2, y2 = map(int, box)
        # Apply Gaussian blur to the Region of Interest (ROI)
        image[y1:y2, x1:x2] = cv2.GaussianBlur(image[y1:y2, x1:x2], (51, 51), 0)