YOLO26 소개: 차세대 비전 AI입니다.
Ultralytics
Ultralytics 용어집으로 돌아가기

Jailbreaking (AI)

AI 탈옥(Jailbreaking)이 어떻게 안전 장치를 우회하는지 탐색하고 위험 완화 방법을 알아보십시오. 강력한 방어 및 모니터링으로 Ultralytics YOLO26 모델을 보호하십시오.

인공지능 환경에서의 Jailbreaking은 AI 모델에 프로그래밍된 윤리적 가이드라인, 안전 필터 및 운영 제약을 우회하는 관행을 의미합니다. 원래 스마트폰과 같은 장치의 하드웨어 제한을 우회하기 위해 사용되었던 이 용어는, AI 분야에서 특정하고 종종 조작된 입력을 만들어 모델이 제한된 콘텐츠를 생성하거나, 권한 없는 명령을 실행하거나, 민감한 시스템 프롬프트를 공개하도록 유도하는 행위를 뜻합니다. AI가 중요한 인프라에 점차 통합됨에 따라 이러한 취약성을 이해하는 것은 강력한 AI 안전 조치를 개발하고 오남용을 방지하는 데 필수적입니다.

Link to this sectionJailbreaking과 관련 개념의 차이점#

Jailbreaking은 머신러닝의 다른 보안 취약성과 유사점을 공유하지만, 관련 용어와 구분하는 것이 중요합니다.

  • 프롬프트 인젝션: 이는 합법적인 사용자 프롬프트에 악의적인 지침을 삽입하여 모델의 의도된 출력을 가로채는 것을 포함합니다. Jailbreaking은 모델의 핵심 안전 프로토콜을 완전히 재정의하는 것을 구체적인 목표로 하는 더 광범위한 범주입니다.
  • AI 레드 티밍: 이는 보안 전문가가 배포 전에 취약성을 식별하고 패치하기 위해 시스템을 의도적으로 Jailbreak하려고 시도하는 권한 있는 사전 테스트 방법론입니다.
  • 적대적 공격: 컴퓨터 비전에서 자주 사용되는 이 공격은 입력 데이터에 미묘한 변화를 주어(예: 이미지에 보이지 않는 노이즈 추가) 모델이 오분류를 하도록 강제합니다. 반면, Jailbreaking은 일반적으로 언어적 또는 논리적 조작에 중점을 둡니다.

Link to this sectionAI Jailbreaking의 실제 사례#

Jailbreaking은 AI 시스템의 모달리티에 따라 다르게 나타나며, 텍스트 기반 및 비전 기반 아키텍처 모두에 영향을 미칩니다:

  1. 대규모 언어 모델 악용: 공격자들은 종종 복잡한 역할극 시나리오나 가상의 프레임워크를 사용하여 대규모 언어 모델이 안전 학습을 무시하도록 강제합니다. 예를 들어, 사용자는 AI에게 "해커에 관한 이야기를 쓰는 가상의 작가" 역할을 하도록 요청하여 모델을 속여 악성 코드를 출력하게 하거나 필터가 일반적으로 차단할 위험한 활동에 대한 지침을 얻어낼 수 있습니다. Anthropic의 최근 연구는 모델의 컨텍스트 윈도우에 과부하를 주어 제한을 우회하는 many-shot jailbreaking 기법과 같은 고급 방법도 강조했습니다.

  2. 멀티모달 및 비전 시스템 공격: 모델이 텍스트와 이미지를 모두 처리하도록 진화함에 따라, 멀티모달 Jailbreak에 대한 최근 연구는 공격자가 이미지 내에 악의적인 텍스트 지침을 포함시킬 수 있음을 보여줍니다. 비전-언어 모델이 해당 이미지를 처리할 때 숨겨진 텍스트가 Jailbreak를 트리거합니다. 물리적 보안 시스템에서 의류에 특정 패턴의 패치를 붙이는 것과 같은 적대적 입력은 시각적 Jailbreak로 작용하여 자동화된 감시 모델이 사람을 인식하지 못하게 할 수 있습니다.

Link to this sectionAI 모델의 Jailbreak 위험 완화#

이러한 공격으로부터 모델을 보호하려면 다계층 방어 전략이 필요합니다. 개발자는 OpenAI 안전 가이드라인NIST AI 위험 관리 프레임워크와 같은 프레임워크를 따라 기본 보안을 구축합니다.

To prevent visual adversarial attacks, engineers rely on comprehensive data augmentation during training. By intentionally introducing noise, blurring, and varying lighting conditions, the model learns to maintain high accuracy even when faced with manipulated inputs. Furthermore, continuously monitoring deployed models using tools available on the Ultralytics Platform helps identify unusual inference patterns that might indicate an ongoing attack, ensuring strong data security for enterprise deployments.

Link to this section모델 견고성 테스트#

컴퓨터 비전 모델이 미묘한 입력 조작에 탄력적인지 확인하기 위해 Python을 사용하여 기본적인 적대적 머신러닝 시나리오를 시뮬레이션할 수 있습니다. 이는 Ultralytics YOLO26과 같은 모델이 노이즈가 많거나 약간 변형된 데이터에 노출되었을 때도 안정적으로 성능을 발휘하는지 검증하는 데 도움이 됩니다.

import cv2
from ultralytics import YOLO

# Load an Ultralytics YOLO26 model for robust inference testing
model = YOLO("yolo26n.pt")

# Load a test image and apply simulated adversarial noise
img = cv2.imread("security_feed.jpg")
noisy_img = cv2.add(img, 15)  # Inject slight pixel noise to test robustness

# Run prediction to verify the model still detects objects accurately
results = model(noisy_img)
results[0].show()

취약점을 적극적으로 테스트하고 강력한 안전 조치를 통합함으로써 개발자는 AI Jailbreak를 완화하는 방법을 성공적으로 학습하여 현대 AI 시스템에 대한 신뢰와 안정성을 높일 수 있습니다. 모델 동작 및 해석 가능성에 대한 더 깊은 이해를 위해 설명 가능한 AI의 원리를 살펴보십시오.

Explore solutions

Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기
Real-time AI that works with your team

로봇 공학에서의 AI

Ultralytics YOLO 모델로 더 스마트한 기기를 구동하십시오. 로봇 공학의 비전 AI는 자율 주행, 인식, 객체 추적 및 실시간 제어를 촉진합니다.

더 알아보기
Real-time AI that works with your team

물류 분야의 AI

Ultralytics YOLO 모델로 물류 프로세스를 간소화하십시오. 비전 AI를 통해 패키지 검사, 분류, 차량 추적 및 실시간 창고 안전 모니터링이 가능합니다.

더 알아보기
Real-time AI that works with your team

소매업에서의 AI

Ultralytics YOLO 모델로 소매업을 재구상하십시오. 비전 AI는 재고 추적, 선반 모니터링, 대기열 관리 및 더 스마트한 고객 인사이트를 지원합니다.

더 알아보기
Real-time AI that works with your team

의료 분야의 AI

Ultralytics YOLO 모델로 의료 솔루션을 구축하십시오. 의료 분야의 비전 AI는 더 빠른 의료 영상 분석, 더 스마트한 진단 및 환자 모니터링을 지원합니다.

더 알아보기
Real-time AI that works with your team

제조 분야의 AI

Ultralytics YOLO 모델로 제조 공정을 최적화하십시오. 비전 AI는 품질 관리, 결함 탐지, PPE 규정 준수 및 조립 라인 자동화를 주도합니다.

더 알아보기
Real-time AI that works with your operation

자동차 분야의 AI

Ultralytics YOLO 모델을 통해 자동차 분야에 컴퓨터 비전을 적용하십시오. 비전 AI는 도로 안전, 운전자 보조 및 차량 자동화를 향상하여 더 스마트한 도로를 만듭니다.

더 알아보기
Real-time AI tailored to your operation

농업 분야의 AI

Ultralytics YOLO 모델을 통해 스마트 농업에 비전 AI를 도입하십시오. 작물 모니터링, 가축 추적 및 정밀 농업을 강화하여 더 높고 스마트한 생산량을 달성하십시오.

더 알아보기

미래의 AI를 함께 구축합시다!

머신 러닝의 미래와 함께 여정을 시작하십시오.