Scopri YOLO26: vision AI di prossima generazione.
Ultralytics
Torna al glossario Ultralytics

Jailbreaking (AI)

Esplora come il jailbreaking dell'IA bypassa i guardrail di sicurezza e impara a mitigare i rischi. Proteggi i modelli Ultralytics YOLO26 con difese e monitoraggio robusti.

Il jailbreaking nel contesto dell'intelligenza artificiale si riferisce alla pratica di aggirare le linee guida etiche, i filtri di sicurezza e i vincoli operativi programmati in un modello AI. Originariamente un termine usato per aggirare le restrizioni hardware su dispositivi come gli smartphone, il jailbreaking dell'AI comporta la creazione di input specifici, spesso manipolatori, che ingannano il modello spingendolo a generare contenuti soggetti a restrizioni, a eseguire comandi non autorizzati o a rivelare system prompt sensibili. Poiché l'AI è sempre più integrata nelle infrastrutture critiche, comprendere queste vulnerabilità è essenziale per sviluppare solide misure di sicurezza dell'AI e prevenire usi impropri.

Link to this sectionDifferenziare il jailbreaking da concetti correlati#

Sebbene il jailbreaking condivida somiglianze con altre vulnerabilità di sicurezza nel machine learning, è importante distinguerlo da termini correlati:

  • Prompt Injection: consiste nell'inserire istruzioni dannose in un prompt legittimo dell'utente per dirottare l'output previsto di un modello. Il jailbreaking è una categoria più ampia che mira specificamente a sovrascrivere completamente i protocolli di sicurezza principali del modello.
  • AI Red Teaming: si tratta di una metodologia di test proattiva e autorizzata, in cui professionisti della sicurezza tentano intenzionalmente di eseguire il jailbreak di un sistema per identificare e correggere le vulnerabilità prima della distribuzione.
  • Attacchi avversari: spesso utilizzati nella computer vision, comportano l'alterazione sottile dei dati di input (come l'aggiunta di rumore invisibile a un'immagine) per costringere un modello a compiere una classificazione errata, mentre il jailbreaking si concentra tipicamente sulla manipolazione linguistica o logica.

Link to this sectionEsempi reali di jailbreaking dell'AI#

Il jailbreaking si manifesta in modi diversi a seconda della modalità del sistema AI, influenzando sia le architetture basate su testo che quelle basate su visione:

  1. Sfruttare i Large Language Models: gli aggressori spesso usano complessi scenari di gioco di ruolo o framework ipotetici per costringere i large language models a ignorare il loro addestramento sulla sicurezza. Ad esempio, un utente potrebbe chiedere a un'AI di agire come uno "scrittore di narrativa che racconta la storia di un hacker", riuscendo a ingannare il modello spingendolo a generare codice dannoso o istruzioni per attività pericolose che i suoi filtri bloccherebbero normalmente. Ricerche recenti di Anthropic hanno anche evidenziato metodi avanzati come le tecniche di jailbreaking many-shot, che sovraccaricano la finestra di contesto del modello per aggirare le restrizioni.

  2. Attacchi ai sistemi multimodali e di visione: man mano che i modelli si evolvono per elaborare sia testo che immagini, ricerche recenti sui jailbreak multimodali dimostrano che gli aggressori possono incorporare istruzioni testuali dannose all'interno di un'immagine. Quando un modello vision-language elabora l'immagine, il testo nascosto innesca un jailbreak. Nei sistemi di sicurezza fisica, gli input avversari—come una patch con motivi specifici sui vestiti—possono agire come un jailbreak visivo, rendendo la persona invisibile ai modelli di sorveglianza automatizzata.

Link to this sectionMitigare i rischi di jailbreak nei modelli AI#

Proteggere i modelli contro questi exploit richiede una strategia di difesa a più livelli. Gli sviluppatori seguono le linee guida di sicurezza di OpenAI e framework come il NIST AI Risk Management Framework per stabilire una sicurezza di base.

Per prevenire attacchi visivi avversari, gli ingegneri si affidano a un'esaustiva data augmentation durante l'addestramento. Introducendo intenzionalmente rumore, sfocature e condizioni di illuminazione variabili, il modello impara a mantenere un'elevata precisione anche di fronte a input manipolati. Inoltre, monitorare continuamente i modelli distribuiti utilizzando gli strumenti disponibili sulla piattaforma Ultralytics aiuta a identificare modelli di inferenza insoliti che potrebbero indicare un attacco in corso, garantendo una solida sicurezza dei dati per le implementazioni aziendali.

Link to this sectionTestare la robustezza del modello#

Per assicurarti che i tuoi modelli di computer vision siano resilienti contro manipolazioni sottili dell'input, puoi simulare scenari di base di adversarial machine learning usando Python. Questo aiuta a verificare che un modello come Ultralytics YOLO26 continui a funzionare in modo affidabile quando esposto a dati rumorosi o leggermente alterati.

import cv2
from ultralytics import YOLO

# Load an Ultralytics YOLO26 model for robust inference testing
model = YOLO("yolo26n.pt")

# Load a test image and apply simulated adversarial noise
img = cv2.imread("security_feed.jpg")
noisy_img = cv2.add(img, 15)  # Inject slight pixel noise to test robustness

# Run prediction to verify the model still detects objects accurately
results = model(noisy_img)
results[0].show()

Testando attivamente le vulnerabilità e incorporando solide misure di sicurezza, gli sviluppatori possono imparare con successo come possono essere mitigati i jailbreak dell'AI, promuovendo fiducia e affidabilità nei moderni sistemi AI. Per una comprensione più approfondita del comportamento e dell'interpretabilità dei modelli, esplora i principi dell'AI spiegabile.

Explore solutions

Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più
Real-time AI that works with your team

AI nella Robotica

Potenzia macchine più intelligenti con i modelli Ultralytics YOLO. La Vision AI nella robotica guida la navigazione autonoma, la percezione, il tracciamento degli oggetti e il controllo in tempo reale.

Scopri di più
Real-time AI that works with your team

IA nella logistica

Semplifica la logistica con i modelli Ultralytics YOLO. La Vision AI abilita l'ispezione dei pacchi, lo smistamento, il tracciamento dei veicoli e il monitoraggio della sicurezza in magazzino in tempo reale.

Scopri di più
Real-time AI that works with your team

AI nel settore Retail

Reimmagina il retail con i modelli Ultralytics YOLO. La Vision AI alimenta il tracciamento dell'inventario, il monitoraggio degli scaffali, la gestione delle code e insight più intelligenti sui clienti.

Scopri di più
Real-time AI that works with your team

IA nel settore sanitario

Crea soluzioni sanitarie con i modelli Ultralytics YOLO. La vision AI nella sanità potenzia l'imaging medico più rapido, diagnosi più intelligenti e il monitoraggio dei pazienti.

Scopri di più
Real-time AI that works with your team

IA nella produzione

Ottimizza la produzione con i modelli Ultralytics YOLO. La Vision AI guida il controllo qualità, il rilevamento dei difetti, la conformità ai DPI e l'automazione della linea di assemblaggio.

Scopri di più
Real-time AI that works with your operation

AI nel settore automobilistico

Applica la computer vision al settore automobilistico con i modelli Ultralytics YOLO. La vision AI migliora la sicurezza stradale, l'assistenza alla guida e l'automazione dei veicoli per strade più intelligenti.

Scopri di più
Real-time AI tailored to your operation

AI in Agricoltura

Porta la vision AI nell'agricoltura intelligente con i modelli Ultralytics YOLO. Potenzia il monitoraggio delle colture, il tracciamento del bestiame e l'agricoltura di precisione per rese più elevate e intelligenti.

Scopri di più

Costruiamo insieme il futuro dell'AI!

Inizia il tuo viaggio con il futuro del machine learning