YOLO26の紹介: 次世代のビジョンAI。
Ultralytics
Ultralytics用語集に戻る

Jailbreaking (AI)

AIジェイルブレイクが安全ガードレールをどのように回避するかを探究し、そのリスクを軽減する方法を学びます。強固な防御とモニタリングでUltralytics YOLO26モデルを保護しましょう。

人工知能の文脈におけるジェイルブレイクとは、AIモデルにプログラムされた倫理的なガードレール、安全フィルタ、および運用上の制約を回避する行為を指します。もともとはスマートフォンなどのデバイスにおけるハードウェア制限を回避するための用語でしたが、AIにおけるジェイルブレイクは、制限されたコンテンツの生成、許可されていないコマンドの実行、あるいは機密性の高いシステムプロンプトの開示をAIモデルにさせるための、巧妙でしばしば操作的な入力を作成する手法を伴います。AIが重要なインフラに統合されるにつれ、これらの脆弱性を理解することは、強固なAI安全性対策を開発し、悪用を防ぐために不可欠となっています。

Link to this sectionジェイルブレイクと関連概念の区別#

ジェイルブレイクは機械学習における他のセキュリティ脆弱性と類似点がありますが、関連用語と区別することが重要です。

  • プロンプトインジェクション:これは、正規のユーザープロンプトに悪意のある指示を挿入し、モデルの意図された出力をハイジャックする手法です。ジェイルブレイクはより広範なカテゴリであり、特にモデルのコアとなる安全プロトコルを完全に上書きすることを目的とします。
  • AIレッドチーミング:これは、セキュリティ専門家が意図的にシステムへのジェイルブレイクを試み、デプロイ前に脆弱性を特定して修正する、認可された能動的なテスト手法です。
  • 敵対的攻撃コンピュータビジョンで頻繁に使用されるこの手法は、入力データに微妙な変化を加える(画像に不可視のノイズを追加するなど)ことでモデルに誤分類を強いるものですが、ジェイルブレイクは通常、言語的または論理的な操作に焦点を当てています。

Link to this sectionAIジェイルブレイクの現実の例#

ジェイルブレイクはAIシステムのモダリティに応じて異なる形で現れ、テキストベースおよびビジョンベースの両方のアーキテクチャに影響を及ぼします。

  1. 大規模言語モデルの悪用:攻撃者は多くの場合、複雑なロールプレイングシナリオや架空のフレームワークを使用して、大規模言語モデルに安全トレーニングを無視させようとします。例えば、ユーザーはAIに対して「ハッカーについての物語を書く架空の作家」として振る舞うよう指示し、モデルを騙して悪意のあるコードを出力させたり、フィルタが通常ブロックするような危険な活動の手順を表示させたりすることがあります。Anthropicによる最近の研究でも、モデルのコンテキストウィンドウに過負荷をかけて制限を回避するメニーショット・ジェイルブレイク技術のような高度な手法が注目されています。

  2. マルチモーダルおよびビジョンシステムへの攻撃:モデルがテキストと画像の両方を処理できるように進化するにつれ、マルチモーダル・ジェイルブレイクに関する最近の研究は、攻撃者が画像内に悪意のあるテキスト指示を埋め込めることを示しています。ビジョン言語モデルがその画像を処理すると、隠されたテキストがジェイルブレイクを引き起こします。物理的なセキュリティシステムでは、衣類に特定のパターンを施したパッチなどの敵対的入力が視覚的なジェイルブレイクとして機能し、自動監視モデルに対してその人物を不可視化させる可能性があります。

Link to this sectionAIモデルにおけるジェイルブレイクリスクの軽減#

これらのエクスプロイトからモデルを保護するには、多層的な防御戦略が必要です。開発者はOpenAI安全性ガイドラインNIST AIリスク管理フレームワークのようなフレームワークに従い、ベースラインとなるセキュリティを確立しています。

To prevent visual adversarial attacks, engineers rely on comprehensive data augmentation during training. By intentionally introducing noise, blurring, and varying lighting conditions, the model learns to maintain high accuracy even when faced with manipulated inputs. Furthermore, continuously monitoring deployed models using tools available on the Ultralytics Platform helps identify unusual inference patterns that might indicate an ongoing attack, ensuring strong data security for enterprise deployments.

Link to this sectionモデルの堅牢性のテスト#

コンピュータビジョンモデルが微妙な入力操作に対して耐性を持つことを確認するために、Pythonを使用して基本的な敵対的機械学習シナリオをシミュレートできます。これは、Ultralytics YOLO26のようなモデルが、ノイズやわずかに変更されたデータにさらされた際も信頼性の高いパフォーマンスを維持することを確認するのに役立ちます。

import cv2
from ultralytics import YOLO

# Load an Ultralytics YOLO26 model for robust inference testing
model = YOLO("yolo26n.pt")

# Load a test image and apply simulated adversarial noise
img = cv2.imread("security_feed.jpg")
noisy_img = cv2.add(img, 15)  # Inject slight pixel noise to test robustness

# Run prediction to verify the model still detects objects accurately
results = model(noisy_img)
results[0].show()

脆弱性を積極的にテストし、強固な安全対策を組み込むことで、開発者はAIジェイルブレイクをどのように軽減できるかを学習し、現代のAIシステムに対する信頼性と堅牢性を高めることができます。モデルの挙動と解釈可能性についてより深く理解するために、説明可能なAIの原則を探求してください。

Explore solutions

Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら
Real-time AI that works with your team

ロボティクスにおけるAI

Ultralytics YOLOモデルで、よりスマートなマシンを実現しましょう。ロボティクスにおけるビジョンAIは、自律航行、認識、物体追跡、リアルタイム制御を推進します。

詳細はこちら
Real-time AI that works with your team

物流におけるAI

Ultralytics YOLOモデルで物流を効率化しましょう。ビジョンAIにより、荷物の検査、仕分け、車両追跡、リアルタイムの倉庫安全モニタリングが可能になります。

詳細はこちら
Real-time AI that works with your team

小売業界におけるAI

Ultralytics YOLOモデルで小売を再定義しましょう。ビジョンAIは、在庫追跡、棚のモニタリング、キュー管理、そしてより賢明な顧客インサイトを促進します。

詳細はこちら
Real-time AI that works with your team

ヘルスケアにおけるAI

Ultralytics YOLOモデルを使用してヘルスケアソリューションを構築しましょう。ヘルスケア分野におけるビジョンAIは、より高速な医療画像診断、よりスマートな診断、患者モニタリングを推進します。

詳細はこちら
Real-time AI that works with your team

製造におけるAI

Ultralytics YOLOモデルで製造を最適化しましょう。ビジョンAIは、品質管理、欠陥検出、PPEコンプライアンス、組立ラインの自動化を促進します。

詳細はこちら
Real-time AI that works with your operation

自動車におけるAI

Ultralytics YOLOモデルを使用して、自動車分野にコンピュータビジョンを適用しましょう。ビジョンAIは、道路の安全性、運転支援、車両の自動化を向上させ、よりスマートな道路を実現します。

詳細はこちら
Real-time AI tailored to your operation

農業におけるAI

Ultralytics YOLOモデルを使用して、スマート農業にビジョンAIを導入しましょう。作物モニタリング、家畜のトラッキング、精密農業を強化し、より高くスマートな収穫を実現します。

詳細はこちら

AIの未来を共に築き上げましょう!

機械学習の未来とともに旅を始めましょう