AI Safety
Hizalanma ve sağlamlık dahil yapay zeka güvenliğinin temel direklerini öğren. Ultralytics YOLO26 ile güvenilir modeller dağıtmayı ve yapay zeka güvenilirliğini sağlamayı keşfet.
AI Güvenliği, Yapay Zeka (AI) sistemlerinin güvenilir, öngörülebilir ve faydalı bir şekilde çalışmasını sağlamaya odaklanan çok disiplinli bir alandır. Sistemleri dış saldırılardan koruyan siber güvenliğin aksine, AI Güvenliği sistemin tasarımında ve işleyişinde içsel olarak bulunan riskleri ele alır. Buna, hedef uyumsuzluğundan, yeni ortamlardaki sağlamlık eksikliğinden veya Derin Öğrenme (DL) genellemesindeki hatalardan kaynaklanan istenmeyen sonuçların önlenmesi dahildir. Modeller daha otonom hale geldikçe, Center for Human-Compatible AI gibi kuruluşlardaki araştırmacılar, bu teknolojilerin insan niyeti ve güvenlik standartlarıyla uyumlu olmasını sağlamak için çalışmaktadır.
Link to this sectionGüvenli AI'nın Temel Direkleri#
Güvenli bir sistem oluşturmak, basit doğruluk metriklerinin ötesine geçen çeşitli teknik zorlukların ele alınmasını gerektirir. Bu direkler, Makine Öğrenimi (ML) modellerinin karmaşık, gerçek dünya senaryolarında devreye alındığında bile kontrol altında kalmasını sağlar.
- Sağlamlık: Güvenli bir model, bozulmuş girdilerle veya ortamdaki değişikliklerle karşılaştığında performansını korumalıdır. Buna, girdi verilerindeki küçük manipülasyonların bir modeli yüksek güvenle hatalar yapmaya itebildiği çekişmeli saldırılara karşı savunma dahildir.
- Hizalanma: Bu ilke, bir AI'nın hedeflerinin tasarımcının gerçek niyetiyle eşleşmesini sağlar. Uyumsuzluk genellikle bir sistem ödül fonksiyonunu "istismar etmeyi" öğrendiğinde Pekiştirmeli Öğrenme süreçlerinde ortaya çıkar; örneğin, bir temizlik robotunun ortalığı daha hızlı temizlemek için vazoyu kırması gibi. Bunu hafifletmek için İnsan Geri Bildirimiyle Pekiştirmeli Öğrenme (RLHF) gibi teknikler kullanılır.
- Yorumlanabilirlik: Açıklanabilir AI (XAI) olarak da bilinen bu kavram, "kara kutu" modellerde şeffaflık oluşturmayı içerir. Özellik haritalarını görselleştirmek, mühendislerin karar alma sürecini anlamalarını sağlar ve modelin yanıltıcı korelasyonlara dayanmadığından emin olmalarına yardımcı olur.
- Monitoring: Continuous model monitoring is essential to detect data drift. Safety protocols must trigger alerts or fallback mechanisms if the real-world data begins to diverge significantly from the training data.
Link to this sectionGerçek Dünya Uygulamaları#
AI Güvenliği, algoritmik başarısızlığın fiziksel zarara veya önemli ekonomik kayıplara yol açabileceği yüksek riskli alanlarda hayati önem taşır.
-
Otonom Araçlar: Otomotivde AI alanında güvenlik çerçeveleri, bir aracın belirsizliğe nasıl tepki vereceğini tanımlar. Bir nesne algılama modeli bir engeli yüksek güvenle tanımlayamazsa, sistem tahmin yürütmek yerine fren yapmak gibi güvenli bir duruma geçmelidir. NHTSA Otonom Araçlar kılavuzları, bu güvenli hata mekanizmalarını vurgulamaktadır.
-
Tıbbi Teşhis: Sağlık hizmetlerinde AI uygulandığında güvenlik, kritik teşhislerde yanlış negatifleri en aza indirmeyi içerir. Sistemler genellikle hiçbir potansiyel durumun gözden kaçırılmaması için yüksek duyarlılık (recall) ile ayarlanır ve fiilen doktorlar için bir "ikinci görüş" görevi görür. FDA Dijital Sağlık Merkezi gibi düzenleyici kurumlar, tıbbi cihaz olarak yazılım (SaMD) için katı standartlar belirlemektedir.
Link to this sectionGüvenlik Eşiklerinin Uygulanması#
Bilgisayarlı görüdeki en temel güvenlik mekanizmalarından biri güven eşiklerinin kullanımıdır. Çıkarım sırasında düşük olasılıklı tahminleri filtreleyerek geliştiriciler, sistemlerin zayıf bilgilere göre hareket etmesini engeller.
Aşağıdaki örnek, Ultralytics YOLO26 kullanarak nasıl bir güvenlik filtresi uygulanacağını ve yalnızca güvenilir tespitlerin işlenmesinin nasıl sağlanacağını göstermektedir.
from ultralytics import YOLO
# Load the YOLO26 model (latest standard for efficiency)
model = YOLO("yolo26n.pt")
# Run inference with a strict confidence threshold of 0.7 (70%)
# This acts as a safety gate to ignore uncertain predictions
results = model.predict("https://ultralytics.com/images/bus.jpg", conf=0.7)
# Verify detections meet safety criteria
print(f"Safety Check: {len(results[0].boxes)} objects detected with >70% confidence.")Link to this sectionAI Güvenliği vs. AI Etiği#
Bu terimler genellikle birbirinin yerine kullanılsa da, sorumlu AI'nın farklı yönlerini ele alırlar.
- AI Güvenliği teknik bir mühendislik disiplinidir. "Bu sistem kazalara yol açmadan doğru şekilde çalışacak mı?" diye sorar. Model halüsinasyonu ve pekiştirmeli öğrenmede güvenli keşif gibi sorunlarla ilgilenir.
- AI Etiği sosyoteknik bir çerçevedir. "Bu sistemi inşa etmeli miyiz ve bu adil mi?" diye sorar. Algoritmik yanlılık, gizlilik hakları ve AB AI Yasası'nda belirtildiği gibi faydaların adil dağılımı gibi konulara odaklanır.
Link to this sectionGelecek Görünümü#
As the industry moves toward Artificial General Intelligence (AGI), safety research is becoming increasingly critical. Organizations can leverage the Ultralytics Platform to manage their datasets and oversee model deployment, ensuring that their AI solutions remain robust, transparent, and aligned with safety standards throughout their lifecycle.






