Veri zehirlenmesi ve bunun yapay zeka üzerindeki etkileri hakkında bilgi edinin. Ultralytics ile Ultralytics modellerini nasıl güvenli hale getirebileceğinizi ve eğitim verilerini nasıl koruyabileceğinizi keşfedin.
Veri zehirleme, kötü niyetli aktörlerin Makine Öğrenimi (ML) modellerinin oluşturulmasında kullanılan eğitim verilerini kasıtlı olarak manipüle ettiği bir siber güvenlik tehdididir. Saldırganlar, model eğitilmeden önce veri setini bozarak gizli arka kapılar açabilir, önyargılar yaratabilir veya modelin genel performansını düşürebilir. Bir sistemin kodunu hedef alan diğer güvenlik açıklarından farklı olarak, veri zehirleme saldırıları öğrenme sürecinin kendisini hedef alır; bu da model üretim ortamlarına detect bu saldırıları detect son derece zor hale getirir. IBM'in tehdit istihbaratı genel bakışına göre, bu saldırılar yapay zeka sistemlerinin bütünlüğü ve güvenilirliği için ciddi riskler oluşturmaktadır.
Kuruluşlar, Derin Öğrenme (DL) ve Büyük Dil Modelleri’ne (LLM) giderek daha fazla güvenmeye başladıkça, genellikle internetten doğrulanmamış büyük miktarda veri topluyorlar. Bu uygulama, saldırganların kamuya açık veri havuzlarına uydurma veya kötü niyetli veri noktaları eklediği veri enjeksiyonu saldırılarına zemin hazırlıyor. 2025'ten itibaren yapay zeka zehirlenmesine ilişkin son araştırmalar, endişe verici bir gerçeği ortaya koyuyor: milyarlarca parametreye sahip devasa modellerde bile, bir saldırganın sistemi tehlikeye atmak için neredeyse sabit ve minimum sayıda örneği manipüle etmesi yeterli.
LLM zehirlenmesi, modelin eğitim sırasında kullandığı metinlere belirli tetikleyici ifadelerin eklenmesiyle ortaya çıkar. Uygulamaya konulduktan sonra model, bir kullanıcı tetikleyici ifadeyi girene kadar normal şekilde çalışabilir; bu durum, sistemin güvenlik protokollerini atlamasına veya zararlı çıktılar üretmesine neden olur. Anthropic LLM zehirlenmesi üzerine yaptığı 2025 araştırması, sadece 250 zehirli belgenin 13 milyar parametreli bir modelde bir arka kapı oluşturabileceğini göstermektedir.
Veri zehirlenmesi, metin üretiminin ötesine geçerek Bilgisayar Görme (CV) modellerini de ciddi şekilde etkiliyor. İşte bu tehdidin gerçek dünya uygulamalarında nasıl ortaya çıktığını gösteren iki somut örnek:
Her ne kadar birbirleriyle yakından ilişkili olsalar da, veri zehirleme ile düşmanca saldırıları birbirinden ayırmak önemlidir. Düşmanca saldırılar çıkarım sırasında gerçekleşir; saldırgan, önceden eğitilmiş bir modeli aldatmak için girdi verilerini manipüle eder (tıpkı gerçek dünyadaki bir dur işaretine etiket yapıştırmak gibi). Buna karşılık, veri zehirlenmesi eğitim sırasında gerçekleşir ve modelin iç mantığını temelden değiştirir. Her ikisini de ele almak için sağlam AI Güvenlik protokolleri gereklidir.
Bu tehditlere karşı savunma sağlamak için titiz bir model izleme süreci ve model bütünlüğünü doğrulamak üzere kusursuz, güvenilir doğrulama verilerinin kullanılması gerekir. Bir modeli doğrulanmış bir veri kümesine göre değerlendirmek, ekiplerin müdahaleye işaret edebilecek beklenmedik performans düşüşlerini tespit etmesine yardımcı olabilir. OpenAI’nin güvenlik araştırmaları ve OWASP GenAI Güvenlik Projesi tarafından ortaya konan en iyi uygulamalar, sıkı veri kaynağı izleme ve ham web taraması yerine özenle seçilmiş veri kümelerinin kullanılmasını vurgulamaktadır.
Modelleri oluştururken ve test ederken, ekipler PyTorch veya TensorFlow kullanmalıdır. Ultralytics modelinizi, temiz ve güvenilir bir veri seti ile kolayca doğrulayarak, doğruluğun bozulmadığından emin olabilirsiniz.
from ultralytics import YOLO
# Load a custom-trained Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on a trusted dataset to detect performance drops
# Sudden decreases in precision/recall may indicate data poisoning
metrics = model.val(data="clean_validation_data.yaml")
print(f"mAP50-95: {metrics.box.map}") # Review core metrics
Büyük ölçekli bilgisayar görme projelerinde, bu metrikleri birden fazla eğitim döngüsü boyunca takip etmek hayati önem taşır. Geliştiriciler, temel performansı anlamak için model değerlendirme bilgilerini inceleyebilir ve Ultralytics kullanarak, doğrulanmamış harici kaynaklara güvenmek zorunda kalmadan verileri güvenli bir şekilde etiketleyebilir, eğitebilir ve yönetebilir. Güvenli veri düzenlemeyi kontrollü veri artırma teknikleriyle birleştirmek, modellerinizin hem doğru kalmasını hem de dış müdahalelere karşı dayanıklı olmasını sağlamaya yardımcı olur.
Makine öğreniminin geleceği ile yolculuğunuza başlayın