Data Poisoning
Veri zehirlenmesi ve bunun yapay zeka üzerindeki etkisi hakkında bilgi edin. Ultralytics YOLO26 modellerini nasıl güvence altına alacağını ve eğitim verilerini Ultralytics Platform ile nasıl koruyacağını keşfet.
Data poisoning is a cybersecurity threat where malicious actors intentionally manipulate the training data used to build Machine Learning (ML) models. By corrupting the dataset before a model is trained, attackers can introduce hidden backdoors, induce biases, or degrade the overall performance of the model. Unlike other security exploits that target a system's code, data poisoning attacks target the learning process itself, making them incredibly difficult to detect once the model is deployed into production environments. According to IBM's threat intelligence overview, these attacks pose severe risks to the integrity and reliability of artificial intelligence systems.
Link to this sectionYapay Zeka Zehirlemenin Mekanikleri#
Kuruluşlar giderek daha fazla Derin Öğrenmeye (DL) ve Büyük Dil Modellerine (LLM) güvendikçe, internetten genellikle doğrulanmamış çok miktarda veriyi kazırlar. Bu uygulama, düşmanların kamuya açık havuzlara sahte veya kötü niyetli veri noktaları eklediği veri enjeksiyonu için fırsatlar yaratır. 2025 yılından Yapay Zeka zehirleme üzerine yapılan son çalışmalar, endişe verici bir gerçeği ortaya koyuyor: milyarlarca parametreye sahip devasa modeller için bile, bir saldırganın sistemi tehlikeye atmak için neredeyse sabit, minimum sayıda örneği manipüle etmesi yeterlidir.
LLM zehirlemesi, modelin eğitim sırasında tükettiği metinlere belirli tetikleyici ifadeler enjekte edildiğinde ortaya çıkar. Model dağıtıldıktan sonra, bir kullanıcı tetikleyici ifadeyi girene kadar normal şekilde çalışabilir; bu da sistemin güvenlik protokollerini atlamasına veya toksik çıktılar üretmesine neden olur. Anthropic'in 2025 yılı LLM zehirleme araştırması, 13 milyar parametreli bir modelde 250 kadar zehirli belgenin arka kapı oluşturabildiğini göstermektedir.
Link to this sectionGerçek Dünya Uygulamaları ve Örnekleri#
Veri zehirleme, metin üretiminin ötesine geçer ve Bilgisayarlı Görü (CV) modellerini de ağır bir şekilde etkiler. Bu tehdidin gerçek dünya uygulamalarında nasıl somutlaştığına dair iki somut örnek şöyledir:
- Üretken Sanat Modellerini Aksatmak: Nightshade projesi gibi araçlar, dijital sanatçıların çalışmalarını çevrimiçi yüklemeden önce piksellerini incelikle değiştirmelerini sağlar. Bir Üretken Yapay Zeka modeli, eğitim için bu görüntüleri kazıdığında, değiştirilen pikseller bir zehir görevi görerek modelin istemleri tamamen yanlış sınıflandırmasına neden olur; örneğin, bir araba istendiğinde kedi görüntüsü oluşturması gibi.
- Otonom Araçları Tehlikeye Atmak: Kendi kendine giden arabalar için kullanılan nesne algılama sistemlerinde, bir saldırgan açık kaynaklı bir eğitim veri kümesindeki dur tabelası görüntülerini ince bir şekilde değiştirebilir. Belirli görsel gürültüleri uygulayarak, zehirli eğitim verisi modele dur tabelalarını hız sınırı tabelaları olarak yanlış yorumlamasını öğretir ve bu da felaket boyutunda güvenlik riskleri oluşturur.
Link to this sectionAdversarial Saldırılardan Ayırt Etme#
Yakından ilişkili olsa da, veri zehirlemeyi Adversarial Saldırılardan ayırt etmek önemlidir. Adversarial saldırılar çıkarım sırasında gerçekleşir; saldırgan, halihazırda eğitilmiş bir modeli kandırmak için girdi verilerini manipüle eder (gerçek bir dur tabelasına çıkartma yapıştırmak gibi). Aksine, veri zehirleme eğitim sırasında gerçekleşir ve modelin iç mantığını temelden değiştirir. Her ikisini de ele almak, sağlam Yapay Zeka Güvenliği protokolleri gerektirir.
Link to this sectionModel Geliştirmede Risklerin Azaltılması#
Bu tehditlere karşı savunma, titiz model izleme ve model bütünlüğünü doğrulamak için el değmemiş, güvenilir doğrulama verilerinin kullanılmasını gerektirir. Bir modeli doğrulanmış bir veri kümesine karşı değerlendirmek, ekiplerin kurcalanmaya işaret edebilecek beklenmedik performans düşüşlerini yakalamasına yardımcı olabilir. OpenAI'nin güvenlik araştırması ve OWASP GenAI Güvenlik Projesi tarafından ana hatları belirlenen en iyi uygulamalar, katı veri kökenini ve ham web kazıma yerine küratörlü veri kümelerinin kullanımını vurgulamaktadır.
Modelleri oluştururken ve test ederken, ekipler PyTorch veya TensorFlow gibi yerleşik çerçevelerden kapsamlı doğrulama rutinleriyle birlikte yararlanmalıdır. Ultralytics YOLO26 modelinizi, doğruluğun tehlikeye atılmadığından emin olmak için temiz, güvenilir bir veri kümesine karşı kolayca doğrulayabilirsin.
from ultralytics import YOLO
# Load a custom-trained Ultralytics YOLO26 model
model = YOLO("yolo26n.pt")
# Validate the model on a trusted dataset to detect performance drops
# Sudden decreases in precision/recall may indicate data poisoning
metrics = model.val(data="clean_validation_data.yaml")
print(f"mAP50-95: {metrics.box.map}") # Review core metricsBüyük ölçekli bilgisayarlı görü projeleri için, bu metrikleri birden fazla eğitim çalışması boyunca izlemek esastır. Geliştiriciler, temel performansı anlamak için model değerlendirme içgörülerini keşfedebilir ve doğrulanmamış harici kaynaklara güvenmeden verileri güvenli bir şekilde etiketlemek, eğitmek ve yönetmek için Ultralytics Platform'dan yararlanabilirler. Güvenli veri küratörlüğünü kontrollü veri artırma teknikleriyle birleştirmek, modellerinin hem doğru kalmasını hem de dış manipülasyona karşı dayanıklı olmasını sağlamaya yardımcı olur.






