Hallucination (in LLMs)
LLM'lerde yapay zeka halüsinasyonlarının nedenlerini ve risklerini keşfet. RAG, RLHF ve Ultralytics YOLO26 ile temelden bağlama kullanarak olgusal hataları nasıl azaltacağını öğren.
Yapay Zeka (YZ) dünyasında halüsinasyon, bir Büyük Dil Modelinin (LLM) kendinden emin ve sözdizimi açısından doğru, ancak olgusal olarak yanlış, saçma veya kaynak girdiye sadık olmayan içerik üretmesi fenomenini ifade eder. Çökme veya gözle görülür bir aksaklık üretebilecek standart yazılım hatalarının aksine, halüsinasyon gören bir model, yanlış bilgileri geçerli gerçeklerle aynı otoriteyle sunarak ikna edici bir uydurmacı gibi davranır. Bu durum, veri bütünlüğünün en önemli olduğu sağlık, hukuk ve finans gibi hassas alanlarda Üretken Yapay Zeka kullanan kuruluşlar için ciddi zorluklar oluşturmaktadır.
Link to this sectionHalüsinasyonlar Neden Ortaya Çıkar?#
To understand why models hallucinate, it is helpful to look at how they are built. LLMs are typically based on the Transformer architecture, which functions as a sophisticated prediction engine. Instead of querying a structured database of verified facts, the model predicts the next token in a sequence based on statistical probabilities derived from its training data.
Bu davranışı tetikleyen çeşitli faktörler şunlardır:
- Olasılıksal Tahmin: Model, olgusal doğruluk yerine akıcılığa ve tutarlılığa öncelik verir. Belirli bir kelime dizisi istatistiksel olarak olasıysa (olgusal olarak yanlış olsa bile), model bunu üretebilir. Bu kavram genellikle, modellerin anlamını kavramadan dil kalıplarını taklit ettiği stokastik papağanlar ile ilgili araştırmalarda tartışılır.
- Veri Kalitesi Sorunları: Eğitim için kullanılan devasa metin külliyatı çelişkiler, güncel olmayan bilgiler veya kurgu içeriyorsa, model bu yanlışlıkları tekrarlayabilir.
- Kaynak Amnezisi: LLM'ler çok miktarda bilgiyi model ağırlıklarına sıkıştırır. Bu süreçte genellikle belirli kaynaklarla olan bağlantıyı kaybederler ve bu da farklı kavramların veya olayların yanlış bir şekilde birleştirildiği "uydurma" (confabulation) durumuna yol açar.
Link to this sectionGerçek Dünyadan Halüsinasyon Örnekleri#
Halüsinasyonlar, zararsız yaratıcı süslemelerden ciddi olgusal hatalara kadar çeşitli şekillerde ortaya çıkabilir:
- Hukuki Uydurma: Hukuk profesyonellerinin dilekçe taslağı hazırlamak için YZ kullandığı ve modelin bir argümanı desteklemek için var olmayan mahkeme davaları ve alıntılar icat ettiğini fark ettikleri belgelenmiş durumlar vardır.
- Kod Üretimi: YZ asistanlarını kullanan geliştiriciler, modelin standart adlandırma kurallarına uyduğu için aslında var olmayan bir yazılım kütüphanesini içe aktarmayı veya bir fonksiyonu çağırmayı önerdiği "paket halüsinasyonları" ile karşılaşabilirler.
- Biyografik Hatalar: Daha az ünlü kişiler hakkında soru sorulduğunda, modeller kendinden emin bir şekilde onlara yanlış başarılar, doğum yerleri veya kariyer geçmişleri atfedebilir ve birden fazla kişinin ayrıntılarını etkili bir şekilde harmanlayabilir.
Link to this sectionAzaltma Stratejileri#
Halüsinasyonların sıklığını azaltmak, YZ Güvenliğinin ana odak noktalarından biridir. Mühendisler ve araştırmacılar, modelleri gerçekliğe dayandırmak için çeşitli teknikler kullanırlar:
- Retrieval-Augmented Generation (RAG): Bu yöntem, LLM'i genellikle bir vektör veritabanında indekslenen harici, güvenilir bir bilgi tabanına bağlar. Bir cevap üretmeden önce ilgili belgeleri alarak, model gerçek verilerle sınırlandırılmış olur.
- Chain-of-Thought (Düşünce Zinciri) İstemi: Bu istem mühendisliği tekniği, modelin karmaşık akıl yürütmeyi ara adımlara bölerek "çalışmasını göstermesini" teşvik eder, bu da genellikle mantık hatalarını azaltır.
- İnsan Geri Bildirimli Pekiştirmeli Öğrenme (RLHF): İnce ayar aşamasında, insan değerlendiriciler modelin yanıtlarını sıralar. Halüsinasyonları cezalandırarak ve doğruluğu ödüllendirerek, model insan beklentileriyle daha iyi uyum sağlamayı öğrenir.
Link to this sectionLLM'leri Bilgisayarlı Görü ile Temellendirme#
Çok Modlu YZ sistemlerinde, metin üretimi görsel veriler kullanılarak temellendirilebilir. Bir LLM'den bir sahneyi tanımlaması istenirse, orada olmayan nesneleri halüsinasyon olarak görebilir. YOLO26 gibi yüksek hassasiyetli bir nesne dedektörünü entegre ederek, geliştiriciler LLM'e mevcut nesnelerin gerçek bir listesini sağlayabilir ve çıktısını yalnızca doğrulanmış algılamalarla sınırlandırabilirler.
Aşağıdaki Python örneği, bir dil modeli istemi için olgusal bir kısıtlama görevi görebilecek doğrulanmış bir nesne listesini çıkarmak için ultralytics paketinin nasıl kullanılacağını göstermektedir.
from ultralytics import YOLO
# Load the YOLO26n model (latest generation, efficient and accurate)
model = YOLO("yolo26n.pt")
# Run inference on an image to get ground-truth detections
results = model("https://ultralytics.com/images/bus.jpg")
# Extract the class names of actually detected objects
detected_objects = [model.names[int(c)] for c in results[0].boxes.cls]
# This factual list prevents the LLM from hallucinating items
print(f"Verified Objects for Prompt Context: {detected_objects}")
# Output example: ['bus', 'person', 'person', 'person', 'person']Link to this sectionİlgili Kavramları Ayırt Etme#
Halüsinasyonları diğer yaygın YZ hatalarından ayırt etmek önemlidir:
- Vs. YZ'de Yanlılık: Yanlılık, çıktılardaki sistematik önyargıyı ifade eder (örneğin, bir demografik grubu diğerine tercih etmek), oysa halüsinasyon olgusal doğruluk eksikliğidir. Bir yanıt tarafsız olabilir ancak halüsinasyon içerebilir (örneğin, "Ay peynirden yapılmıştır").
- Vs. Aşırı Öğrenme (Overfitting): Aşırı öğrenme, bir modelin eğitim verilerini çok yakından ezberlemesi ve yeni girdilere genelleme yapamaması durumunda ortaya çıkar. Halüsinasyonlar ise genellikle bir model verisinin eksik olduğu alanlara çok fazla genelleme yapmaya çalıştığında meydana gelir.
- Vs. Yanlış Sınıflandırma: Nesne algılamada, bir arabayı kamyon olarak etiketlemek bir sınıflandırma hatasıdır (doğruluk sorunu), halüsinasyon değildir. Halüsinasyon, özellikle yanlış içeriğin üretken olarak yaratılmasıyla ilgilidir.
Veri kümelerini yönetmek ve aşağı akış hatalarını önlemek için yüksek veri bütünlüğüyle modeller eğitmek isteyenler için, Ultralytics Platform ek açıklama ve veri kümesi yönetimi için kapsamlı araçlar sunar. Ayrıca, NIST YZ Risk Yönetimi Çerçevesi rehberliği, üretim ortamlarında bu risklerin değerlendirilmesi ve azaltılması için standartlar sağlar.






