Monte Carlo Ağaç Arama (MCTS)
Monte Carlo Ağaç Arama (MCTS) yönteminin yapay zeka mantığını nasıl desteklediğini keşfedin. Karmaşık sistemlerde görsel durum değerlendirmesi ve planlama için Ultralytics entegre etmeyi öğrenin.
Monte Carlo Ağaç Arama (MCTS),
özellikle makine öğrenimi ve
yapay zeka alanlarında karmaşık
karar verme süreçleri için kullanılan bir sezgisel arama algoritmasıdır. Wikipedia tanımında da belirtildiği gibi,
MCTS, belirli bir durum uzayında en
umut verici hamleleri değerlendirmek için ağaç arama algoritmalarının
hassasiyetini rastgele örneklemenin (Monte Carlo simülasyonları) gücüyle birleştirir. Başlangıçta karmaşık tahta oyunlarındaki başarısıyla popüler hale gelen algoritma,
artık modern yapay zeka ajanlarının ve
en son teknoloji
Büyük Dil Modelleri (LLM'ler) dahil olmak üzere gelişmiş akıl yürütme sistemlerinin temel bir bileşenidir.
Monte Carlo Ağaç Arama Nasıl Çalışır?
MCTS, en umut verici eylemleri değerlendirerek arama ağacını aşamalı olarak oluşturur. Bir
Markov Karar Süreci çerçevesinde çalışan algoritma,
hesaplama bütçesi veya zaman sınırı dolana kadar dört ardışık aşamayı tekrarlar:
-
Seçim: Kök düğümden başlayarak algoritma, keşif (yeni yollar deneme) ile değerlendirme (geçmişte yüksek ödül getirmiş yolları tercih etme) arasında
denge kuran alt düğümleri seçerek ağaçta aşağı doğru ilerler.
Ağaçlara Uygulanan Üst Güven Sınırı (UCT)
formülü, bu dengeyi sağlamak için kullanılan standart bir yöntemdir.
-
Genişletme: Seçilen düğüm simülasyonu sonlandırmadıkça, arama ağacını henüz keşfedilmemiş durumlara doğru genişletmek için
bir veya daha fazla alt düğüm eklenir.
-
Simülasyon (Rollout): Sonucu tahmin etmek için, yeni genişletilen düğümden
senaryonun sonuna kadar hızlı ve genellikle rastgele bir simülasyon yürütülür.
-
Geri yayılım: Simülasyonun sonucu ağaç yapısı boyunca yukarı doğru yayılır; bu süreçte, ileride yapılacak seçimlere yön vermek üzere
taranan tüm düğümlerin başarı istatistikleri ve değerleri güncellenir.
Yapay Zekada Gerçek Dünya Uygulamaları
Monte Carlo Ağaç Arama yöntemlerine ilişkin kapsamlı bir inceleme,
bu yöntemin, devasa ve hesaplama açısından çözülmesi zor arama alanlarına sahip sorunları çözmedeki çok yönlülüğünü ortaya koymaktadır.
-
Oyun Oynama: MCTS, Google
AlphaGo'yu geliştirmek için bu yöntemi kullanarak Go oyununda
bir insan dünya şampiyonunu yenen ilk yapay zekayı yaratmasıyla
dünya çapında tanınırlık kazandı. MCTS'yi
sinir ağlarıyla birleştirerek sistem, geleneksel kaba kuvvet araması için
çok geniş olan tahta durumlarını etkili bir şekilde değerlendirebildi.
-
LLM Akıl Yürütme ve Eylem Odaklı Yapay Zeka: 2024 ve 2025 yıllarında araştırmacılar, "Sistem 2" düşünme ve mantık yeteneklerini geliştirmek amacıyla MCTS'yi LLM'lerle
giderek daha fazla entegre ettiler. Örneğin, otomatikleştirilmiş sezgisel tasarım üzerine yapılan son
araştırmalar, MCTS'nin
LLM'lerin karmaşık optimizasyonlarda yolunu bulmasına nasıl yardımcı olduğunu göstermektedir. Benzer şekilde, MCTS'yi LLM'lerle birleştirmek,
bir cevaba karar vermeden önce birden fazla potansiyel mantıksal yolu
değerlendirerek bilgi tabanlı soru cevaplama ve
matematiksel akıl yürütme performansını büyük ölçüde artırır. OpenAI gibi kuruluşlar,
OpenAI'nin o1'i gibi
gelişmiş modellerinde arama tabanlı
çıkarım mekanizmalarından yararlanarak
problem çözme doğruluğunu önemli ölçüde artırmaktadır.
-
Robotik ve Otonom Planlama: MCTS,
lojistik ve rota optimizasyonu,
otonom araçlar ve robotik
eylem bölümleme alanlarında, gelecekteki durumları simüle etmek ve
karmaşık fiziksel ortamlarda güvenli bir şekilde yol bulmak için kullanılır.
MCTS ve İlgili Kavramlar
MCTS'yi tam olarak anlamak için, onu ilgili yapay zeka tekniklerinden ayırmak faydalı olacaktır:
-
Pekiştirmeli Öğrenme (RL):
RL, zaman içinde modelleri genel bir politika öğrenmeleri için eğitirken, MCTS genellikle
gerçek zamanlı çıkarım sırasında belirli bir durumdan en iyi
anlık eylemi bulmak için kullanılan bir planlama algoritmasıdır. Bununla birlikte, bu ikisi sıklıkla bir arada kullanılır; RL modelleri,
MCTS düğümleri için sezgisel değer sağlayabilir.
-
Düşünce Ağacı (ToT): ToT,
büyük dil modelleri (LLM'ler) için özel olarak tasarlanmış bir komut istek çerçevesidir. MCTS'den büyük ölçüde esinlenerek,
dil üretimini her bir düğümün bir "düşünceyi" temsil ettiği bir ağaç şeklinde yapılandırır. MCTS, ToT ve benzer çerçevelerin
üzerine inşa edildiği daha geniş kapsamlı bir algoritmik temeldir.
Görsel Yapay Zekayı MCTS'ye Entegre Etme
Somutlaştırılmış yapay zeka veya otonom sistemlerde, görsel algı genellikle bir MCTS düğümünün durum değerlendiricisi olarak işlev görür.
Ultralytics yararlanarak, bir ajan simülasyon aşamasında
ortamı hızla değerlendirip bir sezgisel puan hesaplayabilir.
İşte bir MCTS rollout'u sırasında basit bir düğüm ödülünü hesaplamak için bir Ultralytics YOLO nasıl kullanabileceğinizi gösteren kavramsal bir örnek.
from ultralytics import YOLO
# Load an Ultralytics YOLO26 model for state evaluation
model = YOLO("yolo26n.pt")
def evaluate_mcts_state(image_state):
# Run inference to evaluate the visual environment
results = model(image_state, verbose=False)
# Example heuristic: Reward the MCTS path if an 'obstacle' is successfully avoided
# Assume class 0 is 'obstacle'. Reward is 1 if path is clear, 0 if blocked.
obstacle_detected = any(box.cls == 0 for box in results[0].boxes)
return 0 if obstacle_detected else 1
# Simulate a rollout step
reward = evaluate_mcts_state("path_simulation_view.jpg")
print(f"MCTS Rollout Reward: {reward}")
Bu tür akıllı ajanları ölçeklendirmek isteyen geliştiriciler için,
Ultralytics , temel görüntü işleme modellerinin
eğitimi ve devreye alınması için sağlam araçlar sunar. Bu sayede,
standart matematik kütüphaneleri veya
PyTorch ve TensorFlowgibi makine öğrenimi çerçeveleri kullanılarak oluşturulan karmaşık arama mimarilerine entegre et