Diffusion Policies

Diffusion Policies'in modern robotik dünyasını nasıl şekillendirdiğini keşfet. Eylemleri gürültü giderme (denoising) yoluyla nasıl modellediklerini ve akıllı algılama için Ultralytics YOLO26 ile nasıl entegre olduklarını öğren.

Diffusion Policies represent a paradigm shift in robotics and machine learning where an AI agent's visuomotor policy is modeled as a conditional denoising diffusion process. Traditionally, behavior cloning—a form of imitation learning—relies on direct regression to predict a single deterministic action from sensory input. While functional for simple tasks, direct regression often fails when multiple valid actions exist, leading to unstable or unsafe averaged movements. Diffusion policies solve this by framing action generation as a sequence refinement task. Starting from pure random noise, the algorithm iteratively denoises the signal—conditioned on sensory observations like images or spatial state data—to produce highly accurate, robust, and multimodal action sequences.

Link to this sectionDifüzyon Politikaları Nasıl Çalışır#

Temel mekanikler, generative modeling içinde bulunan matematiğe dayanır ve original visuomotor diffusion policy paper içindeki yüksek kaliteli görüntü sentezi için orijinal olarak geliştirilen teknikleri uyarlar. İleri süreç olarak bilinen eğitim aşamasında, optimal uzman eylem yörüngelerine kademeli olarak az miktarda gürültü eklenir. Bir neural network daha sonra belirli bir gözlem bağlamına dayanarak bu gürültüyü tahmin etmek ve tersine çevirmek için eğitilir.

Çıkarım sırasında, robot çevresiyle etkileşime girdiğinde çevresini gözlemler, rastgele bir eylem dizisi başlatır ve bunu stokastik Langevin dynamics kullanarak temizler. Bu yinelemeli optimizasyon, karmaşık, yüksek boyutlu eylem alanlarını yönetebilen ince ayarlı, pürüzsüz motor komutları sağlar.

Link to this sectionGerçek Dünya Uygulamaları#

Karmaşık dağılımları mode collapse olmadan doğru bir şekilde temsil ederek, difüzyon politikaları modern fiziksel artificial intelligence alanını aktif olarak yeniden şekillendiriyor.

Robotic Manipulation: Endüstriyel ortamlarda robotik kollar, düzensiz şekilli nesneleri kavramak, karmaşık elektronikleri monte etmek veya akışkan dökme hareketleri yürütmek gibi beceri gerektiren, temas yoğun görevler için bu politikaları kullanır.
Autonomous Navigation: Kendi kendine giden sistemler ve dronlar, dinamik ortamlar boyunca güvenli ve sürekli yörüngeler planlamak için depth estimation ile difüzyon politikalarını birleştirir ve standart reinforcement learning modellerini karıştırabilecek ani engellere uyum sağlar.

Link to this sectionTemel Terimleri Ayırt Etme#

Difüzyon politikalarının özel işlevini netleştirmek için, onları yakından ilişkili üretken mimarilerden ayırmak yararlıdır:

Diffusion Policies vs. Diffusion Models: Difüzyon Modelleri, metinden görüntüye sentez gibi statik veriler oluşturmak için kullanılan temel üretken mimariyi geniş bir şekilde ifade eder. Difüzyon Politikaları ise bu özel mekanizmayı aktif robotlar için sürekli, zaman serisi motor komutlarını tahmin etmek üzere uygular.
Diffusion Policies vs. Diffusion Forcing: Diffusion Forcing, her bir token için değişen gürültü seviyelerini kullanarak causal transformers eğiten genel bir dizi oluşturma çerçevesidir. İlişkili olsa da, diffusion forcing büyük ölçüde otoregresif tahmine odaklanırken, difüzyon politikaları kesin olarak vizuomotor kontrol için taklit öğrenme stratejisini belirtir.

Link to this sectionPolitika Öğreniminde Son Gelişmeler#

OpenAI research initiatives ve Google DeepMind robotics dahil olmak üzere önde gelen kurumlardan gelen araştırmalar, bu algoritmaların neler başarabileceğinin sınırlarını zorlamaya devam ediyor. Özellikle, published on arXiv in 2024 adresinde yayınlanan 3D Diffusion Policy (DP3), politikaları basit 2D görüntüler yerine kompakt 3D point cloud representations üzerine koşullandırarak bir atılım gerçekleştirdi. Bu, çok daha az uzman gösterimi gerektirirken robotların mekansal farkındalığını önemli ölçüde artırdı. D3P: Dynamic Denoising Diffusion Policy gibi daha fazla yenilik, rutin eylemler için gürültü giderme adımlarını dinamik olarak atlayarak standart difüzyonun yavaş çıkarım hızını ele almaya ve gerçek zamanlı yanıt verebilirliği sağlamaya başladı.

Link to this sectionBilgisayarlı Görü ile Pratik Uygulama#

Before a diffusion policy can generate an action, it requires a clear, structured understanding of its environment. Engineers frequently combine robust object detection models with policy algorithms to form a complete computer vision pipeline. For instance, a fast perceptual model like Ultralytics YOLO26 can isolate target objects in real time, feeding spatial coordinates into a PyTorch library based diffusion policy.

import torch
from ultralytics import YOLO

# Load the Ultralytics YOLO26 Nano model for high-speed robotic perception
model = YOLO("yolo26n.pt")

# Predict bounding boxes on the robot's active camera feed
results = model.predict("robot_camera_feed.jpg")

# Condition the policy by extracting the bounding box center coordinate
if len(results[0].boxes) > 0:
    box = results[0].boxes[0].xyxy.squeeze()
    center_x = (box[0] + box[2]) / 2.0
    center_y = (box[1] + box[3]) / 2.0

    # Create a spatial observation tensor to condition the PyTorch Diffusion Policy.
    # This directly guides the denoising process to generate accurate motor actions.
    observation_state = torch.tensor([center_x, center_y])
    print(f"Conditioning action trajectory on object center: {observation_state}")

To streamline this workflow, developers can use the Ultralytics Platform to utilize fast auto-annotation tools for customized datasets. This end-to-end support accelerates model deployment from raw camera feeds into actionable robotic intelligence.

Diffusion Policies

Link to this sectionDifüzyon Politikaları Nasıl Çalışır#

Link to this sectionGerçek Dünya Uygulamaları#

Link to this sectionTemel Terimleri Ayırt Etme#

Link to this sectionPolitika Öğreniminde Son Gelişmeler#

Link to this sectionBilgisayarlı Görü ile Pratik Uygulama#

Explore solutions

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Robotikte AI

Lojistikte Yapay Zeka

Perakendede AI

Sağlıkta Yapay Zeka

Üretimde Yapay Zeka

Otomotivde yapay zeka

Tarımda yapay zeka

Yapay zekanın geleceğini birlikte inşa edelim!