AI Agent
Esplora il mondo degli agenti IA. Scopri come questi sistemi autonomi usano Ultralytics YOLO26 per percepire, ragionare e agire in tempo reale per risolvere compiti complessi.
Un Agente AI è un sistema autonomo in grado di percepire l'ambiente circostante, ragionare attraverso logiche complesse per prendere decisioni e compiere azioni specifiche per raggiungere obiettivi definiti. A differenza di un modello di machine learning statico, che elabora passivamente input per produrre un output, un agente opera dinamicamente all'interno di un flusso di lavoro continuo. Questi sistemi formano lo strato "attivo" dell'intelligenza artificiale, colmando il divario tra previsioni digitali ed esecuzione nel mondo reale. Utilizzando memoria e apprendimento adattivo, gli agenti possono gestire attività che vanno dall'automazione del software alla navigazione fisica senza un costante intervento umano.
Link to this sectionIl ciclo percezione-ragionamento-azione#
La funzionalità di un agente AI si basa su un processo ciclico spesso descritto come Ciclo Percezione-Azione. Questa architettura consente all'agente di interagire in modo significativo con l'ambiente circostante.
-
Percezione (Sensing): L'agente raccoglie informazioni dal mondo. Nelle applicazioni di computer vision, l'agente usa le telecamere come "occhi". Impiega modelli ad alta velocità come YOLO26 per eseguire object detection o segmentazione, convertendo i pixel grezzi in dati strutturati.
-
Ragionamento (Thinking): L'agente elabora i dati percepiti in base ai suoi obiettivi. Questa fase integra spesso Large Language Models (LLMs) per la comprensione semantica o algoritmi di reinforcement learning per ottimizzare le strategie decisionali. Gli agenti avanzati possono pianificare più passaggi in anticipo, proprio come un giocatore di scacchi che anticipa le mosse future.
-
Azione (Executing): Sulla base del ragionamento, l'agente esegue un'attività. Questa potrebbe essere un'azione digitale, come interrogare un database o inviare un avviso, oppure un'azione fisica nella robotica, come un braccio robotico che preleva un oggetto specifico da un nastro trasportatore.
Link to this sectionAgente AI vs Modello AI#
È importante distinguere tra un agente e un modello, poiché svolgono ruoli diversi nello stack tecnologico.
- Modello AI: Un modello è un motore matematico, come una neural network, addestrato a riconoscere schemi. È uno strumento che fornisce previsioni (es. "Questa è un'auto") ma non agisce intrinsecamente su di esse.
- Agente AI: Un agente è il sistema onnicomprensivo che utilizza i modelli come strumenti. Possiede agentività, ovvero la capacità di avviare il cambiamento. Ad esempio, mentre un modello identifica un semaforo rosso, l'agente decide di premere i freni.
Link to this sectionApplicazioni nel mondo reale#
Gli agenti AI stanno trasformando i settori automatizzando flussi di lavoro che richiedono flessibilità cognitiva.
- Smart Manufacturing: Nell'automazione industriale, gli agenti visivi monitorano le linee di produzione. Se viene identificato un difetto da un sistema di controllo qualità, l'agente può arrestare autonomamente i macchinari e registrare l'incidente, prevenendo sprechi.
- Logistica autonoma: I magazzini utilizzano robot agentici per la gestione dell'inventario. Questi agenti navigano in ambienti dinamici utilizzando SLAM (Simultaneous Localization and Mapping) e modelli di visione per localizzare, prelevare e trasportare pacchi in modo efficiente.
Link to this sectionCostruire un semplice Agente di visione#
Gli sviluppatori possono costruire agenti di base combinando modelli di percezione con logiche condizionali. Il seguente esempio in Python mostra un semplice "Security Agent" che utilizza il pacchetto ultralytics. L'agente rileva una persona e decide se attivare un avviso in base alla confidenza del modello.
from ultralytics import YOLO
# Load the YOLO26 model (The Agent's Perception)
model = YOLO("yolo26n.pt")
# 1. Perceive: The agent analyzes an image
results = model("bus.jpg")
# 2. Reason & 3. Act: Decision logic based on perception
for result in results:
# Check if a 'person' (class 0) is detected with high confidence
if 0 in result.boxes.cls and result.boxes.conf.max() > 0.5:
print("ACTION: Person detected! Initiating security protocol.")
else:
print("ACTION: Area clear. Continuing surveillance.")Link to this sectionConcetti correlati#
- Edge AI: Per reagire in tempo reale, gli agenti vengono spesso eseguiti localmente su hardware come NVIDIA Jetson, riducendo al minimo la latenza elaborando i dati alla fonte anziché nel cloud.
- Artificial General Intelligence (AGI): Mentre gli attuali agenti sono specializzati (AI limitata), l'AGI si riferisce ad agenti ipotetici in grado di svolgere qualsiasi attività intellettuale che un essere umano può compiere.
- Generative AI: Gli agenti moderni utilizzano spesso la GenAI per creare risposte o codice dinamici, agendo come assistenti in grado di generare contenuti come parte del loro flusso di lavoro.
Per chi desidera addestrare i modelli sottostanti per i propri agenti, la Ultralytics Platform offre un ambiente semplificato per annotare dataset e gestire i cicli di addestramento. Ulteriori letture sulle architetture degli agenti sono disponibili nelle ricerche di organizzazioni come Stanford HAI e DeepMind.






