ReAct Prompting
Explora el prompting ReAct para construir agentes de IA autónomos. Aprende cómo el razonamiento y la actuación crean sinergias con los LLM y herramientas de visión como Ultralytics YOLO26.
El prompting ReAct (Reasoning and Acting, razonamiento y actuación) es un paradigma avanzado de ingeniería de prompts que permite a los Modelos de Lenguaje Extensos (LLMs) intercalar dinámicamente trazas de razonamiento paso a paso con acciones específicas para la tarea. Presentada en el influyente artículo académico de 2022 "ReAct: Synergizing Reasoning and Acting in Language Models", esta técnica transforma un modelo de lenguaje estático en un agente de IA interactivo. Al generar explícitamente pensamientos sobre un problema y ejecutar acciones para recuperar información externa, el marco de trabajo de ReAct mejora significativamente la precisión factual y las capacidades de toma de decisiones en flujos de trabajo complejos de inteligencia artificial.
Link to this sectionLa mecánica del razonamiento y la actuación#
En las interacciones tradicionales, un modelo genera una respuesta basada totalmente en su conocimiento interno, lo que a menudo conduce a alucinaciones en los LLMs. La arquitectura ReAct resuelve esto fundamentando la IA en entornos externos mediante un bucle continuo de Pensamientos, Acciones y Observaciones.
Cuando se enfrenta a una consulta, el modelo primero genera un "Pensamiento" para esbozar su estrategia. A continuación, activa una "Acción", como consultar un motor de búsqueda, interactuar con una base de datos o llamar a una API de visión mediante un concepto conocido como invocación de funciones. El entorno devuelve una "Observación", que proporciona datos factuales. El modelo evalúa esta nueva información, actualiza su razonamiento e itera el ciclo hasta llegar a la respuesta final. Esta metodología, detallada más a fondo en la Guía de Ingeniería de Prompts sobre ReAct, refleja la resolución de problemas humana y establece comportamientos de agente altamente transparentes y controlables.
Link to this sectionAplicaciones en el mundo real#
El prompting ReAct destaca en escenarios que requieren una resolución de problemas iterativa y el uso de herramientas en varios pasos, lo que lo convierte en algo fundamental para los sistemas de IA agente modernos.
- Agentes de Atención al Cliente Automatizados: En entornos empresariales, los agentes de asistencia técnica de TI utilizan ReAct para resolver los problemas de los usuarios. Si un usuario informa de una interrupción de la red, el agente razona que necesita comprobar el estado del servidor. Actúa haciendo ping a una API de diagnóstico, observa el resultado y, a continuación, eleva el ticket o proporciona una guía de solución de problemas basada en los hechos recuperados, optimizando los canales tradicionales de Generación Aumentada por Recuperación (RAG).
- Análisis Visual Dinámico: Los sistemas de visión artificial aprovechan ReAct para responder a preguntas visuales complejas. Un agente robótico encargado de la gestión de inventario podría observar una estantería, razonar que necesita contar artículos específicos, actuar invocando un modelo de detección de objetos y utilizar los datos de bbox resultantes para finalizar su recuento. Esta sinergia salva la distancia entre el razonamiento basado en texto y la comprensión espacial.
Link to this sectionImplementación de ReAct con visión artificial#
Para los desarrolladores que utilizan Python, los agentes ReAct a menudo orquestan modelos de percepción para interactuar con el mundo físico. El siguiente código conceptual demuestra cómo un bucle de razonamiento ReAct podría desplegar sin problemas un modelo Ultralytics YOLO26 como herramienta externa para observar e informar sobre un entorno.
from ultralytics import YOLO
def vision_tool(image_path: str) -> str:
"""Action tool for a ReAct agent to detect objects in an image."""
model = YOLO("yolo26n.pt") # Load highly efficient YOLO26 nano model
results = model(image_path)
# Format the observation for the LLM's reasoning loop
detected_classes = [model.names[int(c)] for c in results[0].boxes.cls]
return f"Observation: Found {len(detected_classes)} objects: {', '.join(detected_classes)}"
# Simulated ReAct agent executing an action
agent_observation = vision_tool("https://ultralytics.com/images/bus.jpg")
print(agent_observation)La gestión de conjuntos de datos y el seguimiento de experimentos para estas herramientas de visión pueden simplificarse totalmente utilizando la Plataforma Ultralytics, que ofrece soluciones integrales para el despliegue de IA moderna. Aquellos interesados en crear estos agentes desde cero también pueden estudiar la lógica fundamental en el repositorio oficial de ReAct.
Link to this sectionDistinguir conceptos relacionados#
Para diseñar arquitecturas multimodales robustas como las exploradas en la reciente investigación sobre alineación académica, es fundamental distinguir a ReAct de otros patrones de ingeniería relacionados:
- Vs. Prompting de Cadena de Pensamiento: La Cadena de Pensamiento (CoT) anima a un modelo a pensar paso a paso, pero depende totalmente de un conocimiento estático e interno. ReAct amplía la CoT inyectando "acciones" dinámicas que recopilan observaciones nuevas y externas durante el proceso de razonamiento.
- Vs. Encadenamiento de Prompts: El encadenamiento de prompts implica codificar una secuencia de llamadas a LLM separadas donde la salida de un paso se introduce automáticamente en el siguiente. ReAct es un paradigma más autónomo en el que un único agente decide dinámicamente qué herramientas o acciones secuenciales tomar basándose en las observaciones continuas, en lugar de seguir un script encadenado rígidamente.
Al unificar la deducción lógica con la ejecución de herramientas externas especializadas como los Modelos Multimodales, el prompting ReAct permite el desarrollo de sistemas de IA generalizados y altamente capaces.






