Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Modelos de razonamiento

Descubra cómo los modelos de razonamiento de IA van más allá de la comparación de patrones para llegar a la deducción lógica. Descubra cómo Ultralytics y la Ultralytics potencian el razonamiento visual.

Los modelos de razonamiento representan una evolución significativa en la inteligencia artificial, ya que van más allá de la simple comparación de patrones para realizar deducciones lógicas de varios pasos, resolución de problemas y toma de decisiones. A diferencia de las arquitecturas tradicionales de aprendizaje profundo, que dependen en gran medida de las correlaciones estadísticas que se encuentran en grandes conjuntos de datos, los modelos de razonamiento están diseñados para «pensar» a través de un problema. A menudo emplean técnicas como la cadena de pensamiento o los blocs de notas internos para desglosar consultas complejas en pasos intermedios antes de generar una respuesta final. Esta capacidad les permite abordar tareas que requieren matemáticas, codificación y razonamiento científico con una precisión mucho mayor que los modelos de lenguaje grandes (LLM) estándar.

Mecanismos básicos del razonamiento

El cambio hacia el razonamiento implica entrenar modelos para que generen su propio monólogo interno o rastro de razonamiento. Los recientes avances en 2024 y 2025, como la serie OpenAI o1, han demostrado que asignar más tiempo de cálculo al «razonamiento en tiempo de inferencia» aumenta significativamente el rendimiento. Mediante el uso de estrategias de aprendizaje por refuerzo, estos modelos aprenden a verificar sus propios pasos, retroceder cuando detect y refinar su lógica antes de presentar una solución. Esto contrasta con los modelos más antiguos que simplemente predicen el siguiente token más probable basándose en la probabilidad.

Aplicaciones en el mundo real

Los modelos de razonamiento se están incorporando a flujos de trabajo sofisticados en los que la precisión es fundamental.

  • Ingeniería de software compleja: más allá de la simple finalización de código, los modelos de razonamiento pueden diseñar módulos de software completos. Pueden comprender las dependencias entre múltiples archivos, depurar errores lógicos complejos y optimizar algoritmos mediante la simulación de rutas de ejecución. Esta capacidad es crucial para las operaciones de aprendizaje automático (MLOps) , donde las canalizaciones automatizadas deben ser robustas.
  • Descubrimiento e investigación científica: En campos como la IA en la asistencia sanitaria, estos modelos ayudan a los investigadores analizando datos clínicos contradictorios para sugerir posibles diagnósticos o interacciones farmacológicas. Por ejemplo, Google en razonamiento matemático muestran cómo la IA puede resolver nuevos problemas de geometría, una habilidad directamente transferible a simulaciones físicas y biología estructural.

Distinguir los modelos de razonamiento de los LLM estándar

Es importante diferenciar los «modelos de razonamiento» de la IA generativa de uso general.

  • LLM estándar (por ejemplo, GPT-4, Llama 3): Son principalmente modelos básicos optimizados para la fluidez, la creatividad y la velocidad. Destacan en la generación y resumen de textos, pero a menudo tienen dificultades con tareas que requieren una lógica estricta, lo que da lugar a alucinaciones.
  • Modelos de razonamiento (por ejemplo, OpenAI o1, Google 1.5 Pro): Están especializados o ajustados para dar prioridad a la corrección lógica sobre la velocidad. Utilizan de forma inherente un proceso de «pensamiento lento» (pensamiento del sistema 2 ) en comparación con el «pensamiento rápido» (sistema 1) de los modelos estándar. Esto los hace menos adecuados para el chat en tiempo real, pero superiores para tareas de modelado predictivo que requieren alta fidelidad.

Razonamiento visual con visión artificial

Mientras que el razonamiento basado en texto es bien conocido, el razonamiento visual es una frontera en rápido crecimiento. Esto implica interpretar escenas visuales complejas para responder a preguntas como «por qué» o «cómo», en lugar de simplemente «qué» está presente. Al combinar la detección de objetos a alta velocidad de modelos como Ultralytics con un motor de razonamiento, los sistemas pueden analizar las relaciones de causa y efecto en las transmisiones de vídeo.

Por ejemplo, en los vehículos autónomos, un sistema no solo debe detect peatón, sino también razonar que «el peatón está mirando su teléfono y caminando hacia el bordillo, por lo que podría cruzar la calle».

El siguiente ejemplo muestra cómo extraer datos estructurados utilizando YOLO26, que luego pueden introducirse en un modelo de razonamiento para obtener información sobre una escena.

from ultralytics import YOLO

# Load the YOLO26 model for high-accuracy detection
model = YOLO("yolo26n.pt")

# Run inference on an image containing multiple objects
results = model("https://ultralytics.com/images/bus.jpg")

# Extract class names and coordinates for logic processing
# A reasoning model could use this data to determine spatial relationships
detections = []
for r in results:
    for box in r.boxes:
        detections.append(
            {"class": model.names[int(box.cls)], "confidence": float(box.conf), "bbox": box.xywh.tolist()}
        )

print(f"Structured data for reasoning: {detections}")

El futuro de la IA basada en el razonamiento

La trayectoria de la IA avanza hacia la inteligencia artificial general (AGI), donde las capacidades de razonamiento serán fundamentales. Estamos asistiendo a una convergencia en la que el aprendizaje multimodal permite a los modelos razonar simultáneamente a través de texto, código, audio y vídeo. Plataformas como la Ultralytics están evolucionando para dar soporte a estos complejos flujos de trabajo, permitiendo a los usuarios gestionar conjuntos de datos que alimentan tanto la percepción visual como el entrenamiento del razonamiento lógico.

Para obtener más información sobre los fundamentos técnicos, la exploración de los artículos de investigación sobre la cadena de pensamiento proporciona una visión profunda de cómo las indicaciones pueden desbloquear las capacidades de razonamiento latentes. Además, la comprensión de la IA neurosimbólica ayuda a contextualizar cómo se combinan la lógica y las redes neuronales para crear sistemas más robustos.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora