Glosario

Modelo de fundación

Descubra cómo los modelos básicos revolucionan la IA con arquitecturas escalables, un amplio preentrenamiento y adaptabilidad para diversas aplicaciones.

Un modelo básico es un modelo de aprendizaje automático (Machine Learning, ML) a gran escala entrenado con una gran cantidad de datos amplios y sin etiquetar que puede adaptarse a una amplia gama de tareas posteriores. Acuñado por el Stanford Institute for Human-Centered AI, el concepto básico es el de "propiedades emergentes", según el cual el modelo desarrolla una comprensión sorprendentemente versátil de patrones, sintaxis y semántica a partir de los datos con los que se ha entrenado. Esta naturaleza general le permite servir de potente punto de partida, o "base", para crear modelos más especializados mediante un proceso denominado "ajuste fino".

Principales características y aplicaciones

La característica que define a los modelos básicos es su adaptabilidad, que se deriva del paradigma del aprendizaje por transferencia. En lugar de entrenar un nuevo modelo desde cero para cada problema, los desarrolladores pueden tomar un modelo básico preentrenado y adaptarlo con un conjunto de datos mucho más pequeño y específico para cada tarea. Esto reduce drásticamente los datos, los cálculos y el tiempo necesarios para crear sistemas de IA de alto rendimiento.

Las aplicaciones reales demuestran su versatilidad:

  1. Chatbots y asistentes virtuales avanzados: Un Gran Modelo Lingüístico (LLM ) como el GPT-4 de OpenAI sirve como modelo base para el lenguaje. Está preentrenado en un corpus masivo de texto de Internet para comprender la gramática, los hechos y las habilidades de razonamiento. A continuación, una empresa puede perfeccionarlo con sus documentos internos y registros de interacción con clientes para crear un chatbot especializado que pueda responder con gran precisión a preguntas específicas sobre sus productos o servicios.
  2. Análisis de imágenes médicas: En visión por computador, un modelo como el Segment Anything Model (SAM) de Meta AI es un modelo base para la segmentación de imágenes. Puede identificar y delinear objetos en cualquier imagen sin contexto previo. Los investigadores médicos pueden afinar este modelo en un conjunto más pequeño de resonancias magnéticas o tomografías computarizadas para segmentar con precisión órganos específicos o detectar anomalías como tumores, acelerando el diagnóstico para el análisis de imágenes médicas.

Modelos de cimentación frente a otros modelos

Es importante distinguir los modelos básicos de los conceptos relacionados:

  • Modelos para tareas específicas: Tradicionalmente, el ML implicaba entrenar modelos desde cero para un único propósito, como entrenar un modelo YOLO de Ultralytics únicamente para detectar paquetes en logística. Aunque es eficaz, este enfoque requiere una gran cantidad de datos etiquetados para cada nueva tarea. Los modelos de base ofrecen una alternativa más eficaz.
  • Grandes modelos lingüísticos (LLM): Los LLM son un tipo destacado de modelo básico centrado en tareas lingüísticas. Sin embargo, el término "modelo básico" es más amplio y abarca modelos de visión, audio y otras modalidades de datos, como se detalla en el artículo "On the Opportunities and Risks of Foundation Models".
  • Modelos de visión especializados: Mientras que los grandes modelos de visión, como el Transformador de Visión (ViT), se consideran modelos básicos, muchos modelos de CV especializados no lo son. Por ejemplo, un modelo YOLO11 ajustado para una aplicación específica como la IA en automoción es un modelo especializado. Sin embargo, aprovecha una base preentrenada que incorpora conocimientos fundamentales derivados de grandes conjuntos de datos como COCO.

Formación e importancia futura

El preentrenamiento de los modelos básicos es una tarea que exige muchos recursos, a menudo miles de GPU y enormes esfuerzos de ingeniería, que suelen llevar a cabo grandes organizaciones como Google AI y DeepMind. Sin embargo, una vez entrenados, estos modelos son accesibles para un uso más amplio.

Plataformas como Ultralytics HUB proporcionan herramientas para ayudar a los usuarios a adaptar estas capacidades fundamentales agilizando los flujos de trabajo para entrenar modelos personalizados, gestionar conjuntos de datos y desplegar soluciones, a menudo con un cuidadoso ajuste de hiperparámetros.

Los modelos fundacionales están transformando el panorama de la IA al democratizar el acceso a potentes capacidades. Su auge también suscita debates críticos en torno a la ética de la IA, la parcialidad de los conjuntos de datos y la brecha computacional. El futuro apunta hacia modelos más potentes, eficientes y multimodales que puedan comprender y procesar información de texto, imágenes y sonido simultáneamente, impulsando la próxima oleada de casos de uso de la IA.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles