Glosario

Modelos lingüísticos pequeños (SLM)

Descubre cómo los modelos de lenguaje pequeños (SLM) permiten implementar una IA eficiente, privada y de bajo coste en dispositivos periféricos. Aprende a combinar los SLM con Ultralytics para la IA en el borde.

Los modelos lingüísticos pequeños (SLM) son modelos de inteligencia artificial optimizados, diseñados para comprender y generar lenguaje humano de manera eficiente. A diferencia de sus homólogos de mayor tamaño, los SLM suelen tener entre unos pocos millones y unos 15 000 millones de parámetros, lo que les permite ejecutarse localmente en dispositivos periféricos, en lugar de requerir una enorme infraestructura de computación en la nube. Al funcionar localmente, estos modelos ofrecen un procesamiento más rápido, una mayor privacidad para el usuario y unos costes de implementación considerablemente reducidos.

Diferenciación de términos clave

Para comprender mejor el panorama de la IA, resulta útil distinguir los modelos de lenguaje escalar (SLM) de otras tecnologías relacionadas:

SLM frente a modelos de lenguaje a gran escala (LLM): Mientras que los LLM contienen cientos de miles de millones de parámetros y requieren una gran cantidad de recursos de servidor, los SLM están muy optimizados. Esto les permite funcionar con una latencia de inferencia mínima, lo que los hace ideales para aplicaciones especializadas y específicas de un ámbito concreto en las que no se requiere una escala masiva.
Modelos de lenguaje único (SLM) frente a modelos de visión y lenguaje (VLM): Los SLM se centran principalmente en tareas de procesamiento del lenguaje natural. Por el contrario, los VLM pueden interpretar tanto texto como imágenes de forma nativa. Sin embargo, muchos desarrolladores combinan ahora los SLM con modelos de visión rápidos para crear sistemas multimodales ligeros.

Aplicaciones en el mundo real

Los modelos de lenguaje pequeños están transformando rápidamente los sectores al llevar la inteligencia avanzada directamente a los dispositivos electrónicos de consumo y las redes empresariales.

Asistentes virtuales integrados en el dispositivo: Los smartphones y dispositivos IoT modernos utilizan modelos de lenguaje de estado (SLM) para procesar los comandos de voz de forma local. Esto garantiza respuestas en tiempo real y mantiene los datos confidenciales en el hardware. Modelos de vanguardia como Phi-3Microsoft y OpenELM de Apple están liderando esta revolución de los dispositivos integrados.
Chatbots especializados: las empresas implementan modelos de lenguaje pequeño (SLM) altamente optimizados para la atención al cliente automatizada. Al combinar estos modelos compactos con la generación aumentada por recuperación (RAG), las empresas pueden consultar de forma segura sus bases de datos internas y resolver problemas sin tener que recurrir a costosas API de terceros.
La computación periférica en la industria manufacturera: En las instalaciones de fabricación inteligente, los sistemas de aprendizaje automático (SLM) ayudan a los técnicos resumiendo rápidamente los complejos manuales de los equipos. Cuando se combinan con modelos de detección de objetos en tiempo real, estos sistemas analizan los defectos visuales y generan al instante informes de diagnóstico en texto sin formato directamente en la planta de producción.

Implementación de los SLM en los flujos de trabajo modernos

Los recientes avances de 2024 y 2025 han demostrado que los datos de entrenamiento de alta calidad pueden ofrecer un rendimiento que rivaliza con los modelos masivos de años anteriores. Innovaciones como Gemma,Google, y Llama 3 8B, de Meta, ponen de manifiesto hasta qué punto han aumentado las capacidades de las arquitecturas más pequeñas.

A la hora de crear soluciones integrales de IA, los desarrolladores suelen utilizar Python para integrar el razonamiento lingüístico de un SLM con la precisión visual de las herramientas disponibles en la Ultralytics . Por ejemplo, un SLM integrado en el dispositivo podría procesar un comando de voz para iniciar una tarea de visión artificial. El siguiente fragmento de código conciso muestra cómo cargar un modelo ligero como Ultralytics para el seguimiento de objetos , una operación muy adecuada para el mismo hardware periférico que ejecuta un SLM:

from ultralytics import YOLO

# Load the highly efficient YOLO26 nano model, suitable for edge devices
model = YOLO("yolo26n.pt")

# Run real-time object tracking on a local video stream
results = model.track(source="video.mp4", show=True, tracker="botsort.yaml")

Al dar prioridad a la ejecución local, los ingenieros reducen considerablemente los requisitos de ancho de banda y los costes operativos. A medida que el sector sigue avanzando en las tecnologías de IA periférica, la potente combinación de una visión artificial optimizada y modelos lingüísticos pequeños y eficientes impulsará la próxima generación de sistemas inteligentes y autónomos.

Modelos lingüísticos pequeños (SLM)

Exporta a más de 17 formatos. Implementa en 43 regiones de todo el mundo.

Entrena YOLO26 en GPU H100 por 2,39 $/hora.

Licencias empresariales flexibles para impulsar tus proyectos de IA aplicada a la visión.

Licencias para empresas diseñadas para impulsar tu próximo proyecto

Etiqueta hasta 10 veces más rápido con la anotación inteligente

Anotar. Entrenar. Implementar. Todo en una sola plataforma.

Diferenciación de términos clave

Aplicaciones en el mundo real

Implementación de los SLM en los flujos de trabajo modernos

Leer más en esta categoría

Ultralytics YOLO con DEEPX: inferencia de IA en el borde para la IA física

Cómo exportarYOLO de Ultralytics utilizando Ultralytics

Detección de apilamientos peligrosos de palés con Ultralytics

¡Construyamos juntos el futuro de la IA!

Modelos lingüísticos pequeños (SLM)

Exporta a más de 17 formatos. Implementa en 43 regiones de todo el mundo.

Entrena YOLO26 en GPU H100 por 2,39 $/hora.

Licencias empresariales flexibles para impulsar tus proyectos de IA aplicada a la visión.

Licencias para empresas diseñadas para impulsar tu próximo proyecto

Etiqueta hasta 10 veces más rápido con la anotación inteligente

Anotar. Entrenar. Implementar. Todo en una sola plataforma.

Diferenciación de términos clave

Aplicaciones en el mundo real

Implementación de los SLM en los flujos de trabajo modernos

Leer más en esta categoría

Ultralytics YOLO con DEEPX: inferencia de IA en el borde para la IA física

Cómo exportarYOLO de Ultralytics utilizando Ultralytics

Detección de apilamientos peligrosos de palés con Ultralytics

¡Construyamos juntos el futuro de la IA!

Anotar. Entrenar. Implementar. Todo en una sola plataforma.