Glossário

Modelos de linguagem de pequena dimensão (SLMs)

Descubra como os Modelos de Linguagem de Pequena Dimensão (SLMs) permitem uma IA eficiente, privada e de baixo custo em dispositivos periféricos. Aprenda a combinar os SLMs com Ultralytics para IA de ponta.

Os Modelos de Linguagem Pequenos (SLMs) são modelos de inteligência artificial simplificados, concebidos para compreender e gerar linguagem humana de forma eficiente. Ao contrário dos seus equivalentes de maior dimensão, os SLMs têm normalmente entre alguns milhões e cerca de 15 mil milhões de parâmetros, o que lhes permite funcionar localmente em dispositivos periféricos, em vez de exigirem uma enorme infraestrutura de computação em nuvem. Ao funcionarem localmente, estes modelos oferecem um processamento mais rápido, maior privacidade para o utilizador e custos de implementação significativamente reduzidos .

Diferenciação de termos-chave

Para compreender melhor o panorama da IA, é útil distinguir os SLM das tecnologias relacionadas:

SLMs vs. Modelos de Linguagem de Grande Escala (LLMs): Enquanto os LLMs contêm centenas de milhares de milhões de parâmetros e exigem recursos de servidor consideráveis, os SLMs são altamente otimizados. Isto permite-lhes funcionar com uma latência de inferência mínima, tornando-os ideais para aplicações especializadas e específicas de cada domínio, nas quais não é necessária uma escala massiva.
SLMs vs. Modelos de Visão-Linguagem (VLMs): Os SLMs centram-se principalmente em tarefas de processamento de linguagem natural. Em contrapartida, os VLMs conseguem interpretar tanto texto como imagens de forma nativa. No entanto, muitos programadores combinam agora os SLMs com modelos de visão rápidos para criar sistemas multimodais leves.

Aplicações no Mundo Real

Os modelos de linguagem de pequena dimensão estão a transformar rapidamente os setores, levando inteligência avançada diretamente para os produtos eletrónicos de consumo e as redes empresariais .

Assistentes virtuais integrados nos dispositivos: Os smartphones modernos e os dispositivos IoT utilizam modelos de linguagem de estado (SLM) para processar comandos de voz localmente. Isto garante respostas em tempo real e mantém os dados confidenciais no próprio hardware. Modelos de última geração como o Phi-3Microsoft e o OpenELM da Apple estão a liderar esta revolução dos assistentes integrados nos dispositivos.
Chatbots especializados: As empresas implementam modelos de linguagem de sequências (SLM) altamente otimizados para o atendimento automatizado ao cliente. Ao combinar estes modelos compactos com a Geração Aumentada por Recuperação (RAG), as empresas podem consultar com segurança as suas bases de dados internas e resolver problemas sem depender de API de terceiros dispendiosas.
Computação de Borda na Indústria Transformadora: Em instalações de produção inteligente, os SLM auxiliam os técnicos ao resumirem rapidamente manuais de equipamentos complexos. Quando combinados com modelos de detecção de objetos em tempo real, estes sistemas analisam defeitos visuais e geram instantaneamente relatórios de diagnóstico em texto simples diretamente no chão de fábrica.

Implementação de SLMs em fluxos de trabalho modernos

Os avanços recentes em 2024 e 2025 demonstraram que dados de treino de alta qualidade podem proporcionar um desempenho que rivaliza com os modelos de grande escala dos anos anteriores. Inovações como o Gemma,Google, e o Llama 3 8B, da Meta, mostram o quão capazes as arquiteturas mais pequenas se tornaram.

Ao desenvolver soluções abrangentes de IA, os programadores recorrem frequentemente ao Python para integrar o raciocínio linguístico de um SLM com a precisão visual das ferramentas disponíveis na Ultralytics . Por exemplo, um SLM no dispositivo poderia processar um comando de voz para iniciar uma tarefa de visão computacional. O seguinte trecho conciso demonstra como carregar um modelo leve como Ultralytics para rastreamento de objetos , uma operação adequada para o mesmo hardware de borda que executa um SLM:

from ultralytics import YOLO

# Load the highly efficient YOLO26 nano model, suitable for edge devices
model = YOLO("yolo26n.pt")

# Run real-time object tracking on a local video stream
results = model.track(source="video.mp4", show=True, tracker="botsort.yaml")

Ao dar prioridade à execução local, os engenheiros reduzem significativamente os requisitos de largura de banda e os custos operacionais. À medida que o setor continua a desenvolver tecnologias de IA de ponta, a poderosa combinação de visão computacional otimizada e modelos linguísticos pequenos e eficientes impulsionará a próxima geração de sistemas inteligentes e autónomos.

Modelos de linguagem de pequena dimensão (SLMs)

Exporte para mais de 17 formatos. Implemente em 43 regiões globais.

Treine o YOLO26 em GPUs H100 por 2,39 $/hora.

Licenciamento empresarial flexível para impulsionar os seus projetos de IA de visão.

Licenciamento empresarial concebido para impulsionar o seu próximo projeto

Etiquete até 10 vezes mais rápido com a anotação inteligente

Anotar. Treinar. Implementar. Tudo numa única plataforma.

Diferenciação de termos-chave

Aplicações no Mundo Real

Implementação de SLMs em fluxos de trabalho modernos

Leia mais nesta categoria

Ultralytics YOLO com a DEEPX: inferência de IA no dispositivo para IA física

Como exportarYOLO Ultralytics utilizando Ultralytics

Detecção de empilhamento inseguro de paletes com Ultralytics

Vamos construir juntos o futuro da IA!

Modelos de linguagem de pequena dimensão (SLMs)

Exporte para mais de 17 formatos. Implemente em 43 regiões globais.

Treine o YOLO26 em GPUs H100 por 2,39 $/hora.

Licenciamento empresarial flexível para impulsionar os seus projetos de IA de visão.

Licenciamento empresarial concebido para impulsionar o seu próximo projeto

Etiquete até 10 vezes mais rápido com a anotação inteligente

Anotar. Treinar. Implementar. Tudo numa única plataforma.

Diferenciação de termos-chave

Aplicações no Mundo Real

Implementação de SLMs em fluxos de trabalho modernos

Leia mais nesta categoria

Ultralytics YOLO com a DEEPX: inferência de IA no dispositivo para IA física

Como exportarYOLO Ultralytics utilizando Ultralytics

Detecção de empilhamento inseguro de paletes com Ultralytics

Vamos construir juntos o futuro da IA!

Anotar. Treinar. Implementar. Tudo numa única plataforma.