Aprende os fundamentos do serviço de modelos - implementa modelos de IA para previsões em tempo real, escalabilidade e integração perfeita em aplicações.
Depois de um modelo de Aprendizagem Automática (ML) ser treinado e validado, o próximo passo crítico é torná-lo disponível para gerar previsões em novos dados. Este processo é conhecido como Model Serving. Envolve a implementação de um modelo treinado num ambiente de produção, normalmente atrás de um ponto de extremidade da API (Interface de Programação de Aplicações), permitindo que as aplicações ou outros sistemas solicitem previsões em tempo real. O serviço de modelos actua como uma ponte entre o modelo desenvolvido e a sua aplicação prática, transformando-o de um ficheiro estático num serviço ativo e gerador de valor no âmbito do ciclo de vida mais vasto da aprendizagem automática.
O serviço de modelos é fundamental para operacionalizar os modelos de ML. Sem ele, mesmo os modelos mais precisos, como os mais avançados Ultralytics YOLO da Ultralytics, permanecem isolados em ambientes de desenvolvimento, incapazes de afetar os processos do mundo real. A disponibilização eficaz de modelos garante que os conhecimentos e as capacidades de automatização desenvolvidos durante a formação são acessíveis e utilizáveis. Permite a inferência em tempo real, permitindo que as aplicações respondam dinamicamente a novos dados, o que é crucial para tarefas que vão desde a deteção de objectos em vídeos até ao processamento de linguagem natural (PNL) em chatbots. Em última análise, o serviço de modelos é essencial para obter o retorno do investimento (ROI) das iniciativas de IA.
Embora muitas vezes utilizado de forma intercambiável, o Model Serving é tecnicamente um componente específico dentro do processo mais amplo da Implantação de Modelos. A implantação de modelos abrange todas as etapas necessárias para pegar um modelo treinado e torná-lo operacional em um ambiente de produção ao vivo, incluindo empacotamento, configuração de infraestrutura, integração e monitoramento. O Model Serving concentra-se especificamente na camada de infraestrutura e software que hospeda o modelo e lida com as solicitações de previsão recebidas, disponibilizando a funcionalidade do modelo como um serviço, geralmente por meio de protocolos de rede como REST ou gRPC. Para obter mais detalhes, consulte nosso guia sobre Opções de implantação de modelo.
O serviço de modelos permite inúmeras funcionalidades baseadas em IA com as quais interagimos diariamente. Eis dois exemplos:
A implementação de um sistema robusto de fornecimento de modelos envolve vários componentes que trabalham em conjunto:
Plataformas como o Ultralytics HUB têm como objetivo simplificar todo este fluxo de trabalho, oferecendo soluções integradas para formação, controlo de versões, implementação e fornecimento de modelos de visão por computador, alinhadas com as melhores práticas de MLOps (Machine Learning Operations). As principais considerações incluem escalabilidade para lidar com alterações de carga, segurança(segurança de dados) e capacidade de manutenção.