Glossário

Edge AI (IA na borda)

Explore a IA de ponta e aprenda a implementar Ultralytics em hardware local para inferência em tempo real, latência reduzida e maior privacidade de dados na ponta.

Edge AI refere-se à implementação de algoritmos e modelos de inteligência artificial (IA) diretamente em dispositivos de hardware locais — como smartphones, sensores IoT, drones e veículos conectados — em vez de depender de centros de computação em nuvem centralizados. Essa abordagem descentralizada permite que os dados sejam processados na fonte de sua criação, reduzindo significativamente a latência envolvida no envio e recebimento de informações para servidores remotos. Ao executar tarefas de aprendizagem automática (ML) localmente, os dispositivos podem tomar decisões instantâneas, operar de forma fiável sem conectividade à Internet e melhorar a privacidade dos dados, mantendo as informações confidenciais no próprio dispositivo.

Como a IA de Borda Funciona

O núcleo da IA de ponta envolve a execução de um mecanismo de inferência num sistema incorporado. Como os dispositivos de ponta normalmente têm bateria e poder computacional limitados em comparação com os servidores na nuvem, os modelos de IA devem ser altamente eficientes. Os desenvolvedores frequentemente empregam técnicas como quantização de modelos ou poda de modelos para comprimir grandes redes neurais sem sacrificar significativamente a precisão.

Aceleradores de hardware especializados são frequentemente usados para lidar com essas cargas de trabalho de forma eficiente. Exemplos incluem a plataforma NVIDIA para robótica e o Google Edge TPU para inferência de baixo consumo de energia. As estruturas de software também desempenham um papel vital; ferramentas como TensorRT e TFLite otimizam modelos especificamente para esses ambientes restritos, garantindo uma inferência rápida em tempo real.

Edge AI vs. Edge Computing

Embora os termos sejam frequentemente usados de forma intercambiável, é útil distinguir entre eles:

Computação de borda: descreve a infraestrutura física mais ampla e a topologia de rede em que o processamento de dados ocorre próximo à fonte de dados. É o "onde" da equação.
IA de ponta: Refere-se especificamente às aplicações inteligentes executadas nessa infraestrutura. É o «o quê». Por exemplo, uma câmara de segurança atua como um dispositivo de computação de ponta, mas quando utiliza visão computacional (CV) para reconhecer uma pessoa específica , está a executar IA de ponta.

Aplicações no Mundo Real

A IA de ponta está a transformar as indústrias, permitindo a tomada de decisões autónoma em cenários críticos:

Veículos autónomos: Os carros autônomos geram terabytes de dados diariamente. Eles não podem depender da nuvem para identificar pedestres ou obstáculos devido à latência do sinal. Em vez disso, eles usam IA de ponta integrada para detecção instantâ nea de objetos e garantir a segurança dos passageiros.
Fabricação inteligente: Na Internet das Coisas Industrial (IIoT), sensores nas fábricas utilizam IA de ponta para manutenção preditiva. Ao analisar dados de vibração e temperatura localmente, o sistema pode detect e prever falhas de equipamento em tempo real, evitando paragens dispendiosas.
Saúde: Dispositivos médicos portáteis equipados com VisionAI podem analisar imagens médicas ou sinais vitais do paciente diretamente no local de atendimento, fornecendo suporte diagnóstico imediato em áreas remotas com conectividade deficiente.

Implantação de modelos na borda

A implementação de um modelo na periferia normalmente envolve o treino de um modelo num ambiente de alta computação e, em seguida, a sua exportação para um formato compatível com dispositivos periféricos, como ONNX ou OpenVINO. A Ultralytics simplifica esse fluxo de trabalho, permitindo que os utilizadores treinem e exportem automaticamente modelos para vários destinos de borda.

O exemplo a seguir demonstra como exportar um modelo YOLO26 leve — projetado especificamente para eficiência — para um formato adequado para implantação móvel e de ponta.

from ultralytics import YOLO

# Load the YOLO26 Nano model, which is optimized for speed on edge devices
model = YOLO("yolo26n.pt")

# Export the model to TFLite format for deployment on Android or Raspberry Pi
# This creates a 'yolo26n.tflite' file ready for edge inference
model.export(format="tflite")

As implementações avançadas de ponta utilizam frequentemente tecnologias de contentorização, como o Docker, para empacotar aplicações, garantindo que estas funcionam de forma consistente em diferentes arquiteturas de dispositivos, desde unidades Raspberry Pi a gateways industriais.

Edge AI (IA na borda)

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Como a IA de Borda Funciona

Edge AI vs. Edge Computing

Aplicações no Mundo Real

Implantação de modelos na borda

Leia mais nesta categoria

12 casos de uso de imagens aéreas com tecnologia de visão computacional

O que é a estimativa de profundidade monocular? Uma visão geral

Uma análise sobre o usoYOLO Ultralytics para deteção de ameaças por IA

Junte-se à comunidade Ultralytics