Tudo o que precisa de saber sobre o Ultralytics YOLO11 e as suas aplicações

Abirami Vina

4 min ler

4 de outubro de 2024

Saiba tudo sobre o novo modelo Ultralytics YOLO11, as suas caraterísticas e aplicações em tempo real em várias indústrias. Iremos explicar-lhe tudo o que precisa de saber.

Na segunda-feira, 30 de setembro, a Ultralytics lançou oficialmente o Ultralytics YOLO11, o mais recente avanço em visão computacional, após a sua estreia no YOLO Vision 2024 (YV24), o evento híbrido anual da Ultralytics. A comunidade de IA tem estado a fervilhar de entusiasmo à medida que se apressa a explorar as capacidades do modelo. Com processamento mais rápido, maior precisão e modelos otimizados para dispositivos de ponta e implantação em nuvem, o YOLO11 redefine o que é possível em aplicativos de visão computacional em tempo real.

Numa entrevista, o fundador e diretor executivo da Ultralytics , Glenn Jocher, partilhou: "O mundo está a avançar para a energia limpa, mas não com a rapidez suficiente. Queremos que os nossos modelos possam ser treinados em menos épocas, com menos aumentos e menos dados, pelo que estamos a trabalhar arduamente nesse sentido. O modelo de deteção de objectos mais pequeno, o YOLO11n, tem apenas 2,6 milhões de parâmetros - mais ou menos o tamanho de um JPEG, o que é realmente fantástico. O maior modelo de deteção de objectos, o YOLO11x, tem cerca de 56 milhões de parâmetros, e mesmo esse é incrivelmente pequeno em comparação com outros modelos. É possível treiná-los numa GPU barata, como uma GPU Nvidia com cinco anos de idade, apenas com algum entusiasmo e um pouco de café".

Neste artigo, vamos analisar mais de perto o YOLO11, explorando as suas caraterísticas, melhorias, benchmarks de desempenho e aplicações do mundo real para o ajudar a compreender o que este modelo pode fazer. Vamos começar!

Compreender o YOLO11: Melhorias em relação às versões anteriores

O YOLO11 é o mais recente avanço na série YOLO (You Only Look Once) de modelos de visão computacional e oferece melhorias significativas em relação às versões anteriores, como YOLOv5 e YOLOv8. A equipa da Ultralytics incorporou o feedback da comunidade e a investigação de ponta para tornar o YOLO11 mais rápido, mais preciso e mais eficiente. O YOLO11 também suporta as mesmas tarefas de visão computacional que o YOLOv8, incluindo deteção de objectos, segmentação de instâncias e classificação de imagens. De facto, os utilizadores podem facilmente mudar para o YOLO11 sem necessidade de alterar os fluxos de trabalho existentes.

Um dos principais destaques do YOLO11 é o seu desempenho superior, tanto em termos de precisão como de velocidade, em comparação com os seus antecessores. Com menos 22% de parâmetros do que o YOLOv8m, o YOLO11m atinge uma precisão média superior (mAP) no conjunto de dados COCO, o que significa que consegue detetar objectos de forma mais precisa e eficiente. Em termos de velocidade de processamento, o YOLO11 supera os modelos anteriores, o que o torna ideal para aplicações em tempo real, em que a deteção e a resposta rápidas são críticas e cada milissegundo conta.

O gráfico de avaliação comparativa abaixo ilustra como o YOLO11 se destaca dos modelos anteriores. No eixo horizontal, mostra a precisão média (AP) da caixa COCO, que mede a exatidão da deteção de objectos. O eixo vertical apresenta a latência utilizando o TensorRT10 FP16 numa GPU NVIDIA T4, indicando a rapidez com que o modelo processa os dados. 

__wf_reserved_inherit
Figura 1. O YOLO11 oferece capacidades de deteção de objectos em tempo real de última geração.

Lançamento do modelo YOLO11: Opções de código aberto e empresariais

Com o lançamento do Ultralytics YOLO11, a Ultralytics está a expandir a série YOLO, oferecendo modelos de código aberto e empresariais para satisfazer a procura crescente em todos os sectores.

__wf_reserved_inherit
Fig. 2. Com este lançamento, a Ultralytics propõe 30 novos modelos.

O YOLO11 apresenta cinco tamanhos de modelo distintos - Nano, Pequeno, Médio, Grande e X. Os utilizadores podem escolher o melhor modelo em função das necessidades específicas da sua aplicação de visão por computador. Os cinco tamanhos oferecem flexibilidade em tarefas como classificação de imagens, deteção de objectos, segmentação de instâncias, seguimento, estimativa de pose e deteção de objectos com caixas delimitadoras orientadas (OBB). Para cada tamanho, existe um modelo disponível para cada tarefa, resultando num total de 25 modelos de código aberto que constituem o núcleo das ofertas da Ultralytics. Estes modelos são ideais para uma vasta gama de aplicações, desde tarefas ligeiras em dispositivos de ponta, em que o modelo YOLO11n oferece uma eficiência impressionante, até aplicações de maior escala que requerem os modelos YOLO11l e YOLO11x.

Pela primeira vez, a Ultralytics está a introduzir modelos empresariais, assinalando um marco importante nas nossas ofertas de produtos, e estamos entusiasmados por partilhar estas inovações com os nossos utilizadores. O YOLO11 apresenta cinco modelos proprietários projetados especificamente para casos de uso comercial. Estes modelos empresariais, que estarão disponíveis no próximo mês, são treinados no novo conjunto de dados proprietário da Ultralytics, composto por mais de 1 milhão de imagens, oferecendo modelos pré-treinados mais robustos. Foram concebidos para aplicações exigentes do mundo real, como a análise de imagens médicas e o processamento de imagens de satélite, em que a deteção precisa de objectos é crucial.

Explorar as funcionalidades da próxima geração do YOLO11

Agora que já falámos sobre o que o YOLO11 oferece, vamos ver o que torna o YOLO11 tão especial.

Um dos principais desafios no desenvolvimento do YOLO11 foi encontrar o equilíbrio certo entre prioridades concorrentes: tornar os modelos mais pequenos, mais rápidos e mais precisos. Como Glenn Jocher, fundador e diretor executivo da Ultralytics, explicou: "Trabalhar na investigação e desenvolvimento do YOLO é realmente um desafio, porque queremos ir em três direcções diferentes: queremos tornar os modelos mais pequenos, queremos que sejam mais precisos, mas também queremos que sejam mais rápidos em diferentes plataformas, como CPU e GPU. Todos estes interesses são concorrentes, pelo que é preciso fazer compromissos e escolher onde fazer as alterações". Apesar destes desafios, o YOLO11 consegue um equilíbrio impressionante, apresentando melhorias de velocidade e precisão em relação a versões anteriores como o YOLOv8.

__wf_reserved_inherit
Fig. 3. Um exemplo de utilização do YOLO11 para a deteção de objectos.

O YOLO11 traz melhorias substanciais, como a extração melhorada de caraterísticas com uma arquitetura redesenhada da espinha dorsal e do pescoço, levando a uma deteção de objectos mais precisa. O modelo também foi optimizado para velocidade e eficiência, oferecendo tempos de processamento mais rápidos e mantendo uma elevada precisão. Para além destas vantagens, o YOLO11 é altamente adaptável a diferentes ambientes, funcionando sem problemas em dispositivos edge, plataformas cloud e sistemas que utilizam GPUs NVIDIA. Esta adaptabilidade torna-o a escolha ideal para os utilizadores que necessitam de opções de implementação flexíveis em várias configurações de hardware, desde dispositivos móveis a servidores de grande escala.

Aplicações YOLO11 em tempo real

A versatilidade do YOLO11 torna-o uma ferramenta fiável em muitos sectores, especialmente quando se trata de casos de utilização complexos. Por exemplo, funciona sem problemas em dispositivos periféricos e pode ser utilizado para aplicações que requerem uma análise em tempo real em ambientes com poder de computação limitado. Um excelente exemplo disto é a condução autónoma, em que os veículos têm de tomar decisões em fracções de segundo para manter todos em segurança. O YOLO11 ajuda a detetar e analisar objectos na estrada, como peões ou outros carros, mesmo em condições difíceis, como pouca luz ou quando os objectos estão parcialmente escondidos. A deteção rápida e precisa ajuda a evitar acidentes e garante que os veículos autónomos possam navegar em segurança.

__wf_reserved_inherit
Fig. 4. Glenn Jocher no palco do YV24, a falar sobre as aplicações do YOLO11.

Outro exemplo interessante da gama do YOLO11 é a sua capacidade de lidar com caixas delimitadoras orientadas (OBB). É essencial para detetar objectos que não estão perfeitamente alinhados. A deteção de objectos OBB é uma caraterística especialmente útil em indústrias como a agricultura, cartografia e vigilância, onde as imagens contêm frequentemente objectos rodados, como culturas ou edifícios em imagens aéreas ou de satélite. Ao contrário dos modelos tradicionais, o YOLO11 pode identificar objectos em qualquer ângulo e fornecer resultados muito mais exactos para tarefas que exigem precisão.

YOLO11 para programadores de IA: Experimente-o você mesmo

Começar a utilizar o YOLO11 é simples e acessível, quer prefira codificar ou não codificar. Para trabalhar com o YOLO11 através de código, pode utilizar o pacote Ultralytics Python para treinar e implementar modelos facilmente. Se preferir uma abordagem sem código, o Ultralytics HUB permite-lhe experimentar o YOLO11 com apenas alguns cliques.

Descrição do código YOLO11

Para usar o YOLO11 com Python, primeiro é necessário instalar o pacote Ultralytics. Dependendo das suas preferências, você pode fazer isso usando pip, conda ou Docker. Para obter instruções detalhadas e práticas recomendadas relacionadas ao processo de instalação, verifique nosso Guia de instalação do Ultralytics. Ao instalar os pacotes necessários para o YOLO11, se você encontrar alguma dificuldade, consulte nosso Guia de problemas comuns para obter soluções e dicas.

Depois de ter o pacote Ultralytics instalado, a utilização do YOLO11 é simples. O seguinte fragmento de código orienta-o no processo de carregamento de um modelo, treinando-o, testando o seu desempenho e exportando-o para o formato ONNX. Para obter exemplos mais aprofundados e utilização avançada, consulte a documentação oficial do Ultralytics, onde encontrará guias detalhados e práticas recomendadas para tirar o máximo partido do YOLO11.

__wf_reserved_inherit
Fig. 5. Utilização do YOLO11 através do pacote Ultralytics. 

Para os utilizadores que preferem uma abordagem sem código, o Ultralytics HUB fornece uma forma fácil de treinar e implementar modelos YOLO11 com apenas alguns cliques. Para começar a utilizar o HUB, basta criar uma conta na plataforma Ultralytics HUB e pode começar a treinar e a gerir os seus modelos através de uma interface intuitiva.

YOLO11: Moldar o futuro da IA de visão

A comunidade de IA está constantemente a fazer avançar o campo da visão por computador, esforçando-se por desenvolver modelos mais rápidos e mais precisos para aplicações no mundo real. O Ultralytics YOLO11 é um marco importante neste esforço, proporcionando maior velocidade, precisão e flexibilidade. Foi concebido para aplicações em tempo real e de ponta, o que o torna ideal para sectores como os cuidados de saúde e a condução autónoma. Quer esteja a utilizar o pacote Ultralytics Python ou o Ultralytics Hub sem código, o YOLO11 simplifica tarefas complexas de IA de visão. Oferece poderosas capacidades de visão computacional, tornando-o uma excelente escolha para programadores e empresas.

Consulte o nosso repositório GitHub e junte-se à nossa comunidade ativa para saber mais sobre IA. Explore a forma como a Vision AI está a impulsionar a inovação em sectores como os cuidados de saúde e a agricultura.

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência