Guias

Como melhorar o mAP do modelo em objetos pequenos: Um guia rápido

Aprende como melhorar o mAP do modelo em objetos pequenos com dicas práticas sobre qualidade de dados, aumentação, estratégias de treino, avaliação e implementação.

ABAbirami Vina4 min readFebruary 19, 2026

Melhorando o mAP do modelo de deteção de objetos em objetos pequenos

À medida que a adoção de inteligência artificial (IA), aprendizado de máquina e visão computacional continua a crescer, sistemas de detecção de objetos estão sendo usados em todos os lugares, desde câmeras de tráfego inteligentes até drones e ferramentas de análise de varejo. Frequentemente, espera-se que esses sistemas detectem objetos de todos os tamanhos, seja um caminhão grande próximo à câmera ou um pedestre minúsculo ao longe.

Normalmente, detectar objetos grandes e claramente visíveis é mais simples. Por outro lado, detectar objetos pequenos é mais desafiador.

Quando um objeto ocupa apenas uma pequena parte da imagem, há pouquíssima informação visual com a qual trabalhar. Um pedestre distante em um feed de tráfego ou um veículo pequeno capturado de uma vista aérea pode conter apenas alguns pixels, mas esses pixels podem carregar informações críticas.

Modelos de visão computacional como os modelos Ultralytics YOLO dependem de padrões visuais para reconhecer objetos e, quando esses padrões são limitados ou pouco claros, o desempenho é prejudicado. Detalhes importantes podem ser perdidos durante o processamento, tornando as previsões mais sensíveis a erros de localização. Mesmo um pequeno deslocamento em uma caixa delimitadora pode transformar uma detecção correta em uma falha.

Essa lacuna torna-se clara quando observamos o desempenho do modelo. A maioria dos modelos de detecção e segmentação lida bem com objetos médios e grandes, mas objetos pequenos frequentemente reduzem a precisão geral.

O desempenho do aprendizado profundo é tipicamente medido usando mean average precision, ou mAP. Essa métrica reflete tanto quão precisas são as detecções quanto quão bem as caixas previstas se alinham com objetos reais.

Ela combina precisão, que mostra quantos objetos previstos estão corretos, e recall, que mostra quantos objetos reais são detectados com sucesso, em diferentes níveis de confiança e limites de Intersection over Union, ou IoU (uma métrica que mede quanto a caixa delimitadora prevista se sobrepõe à caixa de ground truth).

Anteriormente, exploramos a detecção de pequenos objetos e por que é um problema tão difícil para modelos de visão computacional. Neste artigo, vamos construir sobre essa base e focar em como melhorar o mAP quando objetos pequenos estão envolvidos. Vamos começar!

Link to this sectionPor que objetos pequenos são mais difíceis de detectar?#

Quando se trata de aplicações envolvendo detectores de objetos, um objeto pequeno é definido pelo quanto de espaço ele ocupa em uma imagem, não necessariamente pelo quão pequeno ele parece ao olho humano. Se ele ocupa apenas uma pequena parte da imagem, ele contém pouquíssima informação visual, o que torna mais difícil para um algoritmo de visão computacional detectá-lo com precisão.

Imagens de exemplo mostrando objetos pequenos ocupando áreas limitadas de pixels

Fig 1. Imagens de exemplo mostrando objetos pequenos ocupando áreas limitadas de pixels (Fonte)

Com menos pixels para trabalhar, detalhes importantes como bordas, formas e texturas podem ficar pouco claros ou ser facilmente perdidos. À medida que a imagem é processada pelo modelo, ela é redimensionada e simplificada para destacar padrões úteis.

Embora isso ajude o modelo a entender a cena geral, também pode reduzir detalhes finos ainda mais. Para objetos pequenos, esses detalhes são frequentemente essenciais para uma detecção correta.

Esses desafios tornam-se ainda mais aparentes ao observar métricas de avaliação. Objetos pequenos são especialmente sensíveis a erros de localização. Mesmo uma caixa delimitadora ligeiramente desalinhada pode cair abaixo do limite necessário de Intersection over Union, ou IoU.

Quando isso acontece, uma previsão que parece razoável pode ser contada como incorreta. Isso reduz tanto a precisão quanto o recall, o que acaba reduzindo a mean average precision, ou mAP.

Como esses fatores estão intimamente conectados, melhorar o desempenho geralmente requer pensar sobre o sistema inteiro. Isso significa equilibrar cuidadosamente a resolução da imagem, extração de características, design do modelo e configurações de avaliação para que pequenos detalhes visuais sejam melhor preservados e interpretados.

Link to this sectionA importância da qualidade do dataset e das anotações#

Quando se trata de detecção de pequenos objetos, a qualidade de um dataset geralmente faz a maior diferença no desempenho. Objetos pequenos ocupam apenas uma minúscula parte de uma imagem, o que significa que há pouquíssima informação visual disponível para o modelo aprender. Por causa disso, os dados de treinamento tornam-se especialmente importantes. Se o dataset não incluir exemplos claros e representativos suficientes, o modelo de detecção de objetos terá dificuldade em reconhecer padrões consistentes.

Datasets que funcionam bem para detecção de pequenos objetos geralmente contêm imagens de alta resolução, aparições frequentes de alvos pequenos e condições visuais consistentes. Embora datasets genéricos como o dataset COCO sejam pontos de partida úteis, eles frequentemente não correspondem à escala, densidade ou contexto de casos de uso específicos do mundo real. Nesses casos, coletar dados de treinamento específicos do domínio torna-se necessário para melhorar o desempenho do modelo.

A qualidade da anotação também desempenha um papel crítico. As anotações estabelecem o ground truth especificando as etiquetas de objeto corretas e as localizações das caixas delimitadoras que o modelo aprende a prever.

Para objetos pequenos, as caixas delimitadoras devem ser desenhadas cuidadosa e consistentemente. Mesmo pequenas diferenças no posicionamento da caixa podem afetar notavelmente a precisão de localização porque objetos pequenos são altamente sensíveis a deslocamentos em nível de pixel.

Anotações ruins ou inconsistentes podem reduzir significativamente o mAP. Se os objetos estiverem rotulados incorretamente, o modelo aprende padrões errados, o que pode aumentar os falsos positivos.

Se objetos aparecem na imagem, mas faltam no ground truth, detecções corretas podem ser contadas como falsos positivos durante a avaliação. Ambas as situações diminuem o desempenho geral.

Curiosamente, pesquisas recentes indicam que a precisão média para objetos pequenos frequentemente permanece entre 20% e 40% em benchmarks padrão, o que é significativamente menor do que para objetos maiores. Essa lacuna destaca a importância do design do dataset e da consistência da anotação na precisão geral da detecção.

Link to this sectionO aumento de dados pode desempenhar um papel fundamental na melhoria da precisão#

Com uma compreensão melhor da importância da qualidade do dataset e da consistência da anotação, vamos percorrer como um modelo de detecção de objetos pode aprender de forma mais eficaz a partir de dados existentes. Mesmo quando coletar imagens adicionais é difícil ou caro, ainda existem maneiras de melhorar o desempenho aproveitando melhor os dados já disponíveis.

Uma das abordagens mais práticas é o aumento de dados. Ele tem um papel especialmente importante na detecção de pequenos objetos porque objetos pequenos fornecem menos dicas visuais para o modelo aprender. Ao introduzir variações controladas durante o treinamento, o aumento ajuda o modelo a generalizar melhor sem exigir nova coleta de dados.

O aumento de dados eficaz foca em manter objetos pequenos claramente visíveis. Técnicas como redimensionamento controlado, cortes leves e mosaico de imagens podem fazer com que objetos pequenos se destaquem mais, preservando sua forma e aparência. O objetivo é ajudar o modelo a ver objetos pequenos com mais frequência e sob condições ligeiramente diferentes, sem alterar como eles se parecem em situações reais.

No entanto, o aumento precisa ser aplicado com cuidado. Algumas transformações podem reduzir a visibilidade de objetos pequenos ou alterar sua aparência de maneiras que são improváveis de ocorrer em dados reais. Quando isso acontece, o modelo pode ter dificuldade em aprender limites de objetos precisos.

Link to this sectionAumento de dados mais inteligente com IA generativa#

Outro tipo interessante de aumento de dados que está se tornando mais popular é o uso de IA generativa para criar dados de treinamento sintéticos. Em vez de depender de imagens coletadas e rotuladas manualmente, as equipes agora podem gerar cenas realistas que simulam ambientes, tamanhos de objetos, condições de iluminação e variações de fundo específicos.

Imagens aéreas sintéticas usadas para aumento de dados

Fig 2. Uma olhada em imagens aéreas sintéticas usadas para aumento de dados (Fonte)

Essa abordagem é particularmente útil para a detecção de pequenos objetos, onde exemplos do mundo real podem ser difíceis de capturar consistentemente. Ao controlar como objetos pequenos aparecem em imagens sintéticas, como ajustar escala, densidade e posicionamento, é possível expor modelos a uma gama mais ampla de cenários de treinamento.

Quando combinado cuidadosamente com dados reais, o aumento sintético pode melhorar a robustez do modelo, reduzir custos de coleta de dados e apoiar melhorias de desempenho mais direcionadas.

Link to this sectionEscolhas de treinamento de modelo que podem impactar o mAP de objetos pequenos#

Além da qualidade do dataset e da consistência da anotação, as escolhas de treinamento do modelo também têm um forte impacto no desempenho da detecção de pequenos objetos.

Aqui estão algumas das principais estratégias de treinamento a considerar:

Comece com modelos pré-treinados: Um modelo pré-treinado, como Ultralytics YOLO26, já aprendeu padrões visuais gerais de grandes datasets de imagens. Isso fornece um forte ponto de partida em vez de treinar do zero, o que é especialmente útil ao detectar pequenos objetos com dados limitados.
Use o aprendizado por transferência estrategicamente: O aprendizado por transferência significa adaptar um modelo pré-treinado ao seu dataset específico. Isso ajuda o modelo a focar em seus objetos pequenos enquanto reduz o overfitting (memorizar os dados de treinamento em vez de aprender padrões gerais).
Aborde o desequilíbrio de classes: Se objetos pequenos aparecem com menos frequência do que objetos maiores, o modelo pode priorizar o aprendizado de objetos maiores. Técnicas como ponderação de classes ou estratégias de amostragem ajudam a garantir que objetos pequenos não sejam ignorados.
Ajuste os limites de confiança e IoU: Objetos pequenos são sensíveis a pequenos erros de localização. O ajuste fino desses limites ajuda a avaliar e interpretar melhor o desempenho de objetos pequenos durante a validação e inferência.

Link to this sectionConsiderações de arquitetura de modelo para detecção de pequenos objetos#

Embora você possa usar um modelo de detecção de objetos geral para tarefas de objetos pequenos, também existem arquiteturas de modelo projetadas especificamente para melhorar a detecção de pequenos objetos. Por exemplo, existem variantes de modelo P2 do Ultralytics YOLOv8 que são otimizadas para preservar detalhes espaciais finos.

O YOLOv8 processa imagens em múltiplas escalas, reduzindo-as gradualmente à medida que avançam mais profundamente na rede. Isso ajuda o modelo a entender a cena geral, mas também reduz detalhes finos.

Quando um objeto já é muito pequeno, informações visuais importantes podem desaparecer durante esse processo. A variante P2 do Ultralytics YOLOv8 resolve isso usando um passo (stride) de 2 em sua pirâmide de características.

Uma pirâmide de características é a parte do modelo que analisa a imagem em múltiplas resoluções internas para que possa detectar objetos de diferentes tamanhos. Com um passo de 2, a imagem é reduzida mais gradualmente nesta fase, permitindo que mais detalhes originais em nível de pixel sejam preservados.

Como mais detalhes espaciais são preservados, objetos pequenos retêm mais estrutura visível dentro da rede. Isso torna mais fácil para o modelo localizar e detectar objetos que ocupam apenas alguns pixels, o que pode ajudar a melhorar o mAP de objetos pequenos.

Link to this sectionAvaliação consciente do tamanho para detecção de pequenos objetos#

Embora a mean average precision resuma o desempenho geral do modelo, nem sempre mostra quão bem um modelo lida com objetos de diferentes tamanhos. Para objetos pequenos, o desempenho é frequentemente limitado pela precisão de localização em vez de apenas pela classificação, o que significa que pequenos deslocamentos da caixa delimitadora podem afetar significativamente os resultados.

Em outras palavras, o modelo pode identificar corretamente a classe do objeto, mas se a caixa delimitadora prevista estiver ligeiramente desalinhada, a detecção ainda pode ser considerada incorreta. Como objetos pequenos cobrem apenas um pequeno número de pixels, até mesmo um pequeno deslocamento no posicionamento da caixa pode reduzir significativamente a sobreposição entre a caixa prevista e o ground truth. Como resultado, as pontuações de avaliação podem cair mesmo quando o objeto foi identificado corretamente.

Avaliar a detecção de objetos pequenos pode ser complicado

Fig 3. Avaliar a detecção de pequenos objetos pode ser complicado (Fonte)

Uma abordagem mais informativa é avaliar o desempenho pelo tamanho do objeto. A maioria dos benchmarks amplamente utilizados relata a precisão média separadamente para objetos pequenos, médios e grandes.

Essa divisão específica por tamanho fornece uma visão mais clara de onde o modelo tem bom desempenho e onde ele tem dificuldades. Na prática, o AP de objetos pequenos frequentemente fica atrás do mAP geral, destacando desafios de localização que podem não ser óbvios em métricas agregadas.

Link to this sectionConsidere as restrições de implantação e as compensações do mundo real#

O desempenho do modelo geralmente muda ao passar de ambientes de teste controlados para a implantação no mundo real. Fatores como resolução de imagem, velocidade de processamento e hardware disponível introduzem compensações que afetam diretamente a detecção de pequenos objetos.

Por exemplo, aumentar a resolução de entrada pode melhorar o mAP de objetos pequenos porque alvos pequenos ocupam mais pixels e retêm mais detalhes. No entanto, uma resolução mais alta também aumenta o uso de memória e o tempo de processamento. Isso pode tornar a inferência mais lenta e aumentar os custos operacionais.

Desafios de implementação da detecção de objetos pequenos

Fig 4. Desafios de implantação de detecção de pequenos objetos. Imagem pelo autor.

As escolhas de hardware desempenham um papel fundamental no gerenciamento dessas compensações. GPUs mais potentes permitem modelos maiores e processamento mais rápido, mas ambientes de implantação, especialmente dispositivos de borda, geralmente têm recursos limitados de computação e memória.

Aplicações em tempo real adicionam outra restrição: manter uma baixa latência pode exigir a redução do tamanho do modelo ou da resolução de entrada, o que pode impactar negativamente o recall de objetos pequenos. Em última análise, as decisões de implantação exigem equilibrar o desempenho da detecção com as limitações de hardware, requisitos de velocidade e custo geral.

Link to this sectionResumindo: Melhorando o mAP do modelo em objetos pequenos#

Melhorar a detecção de objetos pequenos exige uma abordagem prática e estruturada, especialmente ao trabalhar em ambientes do mundo real. Aqui está uma visão geral dos principais passos a ter em mente:

Audite a qualidade do seu dataset: Certifique-se de que seu dataset inclua exemplos suficientes de objetos pequenos, use imagens de alta resolução quando possível e reflita as condições onde o modelo será implantado.
Verifique a consistência da anotação: Certifique-se de que as caixas delimitadoras sejam precisas, completas e rotuladas de forma consistente. Anotações inconsistentes podem limitar diretamente o desempenho da localização.
Ajuste as configurações de treinamento deliberadamente: Ajuste o tamanho do lote (batch size), o número de épocas e as configurações de otimização de forma ponderada para que objetos pequenos sejam representados adequadamente durante o treinamento.
Itere passo a passo: Faça ajustes controlados, meça seu impacto e refine sua abordagem. A iteração constante e baseada em dados leva a melhorias consistentes ao longo do tempo.

Link to this sectionPrincipais pontos#

Melhorar o mAP para objetos pequenos requer uma abordagem estruturada e baseada em dados em vez de ajustes aleatórios. Melhorias reais vêm da combinação de bons dados, anotações consistentes, treinamento cuidadoso e os métodos de avaliação corretos. Em projetos do mundo real, testes constantes e mudanças pequenas e mensuráveis são o que levam a uma detecção de objetos pequenos melhor e mais confiável ao longo do tempo.

Junta-te à nossa comunidade em crescimento community e explora o nosso GitHub repository para recursos práticos de IA. Para construir com visão computacional hoje, explora as nossas licensing options. Aprende como a AI in agriculture está a transformar a agricultura e como a vision AI in robotics está a moldar o futuro visitando as nossas páginas de soluções.