Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Guias

Explorando os melhores conjuntos de dados de visão computacional em 2025

Junte-se a nós para analisar os melhores conjuntos de dados de visão computacional de 2025. Saiba como conjuntos de dados diversos e de alta qualidade impulsionam soluções de visão AI mais inteligentes.

ABAbirami Vina
5 min read
Conjuntos de dados de visão computacional para treinar modelos

Sabias que os dados desempenham um papel em quase tudo o que fazes diariamente? Ver um vídeo, tirar uma fotografia ou verificar o Google Maps contribui para o fluxo constante de informações capturadas por mais de 75 mil milhões de dispositivos conectados. Estes dados formam a base da inteligência artificial (IA). De facto, modelos avançados de visão computacional, como o Ultralytics YOLO11, dependem de dados visuais para identificar padrões, interpretar imagens e dar sentido ao mundo que nos rodeia.

Curiosamente, o valor dos dados não está apenas na quantidade. É mais importante saber quão bem estão organizados e preparados. Se um dataset estiver desorganizado ou incompleto, pode levar a erros. No entanto, quando os datasets são limpos e diversos, ajudam os modelos de visão computacional a ter um melhor desempenho, seja reconhecendo objetos numa multidão ou analisando visuais complexos. Datasets de alta qualidade fazem toda a diferença.

Neste artigo, vamos explorar os melhores datasets de visão computacional de 2025 e ver como contribuem para a construção de modelos de visão computacional mais precisos e eficientes. Vamos começar!

Link to this sectionO que são datasets de visão computacional?#

Um dataset de visão computacional é uma coleção de imagens ou vídeos que ajuda os sistemas de visão computacional a aprender a compreender e reconhecer informações visuais. Estes datasets vêm com etiquetas ou anotações que ajudam os modelos a reconhecer objetos, pessoas, cenas e padrões dentro dos dados.

Podem ser usados para treinar modelos de visão computacional, ajudando-os a melhorar tarefas como identificar rostos, detetar objetos ou analisar cenas. Quanto melhor for o dataset - bem organizado, diversificado e preciso - melhor será o desempenho do modelo de IA de visão, conduzindo a uma tecnologia mais inteligente e útil no quotidiano.

Link to this sectionComo construir um dataset de visão computacional#

Construir um dataset de visão computacional é como preparar notas de estudo para ensinar alguém a ver e compreender o mundo. Tudo começa com a recolha de imagens e vídeos que correspondam à aplicação específica que estás a desenvolver.

Um dataset ideal inclui exemplos diversos dos objetos de interesse, capturados de diferentes ângulos, sob várias condições de iluminação e em múltiplos fundos e ambientes. Esta variedade garante que o modelo de visão computacional aprenda a reconhecer padrões com precisão e tenha um desempenho fiável em cenários do mundo real.

Diagrama da construção do conjunto de dados de visão perfeito

Fig 1. Construir o dataset de visão perfeito. Imagem do autor.

Após recolher as imagens e vídeos relevantes, o passo seguinte é a rotulagem de dados. Este processo envolve adicionar etiquetas, anotações ou descrições aos dados para que a IA possa compreender o que cada imagem ou vídeo contém.

As etiquetas podem incluir nomes de objetos, localizações, limites ou outros detalhes relevantes que ajudam a treinar o modelo a reconhecer e interpretar informações visuais com precisão. A rotulagem de dados transforma uma simples coleção de imagens num dataset estruturado que pode ser usado para treinar um modelo de visão computacional.

Link to this sectionO treino de modelos requer dados de alta qualidade#

Podes estar a perguntar-te o que torna um dataset de alta qualidade. Existem muitos fatores envolvidos, como rotulagem precisa, diversidade e consistência. Por exemplo, se vários anotadores estiverem a rotular um dataset de deteção de objetos para identificar orelhas de gato, um pode rotulá-las como parte da cabeça, enquanto outro as rotula separadamente como orelhas. Esta inconsistência pode confundir o modelo e afetar a sua capacidade de aprender corretamente.

Aqui tens uma visão geral rápida das qualidades de um dataset de visão computacional ideal:

  • Etiquetas claras: Cada imagem é anotada com precisão com etiquetas consistentes e precisas.
  • Dados diversos: O dataset inclui diferentes objetos, fundos, condições de iluminação e ângulos para ajudar o modelo a funcionar bem em várias situações.
  • Imagens de alta resolução: Imagens nítidas e detalhadas facilitam a aprendizagem e o reconhecimento de características por parte do modelo.

Link to this sectionA Ultralytics suporta vários datasets#

Os modelos Ultralytics YOLO, como o YOLO11, são concebidos para trabalhar com datasets num formato de ficheiro YOLO específico. Embora seja fácil converter os teus próprios dados para este formato, também fornecemos uma opção sem complicações para aqueles que querem começar a experimentar imediatamente.

O pacote Python da Ultralytics suporta uma ampla gama de datasets de visão computacional, permitindo que mergulhes em projetos usando tarefas como deteção de objetos, segmentação de instâncias ou estimativa de pose sem qualquer configuração adicional.

Os utilizadores podem aceder facilmente a datasets prontos a usar como COCO, DOTA-v2.0, Open Images V7 e ImageNet, especificando o nome do dataset como um dos parâmetros na função de treino. Quando o fazes, o dataset é automaticamente transferido e pré-configurado, para que te possas focar em construir e refinar os teus modelos.

Link to this sectionTop 5 datasets de visão computacional em 2025#

Os avanços na IA de visão dependem de datasets diversos e de grande escala que impulsionam a inovação e permitem descobertas. Vamos dar uma vista de olhos a alguns dos datasets mais importantes, suportados pela Ultralytics, que estão a influenciar os modelos de visão computacional.

Link to this sectionDataset ImageNet#

O ImageNet, criado por Fei-Fei Li e a sua equipa na Universidade de Princeton em 2007 e apresentado em 2009, é um dataset grande com mais de 14 milhões de imagens rotuladas. É amplamente utilizado para treinar sistemas a reconhecer e categorizar diferentes objetos. O seu design estruturado torna-o particularmente útil para ensinar modelos a classificar imagens com precisão. Embora bem documentado, foca-se principalmente na classificação de imagens e carece de anotações detalhadas para tarefas como a deteção de objetos.

Aqui tens uma análise de alguns dos principais pontos fortes do ImageNet:

  • Diversidade: Com imagens abrangendo mais de 20.000 categorias, o ImageNet oferece um dataset vasto e variado que melhora o treino e a generalização dos modelos.
  • Organização estruturada: As imagens são meticulosamente categorizadas usando a hierarquia WordNet, facilitando a recuperação eficiente de dados e o treino sistemático de modelos.
  • Documentação abrangente: Investigação extensa e anos de estudo tornam o ImageNet acessível tanto a principiantes como a especialistas, fornecendo informações e orientações valiosas para projetos de visão computacional.

No entanto, como qualquer dataset, tem as suas limitações. Aqui estão alguns dos desafios a considerar:

  • Exigências computacionais: A sua dimensão massiva pode colocar desafios a equipas mais pequenas com recursos computacionais limitados.
  • Falta de dados temporais: Como contém apenas imagens estáticas, pode não satisfazer as necessidades de aplicações que requerem vídeo ou dados baseados no tempo.
  • Imagens desatualizadas: Algumas imagens no dataset são mais antigas e podem não refletir objetos, estilos ou ambientes atuais, reduzindo potencialmente a relevância para aplicações modernas.

Link to this sectionDataset DOTA-v2.0#

O dataset DOTA-v2.0, onde DOTA significa Dataset for Object Detection in Aerial Images, é uma extensa coleção de imagens aéreas criada especialmente para deteção de objetos com caixa delimitadora orientada (OBB). Na deteção OBB, as caixas delimitadoras rotacionadas são usadas para se alinharem com mais precisão à orientação real dos objetos na imagem. Este método funciona especialmente bem para imagens aéreas, onde os objetos aparecem frequentemente em vários ângulos, conduzindo a uma localização mais precisa e a uma melhor deteção no geral.

Este dataset consiste em mais de 11.000 imagens e mais de 1,7 milhões de caixas delimitadoras orientadas em 18 categorias de objetos. As imagens variam de 800×800 a 20.000×20.000 píxeis e incluem objetos como aviões, navios e edifícios.

Exemplos de imagens e anotações do conjunto de dados DOTA-v2.0

Fig 2. Exemplos de imagens e anotações do dataset DOTA-v2.0. Imagem do autor.

Devido às suas anotações detalhadas, o DOTA-v2.0 tornou-se uma escolha popular para projetos de deteção remota e vigilância aérea. Aqui estão algumas das principais características do DOTA-v2.0:

  • Categorias de objetos diversas: Cobre muitos tipos diferentes de objetos, como veículos, portos e tanques de armazenamento, expondo os modelos a vários objetos do mundo real.
  • Anotações de alta qualidade: Anotadores especialistas forneceram caixas delimitadoras precisamente orientadas que mostram claramente as formas e direções dos objetos.
  • Imagens multiescala: O dataset inclui imagens de diferentes tamanhos, ajudando os modelos a aprender a detetar objetos a escalas pequenas e grandes.

Embora o DOTA-v2 tenha muitos pontos fortes, aqui estão algumas limitações que os utilizadores devem ter em mente:

  • Passos de transferência extra: Devido à forma como o dataset DOTA é mantido, o DOTA-v2.0 requer um passo de configuração extra. Precisas primeiro de transferir as imagens do DOTA-v1.0 e depois adicionar as imagens extra e as anotações atualizadas para o DOTA-v2.0 para completar o dataset.
  • Anotações complexas: As caixas delimitadoras orientadas podem exigir esforço extra para lidar durante o treino do modelo.
  • Âmbito limitado: O DOTA-v2 é concebido para imagens aéreas, o que o torna menos útil para tarefas gerais de deteção de objetos fora deste domínio.

Link to this sectionDataset Roboflow 100#

O dataset Roboflow 100 (RF100) foi criado pela Roboflow com o apoio da Intel. Pode ser usado para testar e avaliar quão bem funcionam os modelos de deteção de objetos. Este dataset de referência inclui 100 datasets diferentes escolhidos a partir de mais de 90.000 datasets públicos. Tem mais de 224.000 imagens e 800 classes de objetos de áreas como cuidados de saúde, vistas aéreas e jogos.

Aqui estão algumas das principais vantagens de usar o RF100:

  • Ampla cobertura de domínio: Inclui datasets de sete áreas, como imagiologia médica, vistas aéreas e exploração subaquática.
  • Incentiva a melhoria do modelo: A variabilidade e os desafios específicos do domínio no RF100 revelam lacunas nos modelos atuais, impulsionando a investigação para soluções de deteção de objetos mais adaptáveis e robustas.
  • Formato de imagem consistente: Todas as imagens são redimensionadas para 640x640 píxeis. Isto ajuda os utilizadores a treinar modelos sem necessidade de ajustar tamanhos de imagem.

Apesar dos seus pontos fortes, o RF100 também vem com certas desvantagens a ter em conta:

  • Limitado em termos de tarefas: O RF100 é concebido para deteção de objetos, pelo que não pode acomodar tarefas como segmentação ou classificação.
  • Foco centrado no benchmark: O RF100 é principalmente concebido como uma ferramenta de benchmarking e não para treinar modelos para aplicações do mundo real, pelo que os seus resultados podem não se traduzir totalmente em cenários de implementação prática.
  • Variabilidade de anotações: Como o RF100 agrega datasets de crowdsourcing, podem existir inconsistências na qualidade das anotações e nas práticas de rotulagem, o que pode afetar a avaliação e o ajuste fino do modelo.

Link to this sectionDataset COCO (Common Objects in Context)#

O dataset COCO é um dos datasets de visão computacional mais amplamente utilizados, oferecendo mais de 330.000 imagens com anotações de imagem detalhadas. É concebido para deteção de objetos, segmentação e legendagem de imagens, tornando-o um recurso valioso para muitos projetos. As suas etiquetas detalhadas, incluindo caixas delimitadoras e máscaras de segmentação, ajudam os sistemas a aprender a analisar imagens com precisão.

Este dataset é conhecido pela sua flexibilidade e é útil para várias tarefas, desde projetos simples a complexos. Tornou-se um padrão no campo da IA de visão, frequentemente usado em desafios e competições para avaliar o desempenho do modelo.

Alguns dos seus pontos fortes incluem:

  • Dados diversos e realistas: O dataset inclui imagens de cenários do mundo real com múltiplos objetos, oclusões e condições de iluminação variadas.
  • Forte adoção pela comunidade e investigação: Usado nas principais competições de aprendizagem automática e investigação, o dataset COCO tem documentação extensa, modelos pré-treinados e apoio ativo da comunidade.
  • Anotações ricas e detalhadas: O dataset COCO fornece anotações altamente detalhadas, incluindo segmentação de objetos, pontos-chave e legendas, tornando-o ideal para projetos que requerem uma compreensão visual precisa.

Aqui estão alguns fatores limitantes a ter em conta também:

  • Altas necessidades computacionais: Devido à sua dimensão e complexidade, treinar modelos no COCO pode exigir recursos computacionais significativos, tornando-o desafiante para equipas com hardware limitado.
  • Desequilíbrio de dados: Algumas categorias de objetos têm significativamente mais imagens do que outras, o que pode levar a enviesamentos no treino do modelo.
  • Estrutura de anotação complexa: As anotações detalhadas do dataset, embora valiosas, podem ser avassaladoras para principiantes ou equipas mais pequenas que não têm experiência em trabalhar com datasets estruturados de IA de visão.

Link to this sectionDataset Open Images V7#

Open Images V7 é um dataset open-source massivo curado pela Google, apresentando mais de 9 milhões de imagens com anotações para 600 categorias de objetos. Inclui uma variedade de tipos de anotação e é ideal para enfrentar tarefas complexas de visão computacional. A sua escala e profundidade fornecem um recurso abrangente para treinar e testar modelos de visão computacional.

Exemplos de imagens do conjunto de dados Open Images V7

Fig 3. Um vislumbre do dataset Open Images V7. Imagem do autor.

Além disso, a popularidade do dataset Open Images V7 na investigação fornece muitos recursos e exemplos para os utilizadores aprenderem. No entanto, a sua dimensão massiva pode tornar a transferência e o processamento morosos, especialmente para equipas mais pequenas. Outro problema é que algumas anotações podem ser inconsistentes, exigindo esforço extra para limpar os dados, e a integração nem sempre é perfeita, o que significa que pode ser necessária uma preparação adicional.

Link to this sectionEscolher o dataset certo#

Escolher o dataset certo é uma grande parte de preparar o teu projeto de visão computacional para o sucesso. A melhor escolha depende da tua tarefa específica - encontrar uma boa correspondência ajuda o teu modelo a aprender as competências certas. Também deve integrar-se facilmente com as tuas ferramentas, para que te possas focar mais em construir o teu modelo e menos em resolver problemas.

Diagrama dos fatores para escolher o conjunto de dados certo

Fig 4. Fatores para escolher o dataset certo. Imagem do autor.

Link to this sectionPrincipais pontos#

Datasets de alta qualidade são a espinha dorsal de qualquer modelo de visão computacional, ajudando os sistemas a aprender a interpretar imagens com precisão. Datasets diversos e bem anotados são especialmente importantes, pois permitem que os modelos tenham um desempenho fiável em cenários do mundo real e reduzem os erros causados por dados limitados ou de baixa qualidade.

A Ultralytics simplifica o processo de aceder e trabalhar com datasets de visão computacional, tornando mais fácil encontrar os dados certos para o teu projeto. Escolher o dataset certo é um passo crucial na construção de um modelo de alto desempenho, conduzindo a resultados mais precisos e impactantes.

Junta-te à nossa comunidade e explora o nosso repositório GitHub para saber mais sobre IA. Descobre avanços como visão computacional para cuidados de saúde e IA em carros autónomos nas nossas páginas de soluções. Consulta as nossas opções de licenciamento e dá o primeiro passo para começar com a visão computacional hoje mesmo!

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática