Yolo Vision Shenzhen
Shenzhen
Junte-se agora

Principais destaques da Ultralytics no CVPR 2025

Abirami Vina

Leitura de 3 minutos

18 de junho de 2025

Junte-se a nós enquanto recapitulamos a experiência da Ultralytics na CVPR 2025, desde os destaques do estande até os casos de uso de visão computacional no mundo real e momentos memoráveis em Nashville.

Na semana passada, de 11 a 15 de junho, a equipe Ultralytics esteve presente em Nashville, Tennessee, para a CVPR 2025 - a Conferência IEEE/CVF sobre Visão Computacional e Reconhecimento de Padrões. É um dos principais eventos anuais no espaço de pesquisa de visão computacional e IA. 

Realizada no Music City Center, a conferência deste ano reuniu mais de 12.000 participantes de todo o mundo. De pesquisadores acadêmicos e engenheiros a líderes da indústria e desenvolvedores, o evento estava repleto de pessoas que estão expandindo os limites da Visão de IA. 

Em particular, a CVPR 2025 apresentou pesquisa de ponta e conversas sobre tudo, desde deep learning em visão computacional e aprendizagem multimodal até modelos de IA generativa, modelos de fundação e aplicações do mundo real, como condução autónoma e compreensão de cenas 3D.

Fig. 1. CVPR 2025 em Nashville, Tennessee.

Para a Ultralytics, a semana na CVPR 2025 foi focada em conectar-se com a comunidade de visão computacional, compartilhar demonstrações e aprender como nossos modelos Ultralytics YOLO estão sendo usados em vários setores. No estande 1512, apresentamos nossas mais recentes soluções de IA de Visão, conversamos com centenas de visitantes sobre casos de uso práticos e vimos em primeira mão como nosso trabalho impulsiona inovações em setores como robótica, varejo, pesquisa e muito mais. 

Então, vamos dar uma olhada em alguns dos nossos momentos favoritos do evento, destacando os principais pontos, conversas e conexões da comunidade. 

Um olhar sobre o CVPR Nashville 2025

O CVPR foi introduzido pela primeira vez em 1983 e oficialmente apoiado pelo IEEE em 1985. Ao longo dos anos, tornou-se uma das conferências mais influentes no campo da visão computacional e reconhecimento de padrões, reunindo pesquisadores, engenheiros e inovadores de todo o mundo. Desde 2012, é co-patrocinado pela Computer Vision Foundation (CVF), uma organização sem fins lucrativos que apoia o acesso aberto à pesquisa em visão computacional e desempenha um papel vital na organização do evento. 

Realizado anualmente, o CVPR tornou-se conhecido por sua profundidade técnica e por ajudar a moldar a direção de todo o campo, desde os primeiros avanços no reconhecimento de objetos até os avanços atuais em Visão de IA e aprendizado profundo. A edição deste ano teve mais de 13.000 artigos submetidos, um aumento de 13% em relação ao ano passado. Com uma taxa de aceitação de apenas 22%, a conferência continuou sua tradição de destacar pesquisas de alto impacto.

Aqui está um rápido vislumbre de alguns dos principais temas de pesquisa que se destacaram no CVPR 2025:

  • Compreensão de cena 3D e renderização neural: Pesquisadores estão explorando como reconstruir e representar o mundo em três dimensões usando múltiplas visões ou entradas de sensores para avançar aplicações em robótica, realidade aumentada e simulação.
  • Síntese de imagem e vídeo usando IA generativa: Esta área se concentra na criação de visuais de alta qualidade a partir de entradas mínimas, como prompts de texto ou esboços, para impulsionar ferramentas de última geração para mídia criativa e sistemas interativos.
  • Aprendizado multimodal e modelos de visão-linguagem: Esses modelos combinam dados visuais e de linguagem para melhorar a compreensão, o raciocínio e a comunicação, abrindo caminho para sistemas de IA mais gerais e adaptáveis.

Montando no Music City Center para o CVPR

Antes do início oficial da conferência, nossa equipe chegou a Nashville para preparar tudo para a CVPR 2025. 

Passamos o dia nos instalando no Music City Center, onde o estande 1512 se tornou nossa base por três dias inteiros de demonstrações, conversas e construção de comunidade. Com equipamentos a reboque, desembalamos hardware, configuramos demonstrações YOLO ao vivo e organizamos cuidadosamente nossa configuração para garantir que tudo funcionasse sem problemas no ambiente de exposição acelerado. 

O espaço gradualmente se encheu de pessoas descarregando equipamentos, testando demos e montando seus estandes. Ver tudo se juntar nos lembrou o quão global e colaborativo o CVPR realmente é.

Após uma tarde produtiva, a equipe mudou de marcha e saiu para explorar o centro de Nashville. Naturalmente, eles fizeram uma parada na Broadway, onde música country ao vivo sai de todos os bares e restaurantes. 

Alguns membros da equipe compraram botas de cowboy (uma novidade para alguns de nós) e encerraram a noite com um clássico local favorito: frango picante do Hattie B’s. Foi a mistura perfeita de trabalho e diversão. O estande estava pronto e a equipe recarregada para ver o que o CVPR 2025 reservava.

Conversas sobre visão computacional e pesquisa de IA

O primeiro dia da exposição começou com a equipe da Ultralytics no local e pronta para começar. Nuvola Ladi, nossa Gerente de Conteúdo Digital, Zinnia Pourdad, nossa Gerente de Eventos, e Francesco Mattioli, nosso Engenheiro de Aprendizado de Máquina, chegaram ao Music City Center às 9h. Com as verificações finais de configuração concluídas e as demonstrações preparadas, estávamos prontos para receber os participantes assim que as portas se abriram.

Às 10h, a multidão começou a entrar e a energia no chão da exposição aumentou imediatamente. Nosso estande encheu-se rapidamente de visitantes e nossos produtos Ultralytics, especialmente as sacolas e adesivos, sumiram em minutos. Foi um quebra-gelo divertido que ajudou a iniciar conversas e atrair pessoas.

Fig. 2. Nuvola Ladi, Zinnia Pourdad e Francesco Mattioli no estande 1512.

​​Ao longo do dia, tivemos a oportunidade de conversar com pesquisadores, engenheiros e desenvolvedores trabalhando em uma ampla gama de projetos. Houve muito interesse em nossas demonstrações YOLO ao vivo, e ouvimos sobre casos de uso em robótica, assistência médica, manufatura, varejo e muito mais. Foi inspirador ver como nossos modelos estão sendo amplamente utilizados, desde pesquisas acadêmicas iniciais até sistemas empresariais implantados.

Também tivemos a oportunidade de nos reconectar com colaboradores no espaço da IA, incluindo equipes da Intel OpenVINO e da Sony Semiconductor Solutions. Compartilhar o espaço com outros inovadores ajudou a reforçar o quão colaborativo e dinâmico o campo da Visão de IA continua a ser.

Perto do final do dia, a equipa dirigiu-se para a Printers Alley para desfrutar de música country ao vivo e relaxar. Após um dia repleto de conversas e energia incrível no local, foi a maneira perfeita de encerrar o nosso primeiro dia na CVPR 2025.

Fig 3. A equipe teve a chance de explorar a Printers Alley.

Dia 2 na conferência de visão computacional em Nashville

O segundo dia da CVPR 2025 continuou de onde o primeiro dia parou. O estande 1512 permaneceu animado durante todo o dia, com visitantes recorrentes e novos participantes passando para saber mais sobre nossos modelos Ultralytics YOLO e compartilhar seu próprio trabalho.

Por exemplo, um dos momentos mais memoráveis do dia foi quando o Intel Robodog visitou. Ver hardware avançado emparelhado com modelos de visão práticos em ação realmente capturou o espírito do evento.

Fig 4. O Intel Robodog visitou a equipe no estande 1512.

Mais tarde, à noite, nossa equipe participou do After.CVPR() Developer Meetup, organizado pela Intel. Era um espaço descontraído e colaborativo, cheio de engenheiros, pesquisadores e desenvolvedores de todo o ecossistema de IA. 

O encontro apresentou demonstrações ao vivo e conversas significativas que se estenderam noite adentro. Durante o evento, Francesco Mattioli apresentou uma demonstração conjunta com Ultralytics e OpenVINO, mostrando como nossos modelos podem ser integrados em pipelines de inferência eficientes. 

Ele explicou como modelos como o Ultralytics YOLO11 podem ser exportados para o formato OpenVINO para obter uma inferência mais rápida e otimizada no hardware Intel. A demonstração destacou o suporte para unidades centrais de processamento (CPUs), unidades de processamento gráfico (GPUs) e unidades de processamento neural (NPUs). Isso despertou um interesse substancial de equipes que trabalham com edge AI e aplicações em tempo real.

Fig 5. Um vislumbre do After.CVPR() Developer Meetup.

Aprendizado profundo em aplicações de visão computacional na CVPR

Mesmo no último dia da CVPR 2025, o Music City Center estava repleto de atividade. Os participantes ainda estavam a explorar stands, a ter conversas ponderadas e a aproveitar ao máximo o seu tempo na conferência.

Um dos destaques do dia foi conferir as sessões de pôsteres - uma parte fundamental de como a pesquisa é compartilhada na CVPR. Ao contrário das apresentações de palco tradicionais, as sessões de pôsteres são mais informais e interativas. 

Cada pesquisador monta um grande pôster impresso resumindo seu trabalho e fica por perto para explicá-lo, responder perguntas e discutir suas descobertas com qualquer pessoa que passe por ali. É uma ótima maneira de aprender sobre uma ampla gama de tópicos em um curto período de tempo e cria espaço para conversas reais entre participantes e apresentadores.

Vimos uma grande variedade de pôsteres cobrindo desde modelos de visão-linguagem e compreensão de cenas 3D até aplicações de IA no mundo real em robótica e saúde. As sessões nos deram uma visão mais detalhada das últimas ideias que estão sendo exploradas em todo o campo e a chance de nos conectarmos diretamente com as pessoas por trás delas.

Com o evento a chegar ao fim, partimos sentindo-nos mais motivados do que nunca. A semana foi repleta de aprendizagem, colaboração e impulso real na Vision AI, e estamos entusiasmados por levar esses insights para o que vem a seguir.

Principais conclusões

O CVPR 2025 foi uma ótima semana de aprendizado, compartilhamento e conexão. Desde pesquisas de ponta até demonstrações práticas e ótimas conversas, a conferência mostrou o quão rápido a Visão de IA está avançando e o quão impactante e solidária é a comunidade por trás dela.

Foi inspirador ver os modelos Ultralytics YOLO em ação em tantas aplicações de pesquisa e do mundo real. Mais do que tudo, a CVPR 2025 deixou claro que a visão computacional está no coração da inovação da IA, com muito mais por vir.

Junte-se à nossa comunidade e mergulhe na Visão de IA em nosso repositório GitHub. Saiba mais sobre inovações como IA no varejo e visão computacional na indústria em nossas páginas de soluções. Confira nossos planos de licenciamento e comece sua jornada de IA hoje mesmo!

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente