Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
IA de visão

Dando uma olhada nos bastidores da IA de visão em streaming

Explora como a visão computacional aprimora as plataformas de streaming com recomendações personalizadas e análise de conteúdo em tempo real para uma melhor experiência do usuário.

ABAbirami Vina
3 min read
IA de Visão em streaming

Já te perguntaste como as plataformas de streaming tornam tão fácil assistir aos teus programas favoritos? Há pouco tempo, o entretenimento era muito diferente. As programações de TV eram fixas e os espectadores geralmente assistiam ao que estava no ar. Os serviços de streaming mudaram esse paradigma. Pesquisas mostram que o mercado global de streaming de vídeo foi avaliado em 106,83 mil milhões de dólares em 2023, e espera-se que atinja 865,85 mil milhões de dólares até 2034.

A Inteligência Artificial (IA) tem sido fundamental nesta evolução. Especificamente, estamos a ver um aumento em inovações de visão computacional neste campo. A IA de visão permite que as plataformas de streaming entendam e interpretem conteúdos de vídeo analisando fotogramas e reconhecendo padrões.

Ao processar dados visuais, a visão computacional ajuda as plataformas a criar recomendações mais inteligentes, melhorar a organização de conteúdo e até aprimorar recursos interativos. Neste artigo, exploraremos como a visão computacional ajuda as plataformas de streaming a melhorar a entrega de conteúdo, refinar o envolvimento do utilizador e simplificar a descoberta de conteúdo. Vamos começar!

O mercado global de streaming de vídeo

Fig 1. O Mercado Global de Streaming de Vídeo.

Link to this sectionExplorando a visão computacional e plataformas de streaming#

Quando se trata de plataformas de streaming, a visão computacional pode ajudar a decompor vídeos em fotogramas individuais e analisá-los usando modelos como o Ultralytics YOLO11. O YOLO11 pode ser treinado de forma personalizada em grandes conjuntos de dados de exemplos etiquetados. Exemplos etiquetados são imagens ou fotogramas de vídeo marcados com detalhes, como os objetos que contêm, as ações que ocorrem ou o tipo de cena. Isso ajuda o modelo a aprender a reconhecer padrões semelhantes. Estes modelos podem detetar objetos, classificar cenas e identificar padrões em tempo real, fornecendo informações valiosas sobre o conteúdo.

Para entender melhor como isso funciona, vamos ver alguns exemplos de como a visão computacional é aplicada em plataformas de streaming para otimizar a experiência do utilizador e tornar o conteúdo mais acessível.

Link to this sectionReconhecimento de cena para recomendações personalizadas#

O reconhecimento de cena é uma técnica de visão computacional que categoriza imagens ou fotogramas de vídeo com base no seu conteúdo visual e temas. Pode ser pensado como uma forma especializada de classificação de imagens, onde o foco está em identificar o cenário geral ou a atmosfera de uma cena, em vez de objetos individuais.

Por exemplo, um sistema de reconhecimento de cena pode agrupar cenas em categorias como "quarto de hóspedes", "caminho na floresta" ou "costa rochosa", analisando características como cores, texturas, iluminação e objetos. O reconhecimento de cena permite que as plataformas de streaming marquem e organizem conteúdo de forma eficaz.

Categorização de cenas usando IA

Fig 2. Categorizando cenas usando IA.

Isso desempenha um papel fundamental em recomendações personalizadas. Se um utilizador assiste frequentemente a conteúdos com cenários tranquilos ao ar livre, como "costas ensolaradas", ou interiores modernos, como "cozinha estilosa", a plataforma pode recomendar programas ou filmes com visuais semelhantes. O reconhecimento de cena simplifica a descoberta de conteúdo e apresenta aos utilizadores recomendações que correspondem às suas preferências de visualização.

Link to this sectionGeração de imagem e miniatura#

A geração de imagem e miniatura é o processo de criar pré-visualizações visuais para vídeos, com o intuito de atrair espectadores e destacar momentos importantes. A IA e a visão computacional podem automatizar este processo para garantir que as miniaturas sejam relevantes e apelativas.

Eis como o processo funciona:

  • Análise de Fotogramas: Um sistema de visão computacional pode começar por digitalizar milhares de fotogramas de vídeo para identificar momentos de destaque. Estes podem incluir expressões emocionais, ações chave ou cenas visualmente impressionantes que melhor representam o conteúdo do vídeo.
  • Análise de Movimento: Uma vez selecionados os potenciais fotogramas, a IA de visão pode ser usada para verificar se estão nítidos e livres de desfocagem, aumentando a qualidade visual geral da miniatura.
  • Deteção de Objetos e Análise de Cena: Usando modelos como o YOLO11 (que suportam tarefas de visão computacional como deteção de objetos e segmentação de instâncias), o sistema pode detetar elementos importantes no fotograma, como objetos, personagens ou cenários. Este passo reconfirma que a miniatura reflete com precisão a essência do vídeo.
  • Refinamento de Imagem: Os fotogramas selecionados são então refinados considerando fatores como ângulos de câmara, iluminação e composição.
  • Personalização: Finalmente, algoritmos de aprendizagem automática podem ser usados para personalizar as miniaturas com base nas preferências e histórico de visualização do utilizador. Ao fazer isto, adaptas os visuais aos gostos individuais, tornando-os mais propensos a captar a atenção e a impulsionar o envolvimento.

Um bom exemplo de uma aplicação semelhante no mundo real é o uso de visão computacional pela Netflix para gerar miniaturas automaticamente. Ao analisar quadros para detectar emoções, contexto e detalhes cinematográficos, a Netflix cria miniaturas que ressoam com as preferências individuais dos espectadores. Por exemplo, usuários que gostam de comédias românticas podem ver uma miniatura destacando um momento leve, enquanto fãs de ação podem ser apresentados a uma cena intensa e de alta energia.

Miniaturas de programas de TV personalizadas para corresponder às preferências do espectador

Fig 3. As miniaturas de programas de TV podem ser personalizadas para corresponder às preferências do espectador.

Link to this sectionPré-visualizações de conteúdo automatizadas#

Ao navegares numa plataforma de streaming, as curtas e apelativas pré-visualizações que vês não são aleatórias. São cuidadosamente criadas usando tecnologias como visão computacional para captar a atenção e destacar os momentos mais cativantes de um vídeo. Uma vez selecionados os melhores momentos, são unidos numa pré-visualização suave e envolvente.

O processo por detrás da seleção desses momentos envolve vários passos chave:

  • Segmentação de Cena: O vídeo é dividido em secções mais pequenas com base em transições naturais, como mudanças na iluminação, ângulos de câmara ou visuais.
  • Deteção de Movimento: Momentos dinâmicos e cheios de ação são identificados para garantir que a pré-visualização capte a atenção.
  • Modelos de Saliência: Características visuais como cor, brilho e contraste são analisadas para localizar as partes mais chamativas de uma cena.
  • Análise de Expressão Facial: Momentos com fortes expressões emocionais são selecionados para criar uma conexão mais profunda com os espectadores.

Link to this sectionCategorização e marcação de conteúdo#

A capacidade de navegar em filmes por género, humor ou temas específicos depende de uma categorização e marcação de conteúdo precisas. As plataformas de streaming populares usam visão computacional para automatizar este processo, analisando vídeos em busca de objetos, ações, cenários ou emoções e, em seguida, atribuindo etiquetas relevantes. Isso ajuda a organizar grandes bibliotecas de média e torna as recomendações personalizadas mais precisas, combinando o conteúdo com as preferências do espectador.

Técnicas de IA de visão como segmentação de cena, deteção de objetos e reconhecimento de atividades podem ser usadas para marcar conteúdo de forma eficaz. Ao identificar elementos chave como objetos, tons emocionais e ações, criam metadados detalhados para cada título. Os metadados podem então ser analisados usando aprendizagem automática para criar categorias que facilitam aos utilizadores encontrar o que procuram e melhorar a experiência geral de navegação.

Um exemplo de categorização automatizada de conteúdo para recomendações de streaming

Fig 4. Um exemplo de categorização automatizada de conteúdo para recomendações de streaming personalizadas.

Link to this sectionBenefícios e desafios das plataformas de streaming habilitadas por IA#

A visão computacional está a melhorar as plataformas de streaming com funcionalidades inovadoras que aprimoram a experiência do utilizador. Aqui estão alguns benefícios únicos a considerar:

  • Qualidade de Streaming Adaptável: A visão computacional pode analisar cenas de vídeo para detetar momentos de alto movimento ou detalhados que necessitam de maior qualidade. Estas informações podem então ser usadas para ajustar a qualidade do streaming para se adequar ao dispositivo e à velocidade da internet do utilizador.
  • Monitorização de Comportamento em Tempo Real: A IA pode ser usada para monitorizar transmissões em direto para detetar pirataria em tempo real. Também pode identificar ações não autorizadas, como adicionar sobreposições (ex.: logótipos ou anúncios) ou retransmitir streams para outras plataformas.
  • Entrega de Conteúdo com Eficiência Energética: As informações da IA de visão podem otimizar a entrega de conteúdo analisando a procura do utilizador e os padrões de visualização. O armazenamento em cache de conteúdo popular localmente e o ajuste da qualidade de vídeo reduzem o uso de largura de banda e o consumo de energia, tornando o streaming mais sustentável.

Apesar da gama de vantagens, existem também certas limitações a ter em conta ao implementar estas inovações:

  • Altas Demandas Computacionais: Os algoritmos de visão computacional requerem um grande poder computacional para processar e analisar conteúdo de vídeo, o que pode levar a custos aumentados e maior uso de energia.

  • Preocupações com a Privacidade de Dados: Como a visão computacional depende de grandes conjuntos de dados de interações e conteúdo dos utilizadores, pode levantar preocupações sobre a privacidade e a segurança dos dados.

  • Viés nos Dados: Os modelos de visão computacional podem refletir enviesamentos nos seus dados de treino. Isto pode fazer com que favoreçam certos tipos de conteúdo e reduzam a variedade nas recomendações.

Link to this sectionO futuro da IA em plataformas de streaming#

Inovações como a computação de ponta (edge computing) e a tecnologia 3D estão a ajudar a formar o futuro de como vivenciaremos o entretenimento. A computação de ponta pode ser usada para processar vídeos mais perto de onde são transmitidos. Ela reduz atrasos e poupa largura de banda, o que é especialmente importante para transmissões em direto e conteúdo interativo. Tempos de resposta mais rápidos significam experiências mais fluidas e envolventes para os espectadores.

Ao mesmo tempo, a tecnologia 3D está a adicionar profundidade e realismo a programas, filmes e funcionalidades interativas. Estes avanços também abrem portas para novas possibilidades, como realidade aumentada (RA) e realidade virtual (RV). Com dispositivos como auscultadores de RV, os espectadores podem entrar em ambientes totalmente imersivos. As linhas entre os mundos digital e físico podem ser esbatidas para criar um novo nível de envolvimento.

Reformulando o streaming com experiências interativas baseadas em RV

Fig 5. Reformulando o streaming com experiências interativas impulsionadas por RV.

Link to this sectionPrincipais pontos#

A visão computacional está a redefinir as plataformas de streaming ao tornar a análise de vídeo mais inteligente, a categorização de conteúdo mais rápida e as recomendações mais personalizadas. Com modelos como o Ultralytics YOLO11, as plataformas podem detetar objetos e classificar cenas em tempo real. Isto ajuda a facilitar a marcação de conteúdo e melhora a forma como programas e filmes são sugeridos.

As plataformas de streaming integradas com IA de visão oferecem experiências mais envolventes para os espectadores, garantindo operações de plataforma mais fluidas e eficientes. À medida que a tecnologia avança, os serviços de streaming provavelmente tornar-se-ão mais interativos, oferecendo experiências de entretenimento mais ricas e imersivas.

Curioso sobre IA? Visita o nosso repositório no GitHub para explorar mais e conectar-te com a nossa comunidade. Descobre várias aplicações de IA na saúde e visão computacional na agricultura.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática