Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Definições de cookies
Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Mergulhe na visão computacional de código aberto com o HuggingFace! Saiba mais sobre aprendizagem por transferência, transformadores e explore mais de 8.000 modelos. Junte-se a Merve Noyan para obter informações e demonstrações práticas, permitindo que os programadores inovem na exploração de IA.
Enquanto continuamos a explorar os destaques do evento YOLO VISION 2023 (YV23), vamos conhecer Merve Noyan, Developer Advocacy Engineer da HuggingFacea plataforma líder de PNL com modelos pré-treinados para o desenvolvimento eficiente de aplicações linguísticas. Na sua palestra, Merve partilhou algumas ideias incríveis sobre o mundo da visão computacional de código aberto.
Transferência de aprendizado revelada: Uma recapitulação rápida
Merve começou com uma rápida introdução sobre transfer learning, a varinha mágica que nos permite transferir conhecimento de uma rede neural para outra. Imagine treinar um modelo nas características universais nas primeiras camadas, como bordas e cantos, e depois ajustá-lo para tarefas específicas. Esta é a essência do transfer learning, reduzindo as dependências de dados e aumentando a precisão.
Merve destacou backbones convolucionais clássicos como ResNet e Inception, preparando o terreno para a jornada transformacional que viria.
Apresentando os transformers: Um enigma revelado
O que torna os Transformers especiais? Merve comparou-os a um enigma, mostrando como eles diferem dos modelos tradicionais baseados em convolução. O segredo está na sua capacidade de realizar aprendizado auto supervisionado, capturando características sem a necessidade de dados rotulados. Vision Transformer, Data Efficient Transformer, CLIP e SWIM CLIP estavam entre o elenco de estrelas de modelos baseados em transformer que ela apresentou.
Estabelecendo alguns pontos em comum com a Ultralytics , que fornece suporte para um modelo de transformador concebido para a deteção de objectos. Este modelo apresenta um codificador híbrido eficaz, seleção de consultas com reconhecimento de IOU e velocidade de inferência ajustável. Notavelmente, ele segue o padrão familiar de outros modelos Ultralytics YOLOv8 do Ultralytics, apresentando opções de previsão, formação, validação e exportação.
Seu balcão único
Merve mergulhou então no tesouro das ofertas da HuggingFace, com mais de 8.000 modelos para tarefas clássicas de visão por computador e 10.000 modelos para aplicações multimodais. O HuggingFace Hub conta com mais de 3.000 conjuntos de dados, o que o torna um espaço de diversão para programadores e entusiastas. Merve sublinhou a experiência perfeita, graças à API consistente do HuggingFace, que oferece modelos prontos a utilizar para vários casos de utilização.
Magia prática com HuggingFace
A palestra passou para demonstrações práticas, mostrando como se pode trabalhar com modelos sem esforço. Desde a instanciação de modelos e processadores até o ajuste fino com a API Trainer, Merve deixou claro que a biblioteca HuggingFace Transformers é a melhor amiga do desenvolvedor. Ela até introduziu o Pipeline API, um favorito pessoal, simplificando o fluxo de trabalho para os utilizadores.
Fig. 1. Apresentação de Merve Noyan no YV23 no Campus Google for Startups em Madrid.
Um vislumbre das aplicações
Merve encerrou a palestra com um vislumbre de algumas aplicações fantásticas, incluindo o modelo Plot para resposta a perguntas visuais, Blip para legendagem de imagens e o poderoso modelo Segment Anything para segmentação de imagens. A API Pipeline do Ecossistema HuggingFace foi o centro das atenções, facilitando a utilização de modelos sem ter de se aprofundar nos aspectos técnicos.
A cereja do bolo foi a apresentação de Merve sobre a criação de ilusões óticas com o Elysian Diffusion, uma experiência cativante que adiciona um toque divertido ao mundo da IA.
Em resumo!
Em conclusão, a palestra de Merve deixou-nos inspirados e ansiosos por explorar as infinitas possibilidades da visão computacional de código aberto. HuggingFace tornou a IA verdadeiramente acessível, divertida e excitante, dando aos programadores a possibilidade de libertarem a sua criatividade. Um brinde ao futuro da comunidade de código aberto e às incríveis inovações que ela encerra!