O SharkEye utilizaYOLOv8 Ultralytics YOLOv8 para a deteção de objectos

28 de janeiro de 2025
Entenda como o SharkEye, apresentado no YOLO Vision 2024, utiliza o Ultralytics YOLOv8 para deteção de objetos em tempo real e segurança na praia.


28 de janeiro de 2025
Entenda como o SharkEye, apresentado no YOLO Vision 2024, utiliza o Ultralytics YOLOv8 para deteção de objetos em tempo real e segurança na praia.

Monitorar animais em seus habitats naturais, sejam bovinos pastando em uma fazenda ou tubarões se movendo perto da costa, sempre foi importante para sua segurança e bem-estar. No entanto, observá-los manualmente não é fácil. Muitas vezes, pode envolver horas de paciência e foco cuidadoso, pois os observadores precisam observar atentamente quaisquer mudanças no comportamento ou movimento. Mesmo assim, é fácil perder sinais sutis, mas importantes.
Graças à intervenção da inteligência artificial (IA), este processo está a tornar-se mais rápido, mais inteligente e muito mais eficiente, reduzindo a pressão sobre os observadores humanos e aumentando a precisão. Em particular, a visão por computador pode ser utilizada para track os animais, detetar perigos e tomar decisões em tempo real. Tarefas que antes demoravam horas podem agora ser feitas em minutos, abrindo novas formas de compreender o comportamento animal.
No YOLO Vision 2024 (YV24), um evento híbrido anual organizado pela Ultralytics, especialistas e inovadores reuniram-se para explorar a forma como a IA está a enfrentar os desafios do dia a dia. Alguns dos tópicos apresentados incluíram avanços na deteção de objectos em tempo real e na monitorização de animais, demonstrando como a IA está a melhorar a segurança e a eficiência em vários campos.
Um dos destaques do evento foi uma palestra de Jim Griffin, fundador do AI Master Group, em que demonstrou como a Vision AI está a tornar as praias mais seguras, detectando tubarões antes de estes se aproximarem demasiado da costa. Explicou como utilizaram Ultralytics YOLOv8um modelo de visão computacional de ponta, para identificar com precisão os tubarões em tempo real, mesmo em condições difíceis como ondas agitadas, brilho e obstáculos subaquáticos.
Neste artigo, analisaremos mais de perto o projeto SharkEye e compartilharemos insights interessantes da palestra de Jim.
Jim começou a sua palestra apresentando Padaro Beach, um conhecido destino de surf na Califórnia, onde surfistas e tubarões partilham frequentemente as mesmas águas. Destacando o verdadeiro desafio da deteção de tubarões, partilhou: "É claro que é fácil detect um tubarão se ele nos morder, por isso o que queríamos fazer era identificar os tubarões de antemão."

O SharkEye foi criado para resolver este problema, com o apoio da Universidade da Califórnia, Santa Bárbara. Jim descreveu como drones com câmeras de IA de alta resolução foram usados para voar cerca de 200 pés acima da água, escaneando o oceano em tempo real.
Se um tubarão for detectado, alertas SMS chegam a cerca de 80 pessoas, incluindo salva-vidas, proprietários de lojas de surf e qualquer pessoa que se inscreveu para receber atualizações. Jim destacou como essas notificações instantâneas permitem respostas rápidas, mantendo os banhistas mais seguros quando um tubarão está perto da costa.
Jim também mencionou que o SharkEye apresenta um painel ao vivo onde os usuários podem ver as estatísticas de detecção de tubarões. Por exemplo, ao longo de 12 semanas, o sistema identificou dois tubarões grandes e 15 menores, com uma média de pouco mais de um tubarão por semana.
Ele então apresentou Neil Nathan, o cientista que liderou os esforços por trás do SharkEye. Apesar de ter formação em estudos ambientais em vez de ciência da computação, Nathan liderou com sucesso o projeto. Jim enfatizou como as ferramentas modernas de IA, como as usadas no SharkEye, são projetadas para serem acessíveis, permitindo que indivíduos de origens não técnicas desenvolvam soluções impactantes.
Ao aprofundar os pormenores, Jim explicou o que está por detrás do SharkEye e como a solução de deteção de tubarões não envolveu apenas uma simples tarefa de deteção de objectos. Tinha de lidar com condições dinâmicas e imprevisíveis, como algas flutuantes que podiam ser facilmente confundidas com tubarões. Ao contrário da deteção de um objeto fixo, a identificação de um tubarão requer precisão e adaptabilidade, o que faz do YOLOv8 a escolha ideal.
Outra vantagem do YOLOv8 foi o facto de poder ser implementado num drone sem depender de servidores na nuvem. Jim explicou como esta abordagem tornou possível ao SharkEye enviar alertas imediatos - uma parte essencial para garantir respostas atempadas em condições oceânicas imprevisíveis.
Depois de destacar como o SharkEye funciona e o esforço colaborativo por trás dele, Jim apresentou uma demonstração ao vivo.
Jim Griffin iniciou a sua demonstração ao vivo, conduzindo o público através de um exemplo familiar - um trecho de código "hello world" para os modelosYOLO do Ultralytics . Com apenas seis linhas de código Python , ele mostrou como um modeloYOLOv8 pré-treinado Ultralytics podia detect sem esforço um autocarro numa imagem.

A sua demonstração utilizou o modelo YOLOv8 Nano, uma versão leve para dispositivos de baixo consumo, como drones. O mesmo modelo foi utilizado no SharkEye para a deteção de tubarões em tempo real.
Para fornecer mais contexto, Jim mencionou que o modelo na demonstração estava a ser treinado no COCO128, um subconjunto mais pequeno do conjunto de dadosCOCO amplamente utilizado . O conjunto de dados COCO contém mais de 20.000 imagens em 80 categorias de objectos diferentes. Embora COCO128 funcione bem para demonstrações rápidas, ele salientou que o SharkEye precisava de algo mais robusto - um conjunto de dados de deteção de tubarões específico para aplicações que pudesse lidar com as complexidades dos cenários do mundo real.
De acordo com Jim, a parte mais difícil do projeto SharkEye não foi treinar o modelo de IA, mas coletar os dados certos. Ele comentou: "O principal trabalho deste projeto não foi IA. O principal trabalho deste projeto foi voar com esses drones por cinco anos, extrair as imagens desses vídeos e marcá-las adequadamente."
Ele descreveu como a equipe coletou 15.000 imagens na Praia de Padaro. Cada imagem teve que ser rotulada manualmente para diferenciar tubarões, algas marinhas e outros objetos na água. Embora o processo tenha sido lento e exigente, ele lançou as bases para tudo o que se seguiu.

Quando o conjunto de dados ficou pronto, Ultralytics YOLOV8 foi treinado à medida. Jim disse: "A formação propriamente dita não foi a parte mais difícil - demorou apenas 20 horas em GPUs T4 [unidades de processamento gráfico]." Acrescentou ainda que o tempo poderia ter sido reduzido para apenas cinco horas com hardware mais potente, como as GPUs A100.
Então, Jim discutiu como o desempenho do SharkEye foi avaliado. Ele ilustrou que a principal métrica era a precisão - com que precisão o sistema identificava tubarões reais. Com o SharkEye alcançando uma precisão impressionante de 92%, o modelo provou ser altamente eficaz na identificação precisa de tubarões em meio ao complexo ambiente oceânico.
Aprofundando-se na importância da precisão, Jim esclareceu por que a precisão importava mais do que a revocação neste caso. “Na maioria das vezes, as pessoas estão interessadas na revocação, especialmente em áreas como a saúde, onde perder um caso positivo pode ser crítico. Mas, neste caso, não sabíamos quantos tubarões havia lá fora, então o que nos importava era a precisão”, explicou ele. O SharkEye garantiu que os falsos alarmes fossem minimizados, concentrando-se na precisão, facilitando a ação rápida dos salva-vidas e outros socorristas.

Ele concluiu sua palestra comparando a IA ao desempenho humano, observando que a precisão de 92% do SharkEye superava em muito a precisão de 60% dos especialistas humanos. Ele enfatizou essa lacuna, dizendo: “É porque somos humanos. Não importa o quão especialista você ou eu possamos ser, se tivermos que sentar em frente a uma tela o dia todo procurando tubarões, eventualmente, vamos deixar nossas mentes vagarem.” Ao contrário das pessoas, os modelos de IA não se cansam nem se distraem, tornando-se uma solução confiável para tarefas que exigem monitoramento contínuo.
Uma citação intrigante da palestra de Jim Griffin, "Seis linhas de código podem salvar a sua vida um dia", capta na perfeição a forma como a IA se tornou avançada mas acessível. Os modelosYOLO Ultralytics foram criados com isto em mente, tornando a tecnologia de visão computacional de ponta acessível a programadores e empresas de todas as dimensões. Ultralytics YOLO11 baseia-se neste facto com inferências mais rápidas e maior precisão.
Eis um breve resumo do que distingue YOLO11 :
Estas caraterísticas fazem do YOLO11 uma excelente opção para o seguimento do comportamento animal em ambientes dinâmicos, seja numa quinta ou na natureza.
Os avanços na IA de visão estão a facilitar a resolução de desafios do mundo real, fornecendo ferramentas práticas para vários domínios. Por exemplo, modelos de visão por computador como o YOLO11 podem ser utilizados para a monitorização e o seguimento de animais em tempo real, mesmo em condições difíceis.
A apresentação de Jim Griffin no YV24 ilustrou a forma como YOLOv8 pode ser utilizado para resolver problemas complexos com um mínimo de programação. O projeto SharkEye, que combina drones com IA para a deteção de tubarões em tempo real, mostrou como a tecnologia pode melhorar a segurança nas praias.
Foi um estudo de caso fascinante de como a IA acessível capacita pessoas de diferentes origens a criar soluções eficazes. À medida que a IA continua a evoluir, está a transformar indústrias e a tornar possível que os indivíduos aproveitem o seu potencial para tornar o mundo um lugar mais seguro, inteligente e eficiente.
Faça parte da nossa comunidade e explore nosso repositório GitHub para mergulhar mais fundo em IA. De visão computacional na agricultura a IA em carros autônomos, veja como essas tecnologias estão impulsionando a inovação. Confira nossas opções de licenciamento para começar seus projetos de IA hoje mesmo!