Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

Uma análise aprofundada das capacidades do GPT-4o Mini da OpenAI

Abirami Vina

Leitura de 6 min

25 de julho de 2024

Explore os recursos e aplicações do GPT-4o Mini. O mais recente e econômico modelo da OpenAI oferece capacidades avançadas de IA, 60% mais barato que o GPT-3.5 Turbo.

Em maio de 2024, a OpenAI lançou o GPT-4o e, agora, apenas três meses depois, eles estão de volta com outro modelo impressionante: o GPT-4o Mini. Em 18 de julho de 2024, a OpenAI apresentou o GPT-4o Mini. Eles o estão chamando de seu "modelo mais econômico"! O GPT-4o Mini é um modelo compacto que se baseia nas capacidades de modelos anteriores e visa tornar a IA avançada mais acessível e acessível.

O GPT-4o Mini atualmente suporta interações de texto e visão, com atualizações futuras que devem adicionar recursos para lidar com imagens, vídeos e áudio. Neste artigo, exploraremos o que é o GPT-4o Mini, seus recursos de destaque, como ele pode ser usado, as diferenças entre o GPT-4 e o GPT-4o Mini e como ele pode ser usado em vários casos de uso de visão computacional. Vamos mergulhar e ver o que o GPT-4o Mini tem a oferecer!

O que é GPT-4o Mini?

O GPT-4o Mini é a mais recente adição à linha de modelos de IA da OpenAI, projetado para ser mais econômico e acessível. É um modelo de linguagem grande (LLM) multimodal, o que significa que pode processar e gerar diferentes tipos de dados, como texto, imagens, vídeos e áudio. O modelo se baseia nos pontos fortes de modelos anteriores, como o GPT-4 e o GPT-4o, para oferecer recursos poderosos em um pacote compacto. 

O GPT-4o Mini é 60% mais barato que o GPT-3.5 Turbo, custando 15 centavos por milhão de tokens de entrada (unidades de texto ou dados que o modelo processa) e 60 centavos por milhão de tokens de saída (unidades que o modelo gera em resposta). Para colocar isso em perspectiva, um milhão de tokens é aproximadamente equivalente ao processamento de 2.500 páginas de texto. Com uma janela de contexto de 128 mil tokens e a capacidade de lidar com até 16 mil tokens de saída por solicitação, o GPT-4o Mini foi projetado para ser eficiente e acessível.

__wf_reserved_inherit
Fig 1. O GPT-4o Mini é 60% mais barato que o GPT-3.5 Turbo.

Principais características do GPT-4o Mini 

O GPT-4o Mini suporta uma variedade de tarefas que o tornam uma ótima opção para diversas aplicações. Ele pode ser usado ao executar várias operações ao mesmo tempo, como chamar várias APIs, lidar com grandes quantidades de dados, como bases de código completas ou históricos de conversas, e fornecer respostas rápidas e em tempo real em chatbots de suporte ao cliente.

Aqui estão alguns outros recursos importantes:

  • Base de Conhecimento Atualizada: O modelo contém informações até outubro de 2023.
  • Tokenizador Aprimorado: O GPT-4o Mini torna o processamento de texto não inglês mais econômico.
  • Medidas de Segurança Robustas: Estas medidas incluem filtrar conteúdo prejudicial e proteger contra problemas de segurança, como injeções de prompt e manipulações do sistema.

Começando a usar o GPT-4o Mini 

Pode experimentar usar o GPT-4o Mini através da interface do ChatGPT. Ele está acessível para utilizadores Free, Plus e Team, substituindo o GPT-3.5, como mostrado abaixo. Os utilizadores Enterprise também terão acesso em breve, em linha com o objetivo da OpenAI de fornecer benefícios de IA para todos. O GPT-4o Mini também está disponível através da API para desenvolvedores que desejam integrar os seus recursos nas suas aplicações. No momento, os recursos de visão estão acessíveis apenas através da API.

__wf_reserved_inherit
Fig 2. Opções de modelos dentro do ChatGPT.

A diferença entre GPT-4o e GPT-4o Mini 

O GPT-4o Mini e o GPT-4o têm um desempenho impressionante em vários benchmarks. Embora o GPT-4o geralmente supere o GPT-4o Mini, o GPT-4o Mini ainda é uma solução econômica para tarefas diárias. Os benchmarks incluem tarefas de raciocínio, proficiência em matemática e codificação e raciocínio multimodal. Como mostrado na imagem abaixo, o GPT-4o Mini tem benchmarks bastante altos quando comparado a outros modelos populares.

__wf_reserved_inherit
Fig. 3. Comparando o GPT-4o Mini com outros modelos populares.

Começando a usar o GPT-4o e o GPT-4o Mini

Um prompt interessante que tem sido debatido online envolve LLMs populares comparando números decimais incorretamente. Quando colocamos o GPT-4o e o GPT-4o Mini à prova, suas habilidades de raciocínio mostraram diferenças claras. Na imagem abaixo, perguntamos a ambos os modelos qual é maior: 9,11 ou 9,9, e então pedimos que explicassem seu raciocínio.

__wf_reserved_inherit
Fig 4. Testando o GPT-4o e o GPT-4o Mini.

Inicialmente, ambos os modelos respondem incorretamente e afirmam que 9,11 é maior. No entanto, o GPT-4o consegue raciocinar até a resposta correta e afirma que 9,9 é maior. Ele fornece uma explicação detalhada e compara os decimais com precisão. Em contraste, o GPT-4o Mini mantém teimosamente sua resposta errada inicial, apesar de descobrir corretamente o raciocínio por trás de 9,9 ser maior.

Ambos os modelos demonstram fortes habilidades de raciocínio. A capacidade do GPT-4o de se corrigir o torna superior e útil para tarefas mais complexas. O GPT-4o Mini, embora menos adaptável, ainda oferece um raciocínio claro e preciso para tarefas mais simples. 

Usando GPT-4o Mini para vários casos de uso de visão computacional

Se preferir explorar as capacidades de visão do GPT-4o Mini sem mergulhar no código, pode facilmente testar a API no OpenAI Playground. Nós próprios experimentámos para ver quão bem o GPT-4o Mini consegue lidar com vários casos de uso relacionados com a visão computacional.

Classificação de Imagens Usando GPT-4o Mini

Pedimos ao GPT-4o Mini para classificar duas imagens: uma de uma borboleta e outra de um mapa. O modelo de IA identificou com sucesso a borboleta e o mapa. Esta é uma tarefa bastante simples, dado que as imagens são muito diferentes.

__wf_reserved_inherit
Fig 5. Classificando imagens com a ajuda do GPT-4o Mini.

Continuamos e executamos mais duas imagens no modelo: uma mostrando uma borboleta descansando em uma planta e outra mostrando uma borboleta descansando no chão. A IA fez um ótimo trabalho novamente, identificando corretamente a borboleta na planta e a do chão. Então, demos mais um passo.

__wf_reserved_inherit
Fig 6. Classificação de imagens semelhantes com a ajuda do GPT-4o Mini.

Em seguida, pedimos ao GPT-4o Mini para classificar duas imagens: uma mostrando uma borboleta se alimentando das flores de uma Asclepias incarnata e a outra mostrando uma borboleta se alimentando de uma flor de Zinnia. É incrível que o modelo tenha sido capaz de classificar um rótulo tão específico sem ajuste fino adicional. Esses exemplos rápidos mostram que o GPT-4o Mini poderia possivelmente ser usado para tarefas de classificação de imagem sem a necessidade de treinamento personalizado.

__wf_reserved_inherit
Fig 7. Classificação de imagens detalhadas com a ajuda do GPT-4o Mini.

Compreender poses usando o GPT-4o Mini

Atualmente, tarefas de visão computacional como detecção de objetos e segmentação de instâncias não podem ser tratadas usando o GPT-4o Mini. O GPT-4o tem dificuldades com a precisão, mas pode ser usado para tais tarefas. Nesse sentido, com relação ao entendimento de poses, não podemos detectar ou estimar a pose na imagem, mas podemos classificar e entender a pose.

__wf_reserved_inherit
Fig 8. Utilização do GPT-4o Mini para entender as poses numa imagem. 

A imagem acima mostra como o GPT-4o Mini pode classificar e entender poses, apesar de não ser capaz de detectar ou estimar as coordenadas precisas da pose. Isso pode ser útil em diferentes aplicações. Por exemplo, em análise esportiva, ele pode avaliar amplamente os movimentos dos atletas e ajudar a prevenir lesões. Da mesma forma, em fisioterapia, ele pode auxiliar no monitoramento de exercícios para garantir que os movimentos corretos sejam feitos pelos pacientes durante a reabilitação. Também para vigilância, ele pode ajudar a identificar atividades suspeitas analisando a linguagem corporal geral. Embora o GPT-4o Mini não consiga detectar pontos-chave específicos, sua capacidade de classificar poses gerais o torna útil nesses e em outros campos.

Aplicações para as quais o GPT-4o Mini é adequado

Analisámos o que o GPT-4o Mini pode fazer. Agora, vamos discutir as aplicações onde é mais adequado usar o GPT-4o Mini.

O GPT-4o Mini é ideal para aplicações que exigem compreensão avançada de linguagem natural e precisam de uma pequena pegada computacional. Ele possibilita a integração de IA em aplicações onde normalmente seria muito caro. De fato, uma análise detalhada da Artificial Analysis mostra que o GPT-4o Mini fornece respostas de alta qualidade em velocidades extremamente rápidas em comparação com a maioria dos outros modelos.

__wf_reserved_inherit
Fig 9. Qualidade vs. Velocidade de Saída do GPT-4o Mini.

Aqui estão algumas áreas-chave onde ele pode brilhar no futuro:

  • Assistentes Virtuais e Chatbots: O GPT-4o Mini pode fornecer respostas rápidas e inteligentes para melhorar as interações com o usuário.
  • Ferramentas Educacionais: O modelo pode ser usado para construir ferramentas para oferecer tutoria personalizada e geração de conteúdo.
  • Ferramentas de Produtividade: Pode melhorar tarefas como resumir documentos, redigir e-mails e traduzir idiomas para aumentar a eficiência.
  • Tradução de Idiomas: A versão mais recente do GPT pode ser usada para desenvolver tradutores que fornecem tradução de idiomas precisa e em tempo real para melhor comunicação entre diferentes idiomas.

O GPT-4o Mini abre novas portas

O GPT-4o Mini está criando novas oportunidades para o futuro da IA multimodal. O custo de processamento de cada trecho de texto ou dado, conhecido como custo por token, diminuiu substancialmente - em quase 99% - desde 2022, quando o text-davinci-003, o modelo GPT-3, foi lançado. A diminuição no custo mostra uma tendência clara para tornar a IA avançada mais acessível. À medida que os modelos de IA continuam a melhorar, está se tornando cada vez mais provável que a integração da IA em todos os aplicativos e sites seja economicamente viável!

Quer experimentar a IA na prática? Visite o nosso repositório GitHub para ver as nossas inovações e fazer parte da nossa comunidade ativa. Saiba mais sobre as aplicações de IA na indústria transformadora e na agricultura nas nossas páginas de soluções.

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente
Link copiado para a área de transferência