Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Definições de cookies
Ao clicar em “Aceitar todos os cookies”, concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Explore os recursos e aplicações do GPT-4o Mini. O mais recente e econômico modelo da OpenAI oferece capacidades avançadas de IA, 60% mais barato que o GPT-3.5 Turbo.
Em maio de 2024, a OpenAI lançou o GPT-4o e, agora, apenas três meses depois, eles estão de volta com outro modelo impressionante: o GPT-4o Mini. Em 18 de julho de 2024, a OpenAI apresentou o GPT-4o Mini. Eles o estão chamando de seu "modelo mais econômico"! O GPT-4o Mini é um modelo compacto que se baseia nas capacidades de modelos anteriores e visa tornar a IA avançada mais acessível e acessível.
O GPT-4o Mini atualmente suporta interações de texto e visão, com atualizações futuras que devem adicionar recursos para lidar com imagens, vídeos e áudio. Neste artigo, exploraremos o que é o GPT-4o Mini, seus recursos de destaque, como ele pode ser usado, as diferenças entre o GPT-4 e o GPT-4o Mini e como ele pode ser usado em vários casos de uso de visão computacional. Vamos mergulhar e ver o que o GPT-4o Mini tem a oferecer!
O que é GPT-4o Mini?
O GPT-4o Mini é a mais recente adição à linha de modelos de IA da OpenAI, projetado para ser mais econômico e acessível. É um modelo de linguagem grande (LLM) multimodal, o que significa que pode processar e gerar diferentes tipos de dados, como texto, imagens, vídeos e áudio. O modelo se baseia nos pontos fortes de modelos anteriores, como o GPT-4 e o GPT-4o, para oferecer recursos poderosos em um pacote compacto.
O GPT-4o Mini é 60% mais barato que o GPT-3.5 Turbo, custando 15 centavos por milhão de tokens de entrada (unidades de texto ou dados que o modelo processa) e 60 centavos por milhão de tokens de saída (unidades que o modelo gera em resposta). Para colocar isso em perspectiva, um milhão de tokens é aproximadamente equivalente ao processamento de 2.500 páginas de texto. Com uma janela de contexto de 128 mil tokens e a capacidade de lidar com até 16 mil tokens de saída por solicitação, o GPT-4o Mini foi projetado para ser eficiente e acessível.
Fig 1. O GPT-4o Mini é 60% mais barato que o GPT-3.5 Turbo.
Principais características do GPT-4o Mini
O GPT-4o Mini suporta uma variedade de tarefas que o tornam uma ótima opção para diversas aplicações. Ele pode ser usado ao executar várias operações ao mesmo tempo, como chamar várias APIs, lidar com grandes quantidades de dados, como bases de código completas ou históricos de conversas, e fornecer respostas rápidas e em tempo real em chatbots de suporte ao cliente.
Aqui estão alguns outros recursos importantes:
Base de Conhecimento Atualizada: O modelo contém informações até outubro de 2023.
Tokenizador Aprimorado: O GPT-4o Mini torna o processamento de texto não inglês mais econômico.
Medidas de Segurança Robustas: Estas medidas incluem filtrar conteúdo prejudicial e proteger contra problemas de segurança, como injeções de prompt e manipulações do sistema.
Começando a usar o GPT-4o Mini
Pode experimentar usar o GPT-4o Mini através da interface do ChatGPT. Ele está acessível para utilizadores Free, Plus e Team, substituindo o GPT-3.5, como mostrado abaixo. Os utilizadores Enterprise também terão acesso em breve, em linha com o objetivo da OpenAI de fornecer benefícios de IA para todos. O GPT-4o Mini também está disponível através da API para desenvolvedores que desejam integrar os seus recursos nas suas aplicações. No momento, os recursos de visão estão acessíveis apenas através da API.
O GPT-4o Mini e o GPT-4o têm um desempenho impressionante em vários benchmarks. Embora o GPT-4o geralmente supere o GPT-4o Mini, o GPT-4o Mini ainda é uma solução econômica para tarefas diárias. Os benchmarks incluem tarefas de raciocínio, proficiência em matemática e codificação e raciocínio multimodal. Como mostrado na imagem abaixo, o GPT-4o Mini tem benchmarks bastante altos quando comparado a outros modelos populares.
Fig. 3. Comparando o GPT-4o Mini com outros modelos populares.
Começando a usar o GPT-4o e o GPT-4o Mini
Um prompt interessante que tem sido debatido online envolve LLMs populares comparando números decimais incorretamente. Quando colocamos o GPT-4o e o GPT-4o Mini à prova, suas habilidades de raciocínio mostraram diferenças claras. Na imagem abaixo, perguntamos a ambos os modelos qual é maior: 9,11 ou 9,9, e então pedimos que explicassem seu raciocínio.
Fig 4. Testando o GPT-4o e o GPT-4o Mini.
Inicialmente, ambos os modelos respondem incorretamente e afirmam que 9,11 é maior. No entanto, o GPT-4o consegue raciocinar até a resposta correta e afirma que 9,9 é maior. Ele fornece uma explicação detalhada e compara os decimais com precisão. Em contraste, o GPT-4o Mini mantém teimosamente sua resposta errada inicial, apesar de descobrir corretamente o raciocínio por trás de 9,9 ser maior.
Ambos os modelos demonstram fortes habilidades de raciocínio. A capacidade do GPT-4o de se corrigir o torna superior e útil para tarefas mais complexas. O GPT-4o Mini, embora menos adaptável, ainda oferece um raciocínio claro e preciso para tarefas mais simples.
Usando GPT-4o Mini para vários casos de uso de visão computacional
Se preferir explorar as capacidades de visão do GPT-4o Mini sem mergulhar no código, pode facilmente testar a API no OpenAI Playground. Nós próprios experimentámos para ver quão bem o GPT-4o Mini consegue lidar com vários casos de uso relacionados com a visão computacional.
Classificação de Imagens Usando GPT-4o Mini
Pedimos ao GPT-4o Mini para classificar duas imagens: uma de uma borboleta e outra de um mapa. O modelo de IA identificou com sucesso a borboleta e o mapa. Esta é uma tarefa bastante simples, dado que as imagens são muito diferentes.
Fig 5. Classificando imagens com a ajuda do GPT-4o Mini.
Continuamos e executamos mais duas imagens no modelo: uma mostrando uma borboleta descansando em uma planta e outra mostrando uma borboleta descansando no chão. A IA fez um ótimo trabalho novamente, identificando corretamente a borboleta na planta e a do chão. Então, demos mais um passo.
Fig 6. Classificação de imagens semelhantes com a ajuda do GPT-4o Mini.
Em seguida, pedimos ao GPT-4o Mini para classificar duas imagens: uma mostrando uma borboleta se alimentando das flores de uma Asclepias incarnata e a outra mostrando uma borboleta se alimentando de uma flor de Zinnia. É incrível que o modelo tenha sido capaz de classificar um rótulo tão específico sem ajuste fino adicional. Esses exemplos rápidos mostram que o GPT-4o Mini poderia possivelmente ser usado para tarefas de classificação de imagem sem a necessidade de treinamento personalizado.
Fig 7. Classificação de imagens detalhadas com a ajuda do GPT-4o Mini.
Compreender poses usando o GPT-4o Mini
Atualmente, tarefas de visão computacional como detecção de objetos e segmentação de instâncias não podem ser tratadas usando o GPT-4o Mini. O GPT-4o tem dificuldades com a precisão, mas pode ser usado para tais tarefas. Nesse sentido, com relação ao entendimento de poses, não podemos detectar ou estimar a pose na imagem, mas podemos classificar e entender a pose.
Fig 8. Utilização do GPT-4o Mini para entender as poses numa imagem.
A imagem acima mostra como o GPT-4o Mini pode classificar e entender poses, apesar de não ser capaz de detectar ou estimar as coordenadas precisas da pose. Isso pode ser útil em diferentes aplicações. Por exemplo, em análise esportiva, ele pode avaliar amplamente os movimentos dos atletas e ajudar a prevenir lesões. Da mesma forma, em fisioterapia, ele pode auxiliar no monitoramento de exercícios para garantir que os movimentos corretos sejam feitos pelos pacientes durante a reabilitação. Também para vigilância, ele pode ajudar a identificar atividades suspeitas analisando a linguagem corporal geral. Embora o GPT-4o Mini não consiga detectar pontos-chave específicos, sua capacidade de classificar poses gerais o torna útil nesses e em outros campos.
Aplicações para as quais o GPT-4o Mini é adequado
Analisámos o que o GPT-4o Mini pode fazer. Agora, vamos discutir as aplicações onde é mais adequado usar o GPT-4o Mini.
O GPT-4o Mini é ideal para aplicações que exigem compreensão avançada de linguagem natural e precisam de uma pequena pegada computacional. Ele possibilita a integração de IA em aplicações onde normalmente seria muito caro. De fato, uma análise detalhada da Artificial Analysis mostra que o GPT-4o Mini fornece respostas de alta qualidade em velocidades extremamente rápidas em comparação com a maioria dos outros modelos.
Fig 9. Qualidade vs. Velocidade de Saída do GPT-4o Mini.
Aqui estão algumas áreas-chave onde ele pode brilhar no futuro:
Assistentes Virtuais e Chatbots: O GPT-4o Mini pode fornecer respostas rápidas e inteligentes para melhorar as interações com o usuário.
Ferramentas de Produtividade: Pode melhorar tarefas como resumir documentos, redigir e-mails e traduzir idiomas para aumentar a eficiência.
Tradução de Idiomas: A versão mais recente do GPT pode ser usada para desenvolver tradutores que fornecem tradução de idiomas precisa e em tempo real para melhor comunicação entre diferentes idiomas.
O GPT-4o Mini abre novas portas
O GPT-4o Mini está criando novas oportunidades para o futuro da IA multimodal. O custo de processamento de cada trecho de texto ou dado, conhecido como custo por token, diminuiu substancialmente - em quase 99% - desde 2022, quando o text-davinci-003, o modelo GPT-3, foi lançado. A diminuição no custo mostra uma tendência clara para tornar a IA avançada mais acessível. À medida que os modelos de IA continuam a melhorar, está se tornando cada vez mais provável que a integração da IA em todos os aplicativos e sites seja economicamente viável!
Quer experimentar a IA na prática? Visite o nosso repositório GitHub para ver as nossas inovações e fazer parte da nossa comunidade ativa. Saiba mais sobre as aplicações de IA na indústria transformadora e na agricultura nas nossas páginas de soluções.