Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

GPT-4

Explora o GPT-4, o modelo multimodal da OpenAI. Aprende sobre a sua arquitetura, raciocínio e como se emparelha com o Ultralytics YOLO26 para aplicações avançadas de visão por IA.

O GPT-4 (Generative Pre-trained Transformer 4) é um modelo multimodal sofisticado desenvolvido pela OpenAI que avança significativamente as capacidades da inteligência artificial. Como um Modelo Multimodal de Grande Escala (LMM), o GPT-4 difere dos seus antecessores apenas de texto ao aceitar tanto entradas de imagem quanto de texto para gerar saídas textuais. Este salto arquitetural permite-lhe exibir um desempenho ao nível humano em vários benchmarks profissionais e académicos, tornando-o uma tecnologia fundamental no campo do Processamento de Linguagem Natural (NLP) e não só. Ao colmatar a lacuna entre a compreensão visual e o raciocínio linguístico, o GPT-4 impulsiona uma vasta gama de aplicações, desde assistentes de codificação avançados a ferramentas complexas de análise de dados.

Link to this sectionCapacidades e Arquitetura do Núcleo#

A arquitetura do GPT-4 é construída sobre o framework Transformer, utilizando mecanismos de aprendizagem profunda para prever o próximo token numa sequência. Contudo, a sua escala de treino e metodologia permitem vantagens distintas em relação a iterações anteriores.

  • Processamento Multimodal: Ao contrário dos Modelos de Linguagem de Grande Escala (LLMs) padrão que apenas processam texto, o GPT-4 envolve-se em aprendizagem multimodal. Pode analisar entradas visuais — tais como gráficos, fotografias ou diagramas — e fornecer explicações textuais detalhadas, resumos ou respostas com base nesse contexto visual.
  • Raciocínio Avançado: O modelo demonstra uma capacidade de condução e raciocínio melhorada. Está mais bem equipado para lidar com instruções matizadas e tarefas complexas, frequentemente alcançadas através de engenharia de prompts cuidadosa. Isto reduz a frequência de erros lógicos em comparação com gerações anteriores como o GPT-3.
  • Janela de Contexto Expandida: O GPT-4 suporta uma janela de contexto significativamente maior, permitindo-lhe processar e reter informações de documentos extensos ou conversas longas sem perder a coerência.
  • Segurança e Alinhamento: Foi empregue uma utilização extensiva de Aprendizagem por Reforço a partir de Feedback Humano (RLHF) para alinhar as saídas do modelo com a intenção humana, visando minimizar conteúdos prejudiciais e reduzir alucinações em LLMs.

Link to this sectionAplicações no Mundo Real#

A versatilidade do GPT-4 facilita a sua integração em diversos setores, aumentando a produtividade e permitindo novas formas de interação.

  1. Desenvolvimento de Software: Os programadores utilizam o GPT-4 como um parceiro de codificação inteligente. Pode gerar snippets de código, depurar erros e explicar conceitos de programação complexos. Por exemplo, pode ajudar a escrever scripts em Python para pipelines de operações de aprendizagem automática (MLOps) ou na configuração de ambientes para treino de modelos.

  2. Educação e Tutoria: Plataformas educativas aproveitam o GPT-4 para criar experiências de aprendizagem personalizadas. Tutores de IA podem explicar assuntos difíceis como cálculo ou história, adaptando o seu estilo de ensino ao nível de proficiência do estudante. Isto ajuda a democratizar o acesso a uma educação de qualidade, funcionando de forma semelhante a um assistente virtual dedicado à aprendizagem.

  3. Serviços de Acessibilidade: Aplicações como Be My Eyes utilizam as capacidades visuais do GPT-4 para ajudar utilizadores com deficiência visual. O modelo pode descrever o conteúdo de um frigorífico, ler etiquetas ou navegar em ambientes desconhecidos interpretando feeds de câmara, agindo efetivamente como uma ponte para o mundo visual.

Link to this sectionSinergias com Modelos de Visão Computacional#

Embora o GPT-4 possua capacidades visuais, é distinto de modelos especializados em Visão Computacional (CV) concebidos para velocidade em tempo real. O GPT-4 é um raciocinador generalista, enquanto modelos como o YOLO26 estão otimizados para deteção de objetos e segmentação de alta velocidade.

Em muitos Agentes de IA modernos, estas tecnologias são combinadas. Um modelo YOLO pode identificar e listar rapidamente objetos num fluxo de vídeo com latência de milissegundos. Estes dados estruturados são então passados ao GPT-4, que pode usar as suas capacidades de raciocínio para gerar uma narrativa, relatório de segurança ou decisão estratégica baseada nos itens detetados.

O exemplo seguinte ilustra como usar ultralytics para detetar objetos, criando uma lista estruturada que poderia servir como um prompt rico em contexto para o GPT-4.

from ultralytics import YOLO

# Load the YOLO26 model for real-time object detection
model = YOLO("yolo26n.pt")

# Perform inference on an image source
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detected class names for downstream processing
class_ids = results[0].boxes.cls.tolist()
detected_objects = [results[0].names[int(cls_id)] for cls_id in class_ids]

# This list can be formatted as a prompt for GPT-4 to describe the scene context
print(f"Detected items for GPT-4 input: {detected_objects}")

Link to this sectionDistinguir Termos Relacionados#

Compreender o panorama dos modelos generativos requer diferenciar o GPT-4 de conceitos semelhantes:

  • GPT-4 vs. GPT-3: A principal diferença reside na modalidade e na profundidade do raciocínio. O GPT-3 é um modelo apenas de texto (unimodal), enquanto o GPT-4 é multimodal (texto e imagem). O GPT-4 também exibe taxas de alucinação mais baixas e uma melhor retenção de contexto.
  • GPT-4 vs. BERT: O BERT é um modelo apenas de codificador concebido para compreender o contexto dentro de uma frase (bidirecional), destacando-se na classificação e análise de sentimento. O GPT-4 é uma arquitetura baseada em descodificador focada em tarefas generativas (previsão do próximo token) e raciocínio complexo.
  • GPT-4 vs. YOLO26: O YOLO26 é um modelo de visão especializado para localizar objetos (caixas delimitadoras) e máscaras de segmentação em tempo real. O GPT-4 processa o significado semântico de uma imagem, mas não gera coordenadas precisas de caixas delimitadoras nem funciona às elevadas taxas de fotogramas necessárias para veículos autónomos.

Link to this sectionDesafios e Perspectivas Futuras#

Apesar das suas capacidades impressionantes, o GPT-4 não está isento de limitações. Ainda pode produzir erros factuais e o seu treino em vastos conjuntos de dados da internet pode reproduzir inadvertidamente viés na IA. Abordar estas preocupações éticas continua a ser uma prioridade para a comunidade de investigação. Além disso, o imenso custo computacional de executar modelos tão grandes estimulou o interesse em quantização de modelos e destilação para tornar a IA poderosa mais acessível e eficiente.

Para aqueles que procuram construir conjuntos de dados para treinar ou ajustar modelos mais pequenos e especializados juntamente com grandes raciocinadores como o GPT-4, ferramentas como a Plataforma Ultralytics oferecem soluções abrangentes para gestão de dados e implementação de modelos.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática