Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Tokenization

Explora como a tokenização transforma texto e imagens brutos em dados prontos para IA. Aprende sobre métodos de NLP e visão computacional usados por modelos como o Ultralytics YOLO26.

Tokenização é o processo algorítmico de dividir um fluxo de dados brutos—como texto, imagens ou áudio—em unidades menores e gerenciáveis chamadas tokens. Essa transformação atua como uma ponte crítica no pipeline de data preprocessing, convertendo entradas não estruturadas em um formato numérico que sistemas de artificial intelligence (AI) conseguem interpretar. Computadores não conseguem entender inerentemente a linguagem humana ou cenas visuais; eles exigem representações numéricas para realizar cálculos. Ao segmentar dados em tokens, engenheiros permitem que neural networks mapeiem essas unidades para embeddings—representações vetoriais que capturam o significado semântico. Sem este passo fundamental, modelos de machine learning seriam incapazes de identificar padrões, aprender contexto ou processar os vastos datasets necessários para o treinamento moderno.

Link to this sectionTokenização vs. Token#

Embora os termos sejam frequentemente ouvidos juntos em discussões sobre deep learning, é útil distinguir o método do resultado para entender o fluxo de trabalho.

  • Tokenization é o processo (o verbo). Refere-se ao conjunto específico de regras ou algoritmos usados para dividir os dados. Para texto, isso pode envolver o uso de bibliotecas como NLTK ou spaCy para determinar onde uma unidade termina e outra começa.
  • Token é a saída (o substantivo). É a unidade individual gerada pelo processo, como uma palavra única, um sub-palavra, um caractere ou um patch de pixels.

Link to this sectionMétodos em diferentes domínios#

A estratégia para tokenização varia significativamente dependendo da modalidade dos dados, influenciando como um foundation model percebe o mundo.

Link to this sectionTokenização de texto em NLP#

Em Natural Language Processing (NLP), o objetivo é segmentar o texto preservando o significado. Métodos iniciais baseavam-se em técnicas simples, como separar palavras por espaços ou remover stop words. No entanto, Large Language Models (LLMs) modernos utilizam algoritmos de sub-palavras mais sofisticados, como Byte Pair Encoding (BPE) ou WordPiece. Esses algoritmos mesclam iterativamente os pares de caracteres mais frequentes, permitindo que o modelo lide com palavras raras ao quebrá-las em subcomponentes familiares (por exemplo, "smartphones" torna-se "smart" + "phones"). Essa abordagem equilibra o tamanho do vocabulário com a capacidade de representar linguagem complexa.

Link to this sectionTokenização visual em Computer Vision#

Tradicionalmente, modelos de computer vision (CV) como CNNs processavam pixels usando janelas deslizantes. A introdução do Vision Transformer (ViT) mudou esse paradigma ao aplicar a tokenização em imagens. A imagem é fatiada em patches de tamanho fixo (por exemplo, 16x16 pixels), que são então achatados e projetados linearmente. Esses "tokens visuais" permitem que o modelo utilize mecanismos de self-attention para aprender relações globais em toda a imagem, de forma semelhante a como um Transformer processa uma frase.

Link to this sectionAplicações no Mundo Real#

A tokenização é o motor silencioso por trás de muitas aplicações de IA usadas em ambientes de produção hoje.

  1. Detecção de objetos de vocabulário aberto: Arquiteturas avançadas como YOLO-World empregam uma abordagem de multi-modal model. Quando um usuário insere um prompt como "pessoa usando um chapéu vermelho", o sistema tokeniza este texto e o mapeia para o mesmo espaço de recursos dos dados visuais. Isso permite o zero-shot learning, permitindo que o modelo detecte objetos nos quais não foi explicitamente treinado, combinando tokens de texto com recursos visuais.

  2. Arte e design generativo: Na geração text-to-image, os prompts do usuário são tokenizados para guiar o processo de difusão. O modelo usa esses tokens para condicionar a geração, garantindo que a imagem resultante se alinhe com os conceitos semânticos (por exemplo, "pôr do sol", "praia") extraídos durante a fase de tokenização.

Link to this sectionExemplo em Python: Detecção baseada em tokens#

O exemplo a seguir demonstra como o pacote ultralytics utiliza a tokenização de texto implicitamente dentro do fluxo de trabalho YOLO-World. Ao definir classes personalizadas, o modelo tokeniza essas strings para pesquisar objetos específicos dinamicamente.

from ultralytics import YOLO

# Load a pre-trained YOLO-World model capable of text-based detection
model = YOLO("yolov8s-world.pt")

# Define custom classes; these are tokenized internally to guide the model
# The model will look for visual features matching these text tokens
model.set_classes(["backpack", "bus"])

# Run prediction on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Show results (only detects the tokenized classes defined above)
results[0].show()

Link to this sectionImpacto no desempenho do modelo#

A escolha da estratégia de tokenização impacta diretamente a accuracy e a eficiência computacional. Uma tokenização ineficiente pode levar a erros de "fora do vocabulário" em NLP ou à perda de detalhes refinados na análise de imagem. Frameworks como PyTorch e TensorFlow fornecem ferramentas flexíveis para otimizar este passo. À medida que as arquiteturas evoluem—como o estado da arte YOLO26—o processamento eficiente de dados garante que os modelos possam executar real-time inference em diversos hardwares, desde poderosas GPUs em nuvem até dispositivos de borda. Equipes que gerenciam esses fluxos de dados complexos frequentemente contam com a Ultralytics Platform para otimizar a anotação de datasets, model training e a implementação.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática