Glossário

Tamanho do Lote

Descubra o impacto do tamanho do lote no aprendizado profundo. Otimize a velocidade de treinamento, o uso da memória e o desempenho do modelo de forma eficiente.

O tamanho do lote é um hiperparâmetro fundamental no domínio da aprendizagem automática que determina o número de amostras de dados de treino processadas antes de o modelo actualize os seus parâmetros internos. Em vez de analisar todo um conjunto de dados de uma só vez - o que muitas vezes é computacionalmente computacionalmente impossível devido a limitaçõesde memória dividem os dados em grupos mais pequenos, chamados lotes. Esta divisão determina a estabilidade do processo de aprendizagem estabilidade do processo de aprendizagem, a velocidade de computação e a quantidade de memória necessária para o GPU durante o treino. A escolha do tamanho correto do lote actua como um ato de equilíbrio entre a eficiência computacional e a qualidade da convergência do modelo. convergência do modelo.

O impacto na dinâmica da formação

A seleção de um tamanho de lote altera fundamentalmente a forma como uma rede neural aprende. Quando o tamanho do lote é definido para um valor mais baixo, o modelo actualiza os seus pesos do modelo com mais frequência, introduzindo ruído no no processo de descida do gradiente. Este ruído pode ser benéfico, muitas vezes ajudando o algoritmo de otimização a escapar mínimos locais e a encontrar soluções mais robustas, o que ajuda a a evitar o sobreajuste. Por outro lado, lotes maiores fornecem uma estimativa mais precisa do gradiente, levando a actualizações mais suaves e estáveis, embora exijam memória de hardware significativamente maior e podem, por vezes, resultar numa "lacuna de generalização", em que o modelo modelo tem um bom desempenho nos dados de treino, mas é menos eficaz em dados não vistos.

As capacidades do hardware ditam frequentemente o limite superior deste parâmetro. Os aceleradores de hardware modernos, como os detalhados no guia de desempenho de aprendizagem profunda daNVIDIA, dependem da computação paralela para processar grandes blocos de dados simultaneamente. Portanto, usar um tamanho de lote que se alinhe à arquitetura do processador - normalmente potências de dois como 32, 64 ou 128 - pode maximizar a taxa de transferência e reduzir o tempo total de treinamento por época.

Aplicações no Mundo Real

Compreender como afinar este parâmetro é essencial para implementar soluções de IA eficazes em diferentes sectores.

Imagiologia médica de alta resolução: Em IA nos cuidados de saúde, os modelos são frequentemente encarregados de analisar tomografias computorizadas ou ressonâncias magnéticas detalhadas para identificar anomalias como tumores. Estas imagens são enormes em tamanho de ficheiro. A tentativa de processar muitas delas em simultâneo excederia a memória de vídeo (VRAM) mesmo do hardware mais potente. hardware mais potente. Por conseguinte, os profissionais utilizam um tamanho de lote muito pequeno (por exemplo, 1 ou 2) para facilitar a análise de imagens médicas sem travar o sistema o sistema, dando prioridade à capacidade de lidar com dados de alta fidelidade em detrimento da velocidade de formação bruta.
Inspeção do fabrico em tempo real: Por outro lado, em ambientes de fabrico inteligente, a velocidade é é fundamental. Um sistema de inspeção visual automatizado numa correia transportadora pode captar milhares de imagens de placas de circuito placas de circuitos por hora. Durante a fase de inferência (deteção de defeitos na produção), os sistemas podem utilizar inferências em lote para para agrupar as imagens recebidas e processá-las em paralelo. Isso maximiza o rendimento do sistema de visão computacional sistema de visão computacional, garantindo que ele mantenha o ritmo com a linha de produção rápida.

Configuração do tamanho do lote com o Ultralytics

Ao utilizar o PacotePython Ultralyticsconfigurar o tamanho do lote é simples. O batch permite-lhe especificar exatamente quantas imagens o modelo deve ver antes de atualizar os pesos. Se definido como -1a biblioteca também pode utilizar um Funcionalidade AutoBatch para determinar automaticamente o tamanho tamanho máximo de lote que o seu hardware pode suportar.

from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset with a specific batch size
# A batch size of 32 balances speed and memory usage for most standard GPUs
results = model.train(data="coco8.yaml", epochs=50, batch=32)

Distinguir conceitos relacionados

É importante que os profissionais distingam "Tamanho do lote" de terminologia semelhante encontrada em estruturas de aprendizagem profunda.

Tamanho do lote vs. época: Uma época representa uma passagem completa por todo o conjunto de dados de treinamento. O tamanho do lote determina em quantos determina em quantos pedaços os dados são divididos dentro de uma única época. Por exemplo, se você tiver 1.000 amostras e um tamanho de lote de 100, serão necessárias 10 iterações para completar uma época.
Tamanho do lote vs. Normalização do lote: Embora partilhem o mesmo nome, Normalização de lote é uma técnica de camada específica específica usada para normalizar as entradas da camada para melhorar a estabilidade. Embora a eficácia da normalização de lote possa Dependendo do tamanho do lote (exigindo um lote suficientemente grande para calcular estatísticas precisas), ela é um componente estrutural estrutural da arquitetura da rede, e não apenas uma configuração de treinamento.
Formação vs. Loteamento de Inferência: Durante a formação, o objetivo é aprender os pesos. Durante a inferência, o batching é puramente uma otimização para a velocidade. Para aplicações sensíveis à latência, como veículos autónomos, um tamanho de lote de 1 é é frequentemente utilizado para obter uma resposta imediata, enquanto tarefas de análise de dados podem usar grandes lotes para processar imagens de vídeo históricas durante a noite.

Tamanho do Lote

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

O impacto na dinâmica da formação

Aplicações no Mundo Real

Configuração do tamanho do lote com o Ultralytics

Distinguir conceitos relacionados

Leia mais nesta categoria

Futuras tendências na deteção de objectos: 7 aspectos fundamentais a ter em conta

Melhorar a reidentificação de veículos com modelos Ultralytics YOLO

Melhorar a previsão de colisões com os modelos Ultralytics YOLO

Junte-se à comunidade Ultralytics