Descubra o poder do YAML em IA/ML! Simplifique configurações, otimize fluxos de trabalho e melhore a legibilidade com este formato de dados versátil.
YAML, que significa "YAML Ain't Markup Language", é um padrão de serialização de dados legível por humanos padrão de serialização de dados legível por humanos, comumente usado para arquivos de configuração e troca de dados entre linguagens. Ao contrário de formatos mais verbosos, o YAML prioriza a limpeza e a facilidade de uso, baseando-se na indentação em vez de parêntesis ou etiquetas para definir a estrutura. Esta abordagem minimalista torna-o uma escolha preferida escolha preferida para programadores e cientistas de dados que trabalham em Aprendizagem automática (ML) e Inteligência Artificial (IA), onde definir claramente ambientes e parâmetros complexos é essencial. Pode explorar a especificação oficial no sítio Web sítio Web YAML.
No domínio da aprendizagem profunda (DL), o YAML serve de a espinha dorsal da gestão e reprodutibilidade das experiências. Os sistemas complexos exigem frequentemente a definição de centenas de parâmetros, desde caminhos de ficheiros a constantes matemáticas. Ao externalizar essas configurações em arquivos YAML, os pesquisadores asseguram que as suas configurações de dados de treino e e arquitecturas de modelos permanecem separadas da base de código. Essa separação facilita as práticas de práticas de DataOps e permite um controlo de versão mais fácil das configurações experimentais.
O YAML é onipresente nas pilhas de desenvolvimento de IA modernas. Aqui estão duas maneiras principais de utilizá-lo:
Embora o YAML partilhe semelhanças com outros formatos, é distinto na sua filosofia de conceção e casos de utilização:
Ao trabalhar com o modelo Ultralytics YOLO11 , os ficheiros YAML são fundamentais para definir os dados que o modelo vê. O ficheiro
data na função de treino aceita um ficheiro YAML que aponta para as suas imagens e etiquetas.
O exemplo seguinte demonstra como iniciar uma sessão de treino utilizando um ficheiro de configuração de conjunto de dados padrão.
from ultralytics import YOLO
# Load a standard YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model using the 'coco8.yaml' dataset configuration
# The YAML file contains paths to images and class names (e.g., person, bus)
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)
Para além da formação direta de modelos, o YAML é parte integrante do ecossistema mais vasto do ecossistema MLOps. Ele é o formato de configuração formato de configuração padrão para o Docker Compose ao orquestrar contentores para a implementação de modelos. Da mesma forma, Kubernetes usa YAML para definir como os aplicativos são dimensionados na nuvem.
Ferramentas de automação como o GitHub Actions também dependem do YAML para definir fluxos de trabalho CI/CD, garantindo que os testes automatizados e a integração automatizados ocorram sem problemas sempre que o código é enviado. Os programadores Python utilizam frequentemente a biblioteca biblioteca PyYAML para ler e escrever programaticamente esses arquivos fazendo a ponte entre a configuração estática e a execução dinâmica do código.