Desbloqueia o poder dos dados sintéticos para IA/ML! Ultrapassa a escassez de dados, as questões de privacidade e os custos, ao mesmo tempo que impulsiona a formação e a inovação de modelos.
Os dados sintéticos referem-se a informação gerada artificialmente que imita as propriedades estatísticas dos dados do mundo real, em vez de ser recolhida diretamente de eventos ou medições reais. Nos domínios da Inteligência Artificial (IA) e da Aprendizagem Automática (AM), os dados sintéticos constituem uma alternativa ou um suplemento crucial aos dados de treino reais. São particularmente valiosos quando a recolha de dados reais suficientes é difícil, dispendiosa, demorada(Guia de Recolha e Anotação de Dados) ou suscita preocupações com a privacidade dos dados. Esta informação criada artificialmente ajuda a treinar modelos como o Ultralytics YOLOtesta sistemas e explora cenários que podem ser raros ou perigosos na realidade, o que acaba por impulsionar a inovação e o desempenho do modelo.
A geração de dados sintéticos utiliza várias técnicas, consoante a complexidade e a fidelidade exigidas. Algumas abordagens comuns incluem:
Os dados sintéticos oferecem várias vantagens significativas para o desenvolvimento da IA e da visão por computador:
Na visão computacional, as imagens sintéticas são frequentemente utilizadas para treinar modelos para tarefas como a deteção de objectos, a segmentação de imagens e a estimativa de pose sob diversas condições (por exemplo, iluminação variável, clima, pontos de vista) que podem ser difíceis de encontrar nos conjuntos de dados disponíveis.
Os dados sintéticos são aplicados em vários sectores:
Outras aplicações incluem a modelação financeira(AI in Finance), o retalho(AI for Smarter Retail) e a formação em robótica.
Embora tanto os dados sintéticos como o aumento de dados tenham como objetivo melhorar os conjuntos de dados, são conceitos distintos:
Essencialmente, o aumento de dados expande a variação em torno dos dados existentes, enquanto os dados sintéticos podem criar pontos e cenários de dados totalmente novos, oferecendo uma forma poderosa de complementar ou mesmo substituir dados reais no treino de modelos de IA geridos através de plataformas como o Ultralytics HUB.