Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Data Lake

Explora como os data lakes servem de base para IA e ML. Aprende a aproveitar dados brutos para treinar o Ultralytics YOLO26 e simplificar fluxos de trabalho de visão computacional.

Um data lake é um repositório de armazenamento centralizado que mantém uma vasta quantidade de dados brutos no seu formato nativo até serem necessários. Ao contrário dos sistemas de armazenamento tradicionais que exigem que os dados sejam estruturados antes da entrada, um data lake aceita dados "como estão", incluindo dados estruturados (linhas e colunas), dados semiestruturados (CSV, logs, XML, JSON), dados não estruturados (e-mails, documentos, PDFs) e dados binários (imagens, áudio, vídeo). Esta flexibilidade arquitetónica torna os data lakes numa pedra angular das estratégias modernas de Big Data, particularmente para organizações que aproveitam Inteligência Artificial (IA) e Machine Learning (ML). Ao separar a captura de dados do uso dos dados, as organizações podem armazenar enormes conjuntos de informação de forma relativamente barata e definir as questões de análise específicas mais tarde.

Link to this sectionO Papel dos Data Lakes na IA e Machine Learning#

No contexto do desenvolvimento de IA, o valor principal de um data lake reside na sua capacidade de suportar fluxos de trabalho de Deep Learning (DL). Redes neuronais avançadas requerem dados de treino diversos e volumosos para atingir uma elevada precisão. Um data lake atua como a área de preparação onde ativos brutos — como milhões de imagens de alta resolução para Computer Vision (CV) ou milhares de horas de áudio para Reconhecimento de Fala — residem antes de serem processados.

Os cientistas de dados utilizam metodologias de "schema-on-read" dentro dos data lakes. Isto significa que a estrutura é aplicada aos dados apenas quando são lidos para processamento, em vez de quando são escritos no armazenamento. Isto permite uma imensa agilidade; o mesmo conjunto de dados brutos pode ser processado de várias formas para diferentes tarefas de modelagem preditiva sem alterar a fonte original. Além disso, data lakes robustos integram-se frequentemente com serviços de cloud computing como Amazon S3 ou Azure Blob Storage, permitindo um processamento escalável e paralelo necessário para treinar modelos pesados como o YOLO26.

Link to this sectionData Lake vs. Data Warehouse#

Embora frequentemente confundidos, um data lake é distinto de um data warehouse. Um data warehouse armazena dados em tabelas estruturadas e é otimizado para consultas SQL rápidas e relatórios de inteligência de negócios. Utiliza "schema-on-write", o que significa que os dados devem ser limpos e transformados através de um processo ETL (Extract, Transform, Load) antes de entrarem no sistema.

Inversamente, um data lake é otimizado para volume e variedade de armazenamento. Suporta aprendizagem não supervisionada e análise exploratória onde o objetivo pode ainda não estar definido. Por exemplo, um data warehouse pode dizer-te quantos produtos foram vendidos no mês passado, enquanto um data lake contém os logs brutos de sentimento do cliente e dados de imagem que ajudam um modelo de IA a entender o porquê de terem sido vendidos.

Link to this sectionAplicações no Mundo Real#

Os data lakes são fundamentais em vários setores que estão a expandir os limites da automação:

  • Veículos Autónomos: o desenvolvimento de tecnologia de condução autónoma requer o processamento de petabytes de dados de sensores. Os veículos autónomos geram fluxos contínuos de nuvens de pontos LiDAR, sinais de radar e vídeo de alta definição. Um data lake armazena esta telemetria bruta, permitindo aos engenheiros repetir cenários do mundo real para treinar modelos de Deteção de Objetos para identificar peões e obstáculos sob diferentes condições meteorológicas.
  • Diagnóstico em Cuidados de Saúde: Na moderna análise de imagem médica, os hospitais consolidam o histórico do paciente, dados genómicos e ficheiros de imagem (MRI, tomografias computorizadas) num data lake seguro. Os investigadores podem então aceder a estes dados anonimizados e não estruturados para treinar modelos para deteção de tumores ou previsão de doenças, utilizando frequentemente técnicas de segmentação para isolar regiões de interesse dentro da imagiologia médica.

Link to this sectionUtilizar Data Lakes com a Ultralytics#

Ao trabalhar com a Ultralytics Platform, os utilizadores frequentemente extraem subconjuntos de dados brutos do data lake da sua organização para criar conjuntos de dados anotados para treino. Uma vez recuperadas e rotuladas as imagens brutas, podem ser utilizadas para treinar modelos de última geração.

O exemplo a seguir demonstra como um programador pode carregar um conjunto de dados local (imitando uma busca a partir de um data lake) para treinar o modelo YOLO26 para uma tarefa de deteção.

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Train the model using a dataset configuration file
# In a production pipeline, this data might be streamed or downloaded
# from a cloud-based data lake prior to this step.
results = model.train(data="coco8.yaml", epochs=5, imgsz=640)

# Run inference on a new image to verify performance
predictions = model("https://ultralytics.com/images/bus.jpg")

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática