Descubra o poder do aprendizado profundo: explore redes neurais, técnicas de treinamento e aplicações no mundo real em IA, saúde e muito mais.
O deep learning (DL) é um subconjunto especializado do aprendizado de máquina (ML) que imita a maneira como o cérebro humano processa informações. Enquanto o ML tradicional geralmente depende da extração manual de recursos, o deep learning automatiza esse processo usando estruturas multicamadas conhecidas como redes neurais artificiais (ANNs). Essas redes são compostas por camadas de nós interconectados, ou neurónios, que processam dados de forma hierárquica. Essa "profundidade" permite que os modelos aprendam padrões e representações complexas diretamente a partir de entradas brutas, como imagens, áudio e texto, tornando-os excepcionalmente poderosos para lidar com problemas de dados não estruturados.
O mecanismo central do aprendizado profundo envolve a passagem de dados por várias camadas de unidades de processamento não lineares. Em uma rede neural feedforward padrão, as informações fluem de uma camada de entrada, passando por várias camadas "ocultas" e, finalmente, chegando a uma camada de saída. Durante a fase de treino, a rede ajusta os seus parâmetros internos — conhecidos como weights and biases— com base no erro das suas previsões. Esse ajuste é normalmente feito usando um algoritmo de otimização como o gradiente descendente estocástico (SGD) combinado com retropropagação para minimizar a perda.
O deep learning se destaca ao lidar com grandes quantidades de dados. Ao contrário de algoritmos mais simples, que podem atingir um patamar máximo de desempenho, os modelos de DL geralmente continuam a melhorar à medida que o tamanho dos dados de treino aumenta. Essa escalabilidade é a principal razão pela qual GPUs de alto desempenho são frequentemente usadas para acelerar a pesada carga computacional necessária para treinar essas arquiteturas massivas.
O deep learning é frequentemente confundido com o machine learning, mas a diferença reside no nível de intervenção humana e na complexidade arquitetónica. O machine learning geralmente requer dados estruturados e recursos projetados por humanos. O deep learning, por outro lado, realiza a extração automática de recursos.
Existem várias arquiteturas especializadas dentro do deep learning para lidar com tipos específicos de dados:
O deep learning passou da teoria académica para o centro das modernas pilhas de tecnologia. Aqui estão dois exemplos concretos do seu impacto:
Ferramentas como PyTorch e TensorFlow o acesso ao deep learning, mas
as interfaces de alto nível tornam isso ainda mais fácil. O ultralytics O pacote permite que os programadores aproveitem
arquiteturas de última geração sem precisar projetar redes neurais do zero.
Aqui está um exemplo conciso de carregamento de um modelo de aprendizagem profunda pré-treinado e execução de inferência em uma imagem:
from ultralytics import YOLO
# Load a pre-trained YOLO26 model (a Convolutional Neural Network)
model = YOLO("yolo26n.pt")
# Perform object detection on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results to see identified objects and bounding boxes
results[0].show()
O campo está a evoluir rapidamente para modelos mais eficientes e capazes. Técnicas como a aprendizagem por transferência permitem aos utilizadores ajustar modelos pré-treinados massivos em conjuntos de dados menores e específicos, economizando tempo e recursos computacionais significativos. Além disso, o surgimento da IA generativa demonstra a capacidade do DL de criar novos conteúdos, desde imagens realistas até código.
Para equipas que procuram otimizar o seu fluxo de trabalho, Ultralytics oferece um ambiente abrangente para gerir o ciclo de vida de projetos de deep learning. Desde a anotação colaborativa de dados até à formação e implementação baseadas na nuvem, estas ferramentas ajudam a colmatar a lacuna entre a investigação experimental e as aplicações prontas para produção. Para compreender melhor os fundamentos matemáticos, recursos como o MIT Deep Learning Book fornecem uma cobertura teórica abrangente.