Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Markov Decision Process (MDP)

Explora os fundamentos dos Processos de Decisão de Markov (MDP). Aprende como os MDPs impulsionam a aprendizagem por reforço e como o Ultralytics YOLO26 fornece dados de estado em tempo real.

Um Processo de Decisão de Markov (MDP) é uma estrutura matemática usada para modelar a tomada de decisões em situações onde os resultados são parcialmente aleatórios e parcialmente sob o controle de um tomador de decisão. É o projeto fundamental para aprendizado por reforço (RL), fornecendo uma maneira estruturada para um agente de IA interagir com um ambiente para alcançar um objetivo específico. Ao contrário do aprendizado supervisionado padrão, que depende de conjuntos de dados rotulados estáticos, um MDP foca na tomada de decisão sequencial onde ações atuais influenciam possibilidades futuras.

Link to this sectionComponentes Principais de um MDP#

Para entender como um MDP opera, é útil visualizá-lo como um ciclo de interação entre um agente e seu ambiente. Este ciclo é definido por cinco componentes-chave:

  • Estado: A situação ou configuração atual do ambiente. Em veículos autônomos, o estado pode incluir a velocidade do carro, localização e obstáculos próximos detectados por sensores de visão computacional (CV).
  • Ação: O conjunto de todos os movimentos ou escolhas possíveis disponíveis para o agente. Isso é frequentemente referido como espaço de ação, que pode ser discreto (por exemplo, mover para a esquerda, mover para a direita) ou contínuo (por exemplo, ajustar o ângulo de direção).
  • Probabilidade de Transição: Define a probabilidade de mover-se de um estado para outro após realizar uma ação específica. Ela contabiliza a incerteza e a dinâmica do mundo real, distinguindo os MDPs de sistemas determinísticos.
  • Recompensa: Um sinal numérico recebido após cada ação. A função de recompensa é crítica porque guia o comportamento do agente — recompensas positivas encorajam ações desejáveis, enquanto recompensas negativas (penalidades) desencorajam erros.
  • Fator de Desconto: Um valor que determina a importância das recompensas futuras em comparação com as imediatas. Ajuda o agente a priorizar o planejamento de longo prazo sobre a gratificação de curto prazo, um conceito central para a otimização estratégica.

Link to this sectionAplicações no Mundo Real#

Os MDPs atuam como o motor de tomada de decisão por trás de muitas tecnologias avançadas, permitindo que sistemas naveguem em ambientes complexos e dinâmicos.

  • Controle de Robótica: Em IA na robótica, os MDPs permitem que máquinas aprendam habilidades motoras complexas. Por exemplo, um braço robótico usa MDPs para determinar o caminho ideal para pegar um objeto enquanto evita colisões. O estado são os ângulos das juntas e a posição do objeto, derivados da detecção de objetos 3D, e a recompensa é baseada na velocidade de agarre bem-sucedido.
  • Gerenciamento de Inventário: Varejistas usam MDPs para otimização de inventário. Aqui, o estado representa os níveis atuais de estoque, as ações são decisões de reabastecimento e as recompensas são calculadas com base nas margens de lucro menos os custos de armazenamento e falta de estoque.
  • Tratamento de Saúde: Na medicina personalizada, os MDPs ajudam a projetar planos de tratamento dinâmicos. Ao modelar as métricas de saúde do paciente como estados e medicações como ações, os médicos podem usar modelagem preditiva para maximizar os resultados de saúde a longo prazo do paciente.

Link to this sectionRelacionamento com Aprendizado por Reforço#

Embora intimamente relacionados, é importante distinguir entre um MDP e Aprendizado por Reforço. Um MDP é a declaração formal do problema — o modelo matemático do ambiente. Aprendizado por Reforço é o método usado para resolver esse problema quando a dinâmica interna (probabilidades de transição) não é totalmente conhecida. Algoritmos de RL, como Q-learning, interagem com o MDP para aprender a melhor política através de tentativa e erro.

Link to this sectionObservação Visual em MDPs#

Em aplicações modernas de IA, o "estado" de um MDP é frequentemente derivado de dados visuais. Modelos de percepção de alta velocidade agem como os olhos do sistema, convertendo feeds de câmera brutos em dados estruturados que o MDP pode processar. Por exemplo, o Ultralytics YOLO26 pode fornecer coordenadas de objetos em tempo real, que servem como entradas de estado para um agente de tomada de decisão.

O exemplo a seguir demonstra como extrair uma representação de estado (caixas delimitadoras) de uma imagem usando Python, que poderia então ser inserida em uma política de MDP.

from ultralytics import YOLO

# Load the YOLO26 model to serve as the perception layer
model = YOLO("yolo26n.pt")

# Perform inference to observe the current 'state' of the environment
results = model("https://ultralytics.com/images/bus.jpg")

# Extract bounding box coordinates to form the state vector
# This structured data tells the agent where objects are located
for box in results[0].boxes:
    print(f"State Object: Class {int(box.cls)} at {box.xywh.tolist()}")

Ao integrar modelos de visão robustos com estruturas de MDP, desenvolvedores podem construir sistemas que não apenas percebem o mundo, mas também tomam decisões inteligentes e adaptáveis dentro dele. Essa sinergia é essencial para o avanço de sistemas autônomos e manufatura inteligente.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática