Yolo Vision Shenzhen
Shenzhen
Junte-se agora
Glossário

Geração Aumentada por Recuperação (RAG)

Descubra como a Geração Aumentada por Recuperação (RAG) aprimora os modelos de IA, integrando dados externos confiáveis e em tempo real para obter respostas precisas e atualizadas.

O Retrieval Augmented Generation (RAG) é um quadro avançado concebido para otimizar os resultados de modelos de linguagem de grande porte (LLMs) referenciando uma base de conhecimento autorizada fora dos seus dados de treino originais. Nos sistemas de sistemas de IA generativa, o modelo baseia-se apenas na informação estática que aprendeu durante o treino, o que pode levar a respostas desactualizadas ou erros factuais conhecidos como alucinações. O RAG colmata esta lacuna recuperando informações relevantes e actualizadas de fontes externas fiáveis e fornecendo-as ao modelo como contexto antes de gerar uma resposta. Este processo fundamenta efetivamente a IA, garantindo uma elevada precisão e relevância sem a necessidade de um dispendioso de um novo treino do modelo.

Como funciona a Geração Aumentada de Recuperação

O fluxo de trabalho RAG integra dois componentes principais: um sistema de recuperação e um modelo de geração. Esta sinergia transforma como processamento da linguagem natural (PNL) são executadas.

  1. Recuperação: Quando um utilizador submete uma consulta, o sistema começa por procurar numa especializada, normalmente armazenada numa base de dados vetorial. Esta base de dados contém representações numéricasde texto ou dados dados - que permitem uma pesquisa semântica eficiente. O recuperador identifica documentos ou fragmentos de dados que são semanticamente mais semelhantes ao pedido do utilizador.
  2. Aumento: A informação recuperada é depois combinada com a consulta original do utilizador utilizando técnicas de engenharia de prontidão. Este Este pedido "aumentado" fornece ao modelo o contexto factual necessário que lhe faltava inicialmente.
  3. Geração: Por fim, o prompt enriquecido é passado para o LLM. O modelo utiliza o contexto fornecido para gerar uma resposta coerente e factualmente fundamentada. Quadros de referência como o LangChain são frequentemente utilizadas para orquestrar estes passos sem problemas.

Aplicações no Mundo Real

O RAG é essencial nos sectores em que os dados mudam frequentemente ou em que a precisão é crítica.

  • Gestão do conhecimento empresarial: As organizações utilizam o RAG para alimentar chatbots chatbots internos que ajudam os funcionários. Por exemplo, um assistente de pode obter os documentos de política mais recentes a partir de um servidor da empresa para responder a perguntas sobre benefícios. Isto garante que a IA adere a protocolos específicos da empresa e não a conhecimentos genéricos da Internet.
  • Apoio à decisão clínica: No domínio da medicina, a IA nos cuidados de saúde beneficia significativamente das RAG. Um sistema pode recuperar os documentos de investigação médica mais recentes ou os registos do historial de um doente específico para ajudar os médicos no diagnóstico, assegurando que o doente está bem informado. médicos no diagnóstico, garantindo que a modelação preditiva se baseie na ciência mais recente ciência e não na data de fecho do modelo.

RAG em Visão Computacional

Embora tradicionalmente baseados em texto, os conceitos RAG estão a expandir-se para visão computacional (CV). Num modelo multimodal, um sistema pode recuperar imagens semelhantes ou metadados visuais para ajudar na deteção ou classificação de objectos. Por exemplo, a identificação de um espécime biológico raro pode ser melhorada através da recuperação de imagens de referência de uma base de dados científica para para aumentar a análise visual efectuada por modelos como Ultralytics YOLO11.

RAG vs. Afinação

É importante distinguir as OAR do ajustamento fino, uma vez que resolvem problemas diferentes:

  • O RAG liga um modelo a factos dinâmicos e externos. É o melhor para aplicações que requerem informação actualizada informação actualizada e verificabilidade. Não altera os parâmetros internos do modelo.
  • O aperfeiçoamento envolve um treino adicional do o modelo num conjunto de dados específico para ajustar os seus pesos do modelo. Isto é ideal para ensinar a um modelo um estilo específico, tom ou comportamento de tarefa especializado, mas é menos eficaz para manter uma base de conhecimento de factos factos que mudam rapidamente. Muitas vezes, os programadores utilizam a aprendizagem por transferência para combinar ambas as abordagens para um desempenho ótimo.

Exemplo: Aumento de um prompt com dados de deteção

Neste exemplo Python , simulamos um fluxo de trabalho RAG básico, utilizando um modelo de deteção de objectos para "recuperar" factos factos sobre uma imagem. Estes factos aumentam então uma mensagem de texto, baseando a descrição em dados visuais verificados.

from ultralytics import YOLO

# Load the YOLO11 model acting as our 'retrieval' mechanism for visual facts
model = YOLO("yolo11n.pt")

# Run inference to retrieve content information from the image
results = model("https://ultralytics.com/images/bus.jpg")

# Extract detected classes to augment the prompt
detected_objects = [model.names[int(cls)] for cls in results[0].boxes.cls]
context_string = ", ".join(set(detected_objects))

# Construct the augmented prompt (RAG concept)
prompt = f"Based on the verified presence of {context_string} in the scene, describe the traffic situation."
print(f"Augmented Prompt: {prompt}")

Junte-se à comunidade Ultralytics

Junte-se ao futuro da IA. Conecte-se, colabore e cresça com inovadores globais

Junte-se agora