Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
IA de visão

A conhecer o Llama 3.1: A mais recente família de modelos open-source da Meta

Explora a nova família de modelos open-source Llama 3.1 da Meta, que inclui o versátil 8B, o polivalente 70B e o emblemático 405B, o seu modelo mais completo e avançado até à data.

MOMostafa Ibrahim
5 min read
Família de modelos open-source Llama 3.1 da Meta

Em 23 de julho de 2024, a Meta lançou a nova família de modelos open-source Llama 3.1, apresentando os versáteis modelos de 8B, os capazes de 70B e o Llama 3.1 405B, sendo este último o maior large language model (LLM) open-source até o momento.

Você deve estar se perguntando o que diferencia esses novos modelos de seus antecessores. Bem, ao mergulharmos neste artigo, você descobrirá que o lançamento dos modelos Llama 3.1 marca um marco significativo na tecnologia de IA. Os modelos recém-lançados oferecem melhorias importantes no processamento de linguagem natural; além disso, introduzem novos recursos e aprimoramentos não encontrados em versões anteriores. Este lançamento promete mudar a forma como aproveitamos a IA para tarefas complexas, fornecendo um conjunto de ferramentas poderoso para pesquisadores e desenvolvedores.

Neste artigo, exploraremos a família de modelos Llama 3.1, aprofundando-nos em sua arquitetura, principais melhorias, usos práticos e uma comparação detalhada de seu desempenho.

Link to this sectionO que é a Llama 3.1?#

O mais recente Large Language Model da Meta, a Llama 3.1, está fazendo progressos significativos no cenário de IA, rivalizando com as capacidades de modelos de ponta como o OpenAI's Chat GPT-4o e o Claude 3.5 Sonnet da Anthropic.

Embora possa ser considerada uma atualização menor em relação ao modelo anterior Llama 3, a Meta deu mais um passo à frente ao introduzir algumas melhorias fundamentais na nova família de modelos, oferecendo:

  • Suporte a oito idiomas: Incluindo inglês, alemão, francês, italiano, português, hindi, espanhol e tailandês, expandindo seu alcance para um público global.
  • 128.000 tokens de janela de contexto: Permitindo que os modelos lidem com entradas muito mais longas e mantenham o contexto em conversas ou documentos extensos.
  • Melhores capacidades de raciocínio: Permitindo que os modelos sejam mais versáteis e capazes de gerenciar tarefas complexas de forma eficaz.
  • Segurança rigorosa: Testes foram implementados para mitigar riscos, reduzir preconceitos e evitar resultados prejudiciais, promovendo o uso responsável da IA.

Além de tudo o que foi mencionado, a nova família de modelos Llama 3.1 destaca um grande avanço com seu impressionante modelo de 405 bilhões de parâmetros. Essa contagem substancial de parâmetros representa um salto significativo no desenvolvimento de IA, aprimorando muito a capacidade do modelo de entender e gerar textos complexos. O modelo 405B inclui uma vasta gama de parâmetros, com cada parâmetro referindo-se aos weights e biases na rede neural que o modelo aprende durante o treinamento. Isso permite que o modelo capture padrões de linguagem mais intrincados, estabelecendo um novo padrão para large language models e mostrando o potencial futuro da tecnologia de IA. Este modelo de grande escala não apenas melhora o desempenho em uma ampla gama de tarefas, mas também expande os limites do que a IA pode alcançar em termos de geração e compreensão de texto.

Link to this sectionArquitetura do modelo#

A Llama 3.1 utiliza a arquitetura de modelo transformer apenas com decodificador, uma pedra angular dos large language models modernos. Essa arquitetura é renomada por sua eficiência e eficácia no tratamento de tarefas linguísticas complexas. O uso de transformers permite que a Llama 3.1 se destaque na compreensão e na geração de textos semelhantes aos humanos, proporcionando uma vantagem significativa sobre modelos que usam arquiteturas mais antigas, como LSTMs e GRUs.

Além disso, a família de modelos Llama 3.1 usa um transformer denso padrão em vez da arquitetura Mixture of Experts (MoE), uma escolha deliberada que melhora a eficiência e a estabilidade do treinamento. Evitar a arquitetura MoE garante um processo de treinamento mais consistente e confiável, já que a MoE pode, às vezes, introduzir complexidades que podem impactar a estabilidade e o desempenho do modelo.

Um diagrama ilustrando a arquitetura do modelo Transformer Llama 3.1

Fig 1. Um diagrama ilustrando a arquitetura do modelo transformer da Llama 3.1.

A arquitetura do modelo Llama 3.1 funciona da seguinte forma:

1. Input Text Tokens: O processo começa com a entrada, consistindo em tokens de texto. Esses tokens são unidades individuais de texto, como palavras ou subpalavras, que o modelo processará.

2. Token Embeddings: Os tokens de texto são então convertidos em token embeddings. Embeddings são representações vetoriais densas dos tokens que capturam seu significado semântico e relacionamentos dentro do texto. Essa transformação é crucial, pois permite que o modelo trabalhe com dados numéricos.

3. Self-Attention Mechanism: O self-attention permite que o modelo pondere a importância de diferentes tokens na sequência de entrada ao codificar cada token. Esse mecanismo ajuda o modelo a entender o contexto e os relacionamentos entre os tokens, independentemente de suas posições na sequência. No mecanismo de self-attention, cada token na sequência de entrada é representado como um vetor de números. Esses vetores são usados para criar três tipos diferentes de representações: queries, keys e values.

O modelo calcula quanta atenção cada token deve dar a outros tokens comparando os vetores de query com os vetores de key. Essa comparação resulta em pontuações que indicam a relevância de cada token em relação aos outros.

4. Feedforward Network: Após o processo de self-attention, os dados passam por uma feedforward network. Esta rede é uma rede neural totalmente conectada que aplica transformações não lineares aos dados, ajudando o modelo a reconhecer e aprender padrões complexos.

5. Repeated Layers: As camadas de self-attention e feedforward network são empilhadas várias vezes. Essa aplicação repetida permite que o modelo capture dependências e padrões mais complexos nos dados.

6. Output Text Token: Finalmente, os dados processados são usados para gerar o output text token. Este token é a previsão do modelo para a próxima palavra ou subpalavra na sequência, com base no contexto de entrada.

Link to this sectionDesempenho da família de modelos Llama 3.1 e comparações com outros modelos#

Testes de benchmark revelam que a Llama 3.1 não apenas se mantém competitiva frente a esses modelos de ponta, mas também os supera em certas tarefas, demonstrando seu desempenho superior.

Link to this sectionLlama 3.1 405B: Alta capacidade#

O modelo Llama 3.1 passou por uma avaliação extensiva em mais de 150 datasets de benchmark, onde foi rigorosamente comparado a outros leading large language models. O modelo Llama 3.1 405B, reconhecido como o mais capaz na série recém-lançada, foi testado em comparação com gigantes da indústria como o GPT-4 da OpenAI e o Claude 3.5 Sonnet. Resultados dessas comparações revelam que a Llama 3.1 demonstra uma vantagem competitiva, mostrando seu desempenho e capacidades superiores em várias tarefas.

Uma tabela comparando o desempenho do modelo Llama 3.1 405B com modelos semelhantes

Fig 2. Uma tabela comparando o desempenho do modelo Llama 3.1 405B com modelos semelhantes.

A impressionante contagem de parâmetros e a arquitetura avançada deste modelo permitem que ele se destaque na compreensão complexa e na geração de texto, superando frequentemente seus concorrentes em benchmarks específicos. Essas avaliações destacam o potencial da Llama 3.1 para estabelecer novos padrões no campo dos large language models, fornecendo a pesquisadores e desenvolvedores uma ferramenta poderosa para diversas aplicações.

Link to this sectionLlama 3.1 70B: Médio porte#

Os modelos Llama menores e mais leves também demonstram um desempenho notável quando comparados aos seus equivalentes. O modelo Llama 3.1 70B foi avaliado frente a modelos maiores, como o Mistral 8x22B e o GPT-3.5 Turbo. Por exemplo, o modelo Llama 3.1 70B demonstra consistentemente um desempenho superior em datasets de raciocínio, como o dataset ARC Challenge, e em datasets de codificação, como os datasets HumanEval. Esses resultados destacam a versatilidade e a robustez da série Llama 3.1 em diferentes tamanhos de modelo, tornando-a uma ferramenta valiosa para uma ampla gama de aplicações.

Link to this sectionLlama 3.1 8B: Leve#

Além disso, o modelo Llama 3.1 8B foi submetido a benchmark contra modelos de tamanho semelhante, incluindo o Gemma 2 9B e o Mistral 7B. Essas comparações revelam que o modelo Llama 3.1 8B supera seus concorrentes em vários datasets de benchmark em diferentes gêneros, como o dataset GPQA para raciocínio e o MBPP EvalPlus para codificação, demonstrando sua eficiência e capacidade, apesar da contagem menor de parâmetros.

Uma tabela comparando o desempenho dos modelos Llama 3.1 70B e 8B com modelos semelhantes

Fig 3. Uma tabela comparando os desempenhos dos modelos Llama 3.1 70B e 8B com modelos semelhantes.

Link to this sectionComo você pode se beneficiar da família de modelos Llama 3.1?#

A Meta permitiu que os novos modelos sejam aplicados de várias maneiras práticas e benéficas para os usuários:

Link to this sectionFine-tuning#

Os usuários agora podem fine-tune os mais recentes modelos Llama 3.1 para casos de uso específicos. Esse processo envolve o treinamento do modelo em novos dados externos aos quais ele não havia sido exposto anteriormente, aumentando assim seu desempenho e adaptabilidade para aplicações direcionadas. O fine-tuning confere ao modelo uma vantagem significativa ao permitir que ele compreenda e gere melhor conteúdo relevante para domínios ou tarefas específicos.

Link to this sectionIntegração em um sistema RAG#

Os modelos Llama 3.1 agora podem ser integrados perfeitamente em sistemas Retrieval-Augmented Generation (RAG). Essa integração permite que o modelo aproveite fontes de dados externas dinamicamente, aumentando sua capacidade de fornecer respostas precisas e contextualmente relevantes. Ao recuperar informações de grandes datasets e incorporá-las ao processo de geração, a Llama 3.1 melhora significativamente seu desempenho em tarefas de conhecimento intensivo, oferecendo aos usuários resultados mais precisos e informados.

Link to this sectionGeração de dados sintéticos#

Você também pode utilizar o modelo de 405 bilhões de parâmetros para gerar dados sintéticos de alta qualidade, aumentando o desempenho de modelos especializados para casos de uso específicos. Essa abordagem aproveita as amplas capacidades da Llama 3.1 para produzir dados direcionados e relevantes, melhorando assim a precisão e a eficiência de aplicações de IA personalizadas.

Link to this sectionAs conclusões#

O lançamento da Llama 3.1 representa um salto significativo no campo dos large language models, demonstrando o compromisso da Meta com o avanço da tecnologia de IA.

Com sua contagem substancial de parâmetros, treinamento extensivo em datasets diversos e foco em processos de treinamento robustos e estáveis, a Llama 3.1 estabelece novos benchmarks de desempenho e capacidade no processamento de linguagem natural. Seja na geração de texto, sumarização ou tarefas conversacionais complexas, a Llama 3.1 demonstra uma vantagem competitiva sobre outros modelos líderes. Este modelo não apenas expande os limites do que a IA pode alcançar hoje, mas também prepara o terreno para inovações futuras no cenário em constante evolução da inteligência artificial.

Na Ultralytics, dedicamo-nos a expandir os limites da tecnologia de IA. Para explorar nossas soluções de IA de ponta e acompanhar nossas mais recentes inovações, confira nosso repositório GitHub. Junte-se à nossa comunidade vibrante no Discord e veja como estamos revolucionando setores como carros autônomos e manufatura! 🚀

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.
Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.
Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.
Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.
Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.
Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.
Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.
Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática