Meta libera dois modelos de llama 4 ai

A Meta anunciou a LLAMA 4, sua mais nova coleção de modelos de IA que agora alimenta o Assistente de Meta AI na Web e no WhatsApp, Messenger e Instagram. Os dois novos modelos, também disponíveis para download da Meta ou Hugging Face, são Scout 4 Scout-um pequeno modelo capaz de “encaixar em uma única GPU NVIDIA H100”-e LLAMA 4 Maverick, que é mais semelhante ao GPT-4O e Gemini 2.0 Flash. A Meta diz que ainda está no processo de treinamento de Llama 4 Behemoth, que o CEO da Meta, Mark Zuckerberg, diz que é “o modelo básico de maior desempenho do mundo”.

De acordo com a Meta, o LLAMA 4 Scout tem uma janela de contexto de 10 milhões de toques-a memória de trabalho de um modelo de IA-e supera os modelos Gemma 3 e Gemini 2.0 do Google, bem como o Mistral de Faixa Aberta, “em uma ampla gama de benchmarks amplamente relatados”, enquanto “o ajuste em uma única NVidia H100” GPU “. A Meta faz reivindicações semelhantes sobre o desempenho do modelo Maverick maior versus o GPT-4O do OpenAI e o Gemini 2.0 Flash do Google, e diz que seus resultados são comparáveis ??ao Deepseek-V3 nas tarefas de codificação e raciocínio usando “menos da metade dos parâmetros ativos”.

Enquanto isso, o LLAMA 4 Behemoth possui 288 bilhões de parâmetros ativos com 2 trilhões de parâmetros no total. Embora ainda não tenha sido divulgado, a Meta diz que o Behemoth pode superar seus concorrentes (neste caso, o GPT-4.5 e o claude Sonnet 3.7) “em vários benchmarks de haste”.

Para o LLAMA 4, a Meta diz que mudou para uma “mistura de especialistas” (MOE) arquitetura, uma abordagem que conserva recursos usando apenas as partes de um modelo necessário para uma determinada tarefa. A empresa planeja discutir planos futuros para modelos e produtos de IA em sua conferência Llamacon, que ocorre em 29 de abril.

Como em seus modelos anteriores, a Meta chama a coleção LLAMA 4 de “fonte aberta”, embora a lhama tenha sido criticada por suas restrições de licença. Por exemplo, a licença LLAMA 4 requer entidades comerciais com mais de 700 milhões de usuários ativos mensais para solicitar a permissão da Meta antes de usar seus modelos, que a iniciativa de código aberto escreveu em 2023 a retira “fora da categoria de” código aberto “.

As informações são do The Verge, site especializado em tecnologia

Publicação de: Blog do Esmael

Lunes Senes

Colaborador Convidado

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *