Meta lança o Llama3 afirmando ser um dos melhores modelos de IA já feitos
Depois de muita espera e expectativa a Meta acaba de lançar o Llama3, um modelo de IA de código aberto que a empresa afirma estar entre os melhores já feitos, e com capacidades surpreendentes.
A Meta introduziu uma nova adição à sua gama de modelos de inteligência artificial (IA) generativa de código aberto: o Llama 3, prometendo superar o desempenho dos modelos anteriores e de seus concorrentes no mercado.
Introdução ao Llama 3
O Llama 3 é apresentado em duas versões: uma com 8 bilhões de parâmetros, o Llama 3 8B, e outra mais robusta com 70 bilhões de parâmetros, o Llama 3 70B. Estes modelos foram desenvolvidos para oferecer um desempenho superior, tendo sido treinados em um cluster de 24.000 GPUs personalizadas, colocando-os entre os melhores em termos de IA generativa disponível atualmente.
Comparação entre o Llama3 e outros modelos. Fonte: Meta
Dados de Treinamento e Diversidade Linguística
A eficácia do Llama 3 decorre de um vasto conjunto de dados de treinamento que inclui 15 trilhões de tokens, o que equivale a cerca de 750 bilhões de palavras. A Meta utilizou uma variedade de fontes públicas e dados sintéticos para enriquecer o treinamento, o que não apenas melhora a performance do modelo em inglês mas também em outros idiomas e diferentes tarefas.
Enfrentando Desafios de Segurança e Viés
Para combater as questões de toxicidade e viés, a Meta integrou estratégias rigorosas de filtragem de dados e lançou novas ferramentas de segurança, como o Llama Guard e o CybersecEval, além do Code Shield, que ajuda a identificar potenciais vulnerabilidades de segurança em códigos gerados por IA.
Limitações e Desafios Futuros
Apesar das inovações, o Llama 3 ainda enfrenta desafios, incluindo a geração ocasional de informações imprecisas ou sensíveis, um problema já observado com o Llama 2. A Meta reconhece essas limitações e está comprometida com o aprimoramento contínuo das medidas de segurança e robustez do modelo.
Os modelos Llama 3 estão disponíveis para download, e há planos para hospedá-los em várias plataformas de nuvem, ampliando sua acessibilidade e aplicabilidade. A Meta também está desenvolvendo versões do Llama 3 com mais de 400 bilhões de parâmetros, com foco em capacidades multilíngues e multimodais que prometem melhorar ainda mais a habilidade de raciocínio e codificação.
------------------------------------------------------------------------------------------------------------------------------
🚀 Gostou do conteúdo? Então continue lendo as principais notícias do mercado de IA.
📩 Assine a nossa newsletter e fique por dentro de tudo sobre a Inteligência Artificial.