DeepSeek lança modelo raciocínio superior ao ChatGPT o1

Novo modelo chinês promete avanços em raciocínio lógico, matemática e codificação, com custo reduzido em até 95%.

22/01/20253 minutos

Salvar

O laboratório de inteligência artificial chinês DeepSeek revelou seu mais recente modelo de linguagem de raciocínio, o DeepSeek-R1, que demonstrou desempenho superior ao OpenAI o1 em diversos benchmarks, incluindo matemática, codificação e conhecimento geral. Além disso, o modelo se destaca por ser até 95% mais acessível em termos de custo operacional em comparação ao modelo da OpenAI.

O DeepSeek-R1 foi desenvolvido pela startup chinesa DeepSeek, que recentemente ganhou notoriedade com o lançamento do DeepSeek-V3, uma IA de código aberto que superou modelos de empresas como Meta e OpenAI, mas com uma fração do custo.

Detalhes

O DeepSeek-R1 é um modelo de IA projetado para aprimorar a capacidade de raciocínio e solução de problemas complexos. Segundo o relatório técnico da empresa, a tecnologia possui duas versões principais: DeepSeek-R1-Zero e DeepSeek-R1.

A versão R1-Zero é treinada exclusivamente com aprendizado por reforço (RL), sem ajustes supervisionados, enquanto a versão DeepSeek-R1 incorpora uma abordagem de aprendizado em várias etapas, combinando uma fase inicial com dados selecionados e técnicas avançadas de RL para melhorar a capacidade de raciocínio e a legibilidade das respostas.

Desempenho

O DeepSeek-R1 apresentou resultados impressionantes em testes de desempenho, sendo comparável e, em alguns casos, superior ao OpenAI o1. Em matemática, o modelo alcançou 79,8% de acerto no teste AIME 2024, e no benchmark MATH-500, obteve 93% de precisão, superando os modelos rivais.

No campo da codificação, o modelo obteve uma classificação de 96,3% de precisão no benchmark Codeforces, um dos principais testes de habilidades de programação, demonstrando competências de nível especializado na área.

Já em testes de conhecimento geral, como MMLU e GPQA-Diamond, o DeepSeek-R1 alcançou 90,8% e 71,5% de precisão, respectivamente. Em AlpacaEval 2.0, um benchmark que avalia habilidades de redação e resposta a perguntas, o modelo teve uma taxa de acerto de 87,6%, demonstrando excelente desempenho na geração de conteúdo.

Aplicações e perspectivas

Graças à sua capacidade de resolver problemas complexos de raciocínio e matemática, o DeepSeek-R1 pode ser amplamente utilizado em sistemas educacionais avançados e tutoriais inteligentes. O forte desempenho em codificação sugere que a IA pode ser uma ferramenta valiosa para desenvolvimento de software, ajudando na geração e depuração de código.

Além disso, com sua robustez na compreensão de contextos longos e respostas precisas, o modelo se mostra uma alternativa promissora para uso em pesquisa acadêmica, suporte à tomada de decisão e outras aplicações que exigem análise de dados complexos.

Com o DeepSeek-R1, a DeepSeek reforça sua posição como um dos principais players no crescente mercado de IA generativa, desafiando gigantes como OpenAI e Google com soluções de alto desempenho a custos reduzidos.

Fonte: Forbes

------------------------------------------------------------------------------------------------------------------------------

🚀 Gostou do conteúdo? Então continue lendo as principais notícias do mercado de IA.

📩 Assine a nossa newsletter e fique por dentro de tudo sobre a Inteligência Artificial.

Foto: DeepSeek