OpenAI anuncia novo modelo de raciocínio o3
Nova família de modelos se aproxima da inteligência artificial geral (AGI) em benchmarks, mas ainda enfrenta desafios.
No último dia de sua série de lançamentos “12 Days of Ship-mas,” a OpenAI revelou o o3, a mais recente geração de seus modelos de raciocínio. O o3 é um sucessor do modelo o1, lançado a alguns meses, e chega com grandes promessas de desempenho em áreas como matemática, ciência e programação. Além do modelo principal, a OpenAI anunciou o o3-mini, uma versão reduzida e otimizada para tarefas específicas. Ambos ainda estão em fase de pré-visualização e terão seu lançamento gradual iniciado no fim de janeiro de 2025.
Novidades
O o3 foi projetado para realizar verificações internas durante o processamento, reduzindo erros comuns em IA. Isso o torna ideal para problemas complexos, mas também o deixa mais lento, com respostas que podem levar de segundos a minutos para serem geradas.
Uma novidade é a possibilidade de ajustar o tempo de raciocínio, com configurações de baixo, médio e alto consumo computacional. Quanto maior o tempo dedicado ao raciocínio, mais preciso o modelo tende a ser.
No entanto, o o3 não é infalível. Apesar de suas melhorias em benchmarks como o SWE-Bench Verified, onde superou o o1 em 22,8 pontos percentuais, e sua pontuação quase perfeita (96,7%) no American Invitational Mathematics Exam, o modelo ainda pode cometer erros básicos, como foi observado em seu antecessor o1.
Inteligência Artificial Geral
O lançamento do o3 reacendeu o debate sobre a inteligência artificial geral (AGI). A OpenAI afirma que, sob certas condições, o o3 se aproxima da AGI, definida pela empresa como sistemas altamente autônomos que superam humanos em grande parte das tarefas economicamente valiosas.
No benchmark ARC-AGI, projetado para medir a capacidade de um modelo em adquirir novas habilidades fora de seu treinamento, o o3 alcançou 87,5% no modo de alto desempenho, triplicando o resultado do o1 no modo de baixo desempenho. Apesar disso, especialistas apontam que o modelo ainda falha em tarefas simples para humanos, sugerindo que está distante de igualar a inteligência humana em termos práticos.
Concorrência
A chegada do o3 ocorre em meio a uma explosão de modelos de raciocínio por rivais como Google, DeepSeek e Alibaba. Com o fim do progresso significativo por meio de técnicas de “força bruta” para escalar modelos, a indústria busca abordagens inovadoras como a do o3 para refinar a IA generativa.
Fonte: TechCrunch
------------------------------------------------------------------------------------------------------------------------------
🚀 Gostou do conteúdo? Então continue lendo as principais notícias do mercado de IA.
📩 Assine a nossa newsletter e fique por dentro de tudo sobre a Inteligência Artificial.
Foto: OpenAI