OpenAI se aproxima do lançamento de IA visual no ChatGPT
Novo recurso no Advanced Voice Mode promete chamadas de vídeo com IA, ampliando as possibilidades de interação e acessibilidade.
A OpenAI parece estar se preparando para lançar o tão aguardado recurso de inteligência visual no Advanced Voice Mode do ChatGPT. Apelidada de “Live Camera,” conforme indícios encontrados na versão beta v1.2024.317 do aplicativo, a funcionalidade trará a capacidade de realizar chamadas de vídeo com IA, elevando a experiência de interação para um novo patamar.
Expectativas
Demonstrada inicialmente em maio de 2024, durante o lançamento do GPT-4o, a tecnologia surpreendeu ao exibir uma interação avançada com objetos capturados por câmeras ao vivo. Em um dos exemplos apresentados, o sistema identificou um cachorro, lembrou seu nome e associou a interação com um brinquedo, simulando o ato de buscar e trazer. Apesar da recepção positiva, a OpenAI pouco comentou sobre o progresso da funcionalidade desde seu anúncio em versão Alpha.
Agora, a inclusão de códigos relacionados ao “Live Camera” na versão beta do aplicativo é um forte indicativo de que o recurso está próximo de se tornar realidade. Embora a OpenAI ainda não tenha confirmado o nome oficial ou uma data de lançamento, especula-se que a funcionalidade será disponibilizada inicialmente para assinantes do ChatGPT Plus, antes de um lançamento mais amplo.
Inovação
A introdução da “Live Camera” no Advanced Voice Mode representa uma evolução natural no uso de assistentes de inteligência artificial, permitindo que a IA analise objetos, ambientes ou documentos em tempo real. Com essa funcionalidade, o ChatGPT poderá expandir suas aplicações para além do formato tradicional de chatbot, oferecendo suporte mais interativo e imersivo.
O recurso também tem potencial de revolucionar a acessibilidade. Usuários com deficiência visual poderão contar com a IA para descrever objetos e ambientes, oferecendo maior autonomia no cotidiano. Além disso, o recurso se posiciona como um forte concorrente de tecnologias como o Google Lens, ampliando o papel da OpenAI no mercado de inteligência visual.
Impacto
Apesar da ausência de uma confirmação oficial sobre o cronograma de lançamento, os avanços recentes indicam que a “Live Camera” está em estágios finais de desenvolvimento. Caso lançada em breve, a funcionalidade tem o potencial de transformar a forma como interagimos com a inteligência artificial no dia a dia, marcando mais um passo significativo na evolução dos assistentes de IA.
Fonte: Android Authority
------------------------------------------------------------------------------------------------------------------------------
🚀 Gostou do conteúdo? Então continue lendo as principais notícias do mercado de IA.
📩 Assine a nossa newsletter e fique por dentro de tudo sobre a Inteligência Artificial.
Foto: OpenAI