OpenAI anuncia modo de voz para ChatGPT

O novo recurso de áudio hiper-realista traz para a plataforma de inteligência artificial uma nova abordagem de uso com diversas aplicações.

31/07/20242 minutos
Salvar
openai-anuncia-modo-de-voz-para-chatgpt

A OpenAI anunciou a introdução do ChatGPT Advanced Voice Mode, um recurso inovador disponível inicialmente para um grupo seleto de assinantes do ChatGPT Plus. Este novo modo, baseado no modelo GPT-4o, promete oferecer respostas de áudio hiper-realistas com menor latência, integrando processos de voz para texto e texto para voz em um único sistema.



Em maio, a OpenAI apresentou um protótipo de voz chamado "Sky", que lembrava a voz da atriz Scarlett Johansson. No entanto, a amostra foi retirada após preocupações legais levantadas pela própria atriz. A expectativa é que o Advanced Voice Mode seja disponibilizado para todos os usuários do ChatGPT Plus até o outono de 2024.



Detalhes



O grande diferencial da nova função é a sua capacidade de processar nuances emocionais na fala, sem a necessidade de modelos distintos para diferentes tarefas. Entretanto, a empresa está implementando este recurso de forma cuidadosa, monitorando de perto seu uso. Dessa forma, foram desenvolvidas quatro vozes predefinidas em colaboração com dubladores profissionais, garantindo que as vozes não imitem indivíduos específicos ou figuras públicas, evitando controvérsias relacionadas a deepfake e desafios legais comuns na indústria de inteligência artificial.



Além das inovações técnicas, a OpenAI também introduziu novas proteções, como filtros para impedir a geração de conteúdo de áudio protegido por direitos autorais. Essas medidas respondem aos crescentes exames e às ações legais enfrentadas pelo campo da IA, especialmente de entidades como gravadoras. Tendo isso em vista, um relatório de segurança abrangente sobre esses novos recursos está sendo desenvolvido com o intuito de ser lançado no início de agosto.



Futuro



A inteligência artificial está evoluindo de uma ferramenta para envio de mensagens e solicitações para uma inteligência colaborativa, em que recursos como o Advanced Voice Mode ,que entendem e respondem a emoções em conversas em tempo real, tem grandes potenciais de uso, desde o atendimento ao cliente até o suporte à saúde mental, transformando a maneira como se interage com a tecnologia de IA.


Fonte: X (@OpenAI)



------------------------------------------------------------------------------------------------------------------------------



🚀 Gostou do conteúdo? Então continue lendo as principais notícias do mercado de IA.


📩 Assine a nossa newsletter e fique por dentro de tudo sobre a Inteligência Artificial.


Foto: The Verge (reprodução)

Salvar

Inscreva-se em nossa newsletter!

Receba semanalmente, atualizações, ferramentas, tutoriais e prompts em seu e-mail.