Nova Inteligência Artificial da Meta pode replicar vozes.
Em uma postagem de blog a Meta, mãe do Facebook, anunciou o modelo de inteligência artificial generativa chamado Voicebox.
O que é o modelo de IA generativa Voicebox?
É um modelo de inteligência artificial generativa que fala seis idiomas, e que permite que pessoas com deficiência visual ouçam mensagens escritas de amigos em suas vozes. A IA também permite que os usuários falem em idiomas estrangeiros com sua própria voz com uma taxa de erro de 1%, diz a Meta. A tecnologia abriu a possibilidade de os criadores editarem faixas de áudio para vídeo ou criarem vozes com som mais natural para assistentes virtuais. Em um comunicado à imprensa publicado na semana passada, a Meta saudou o modelo como um "avanço na IA generativa para fala".
Como essa inteligência artificial generativa foi treinada?
O modelo de IA generativo foi treinado usando mais de 50.000 horas de áudio não filtrado em inglês, francês, espanhol, alemão, polonês e português. E, segundo a Meta, ele foi projetado para falar da mesma forma como as pessoas falam no mundo real.
Sobre a ideia de abrir o código do modelo usado no Voicebox, a Meta cita os riscos potenciais da tecnologia. “Existem muitos casos de uso animadores para modelos de fala generativa, mas devido aos riscos potenciais de uso indevido, não estamos disponibilizando o modelo ou código do Voicebox publicamente neste momento”, disse a empresa em um post. “Embora acreditemos que é importante sermos abertos com a comunidade de IA e compartilhar nossa pesquisa para avançar o estado da arte em IA, também é necessário encontrar o equilíbrio certo entre abertura e responsabilidade”.O futuro da IA para a Meta.
A Meta tem feito questão de enfatizar seus planos de desenvolvimento de IA. A empresa Big Tech tem falado sobre suas ambições nesse mercado, particularmente em torno da incorporação de IA em seus produtos. E um ponto que vale ressaltar é sua preocupação em fazer com que a inteligência artificial atue para o bem. Por isso o foco em trazer a função que permite que pessoas com deficiência visual ouçam mensagens escritas de amigos em suas vozes.
🚀Gostou do conteúdo? Continue lendo as principais notícias do mercado de IA.
📩Assine a nossa newsletter e fique por dentro de tudo sobre a Inteligência Artificial.(Foto: Meta)