Pesquisar
Close this search box.

OpenAI divulga IA para clonagem de voz em múltiplos idiomas

OpenAI divulga IA para clonagem de voz em múltiplos idiomas voice engine
(Foto: Levart_Photographer/Unsplash).

A OpenAI divulgou detalhes de uma nova ferramenta denominada Voice Engine, capaz de recriações e clonagem de vozes humanas realistas em vários idiomas. Esta tecnologia inovadora usa uma amostra de áudio de apenas 15 segundos para gerar clones de voz autênticos. Inicialmente desenvolvido desde 2022, o sistema foi testado com um grupo limitado de empresas e ainda não tem data definida para disponibilidade geral.

A funcionalidade principal do Voice Engine é sua habilidade de produzir “vozes emotivas e realistas” com base em uma pequena gravação do áudio original. Segundo a OpenAI, é possível replicar a voz de uma pessoa em idiomas como inglês, espanhol, mandarim, alemão, francês, japonês e português. Isso permite, por exemplo, que um falante nativo de português recrie sua própria voz ou a de terceiros em outros idiomas, mantendo a semelhança com a voz original.

No entanto, a OpenAI também aponta para os riscos associados à produção de áudios realistas através de IA. A empresa expressa preocupação especialmente por conta do potencial de uso indevido durante períodos eleitorais e para burlar sistemas de autenticação por voz. Como medida preventiva, a OpenAI sugere a eliminação progressiva da autenticação baseada em voz e a implementação de políticas de proteção e tecnologia de rastreamento para conteúdo audiovisual gerado por IA.

Atualmente, a OpenAI tem envolvido parceiros dos EUA e de outros países em discussões sobre a melhor maneira de integrar feedbacks na evolução da ferramenta. A empresa tem compartilhado demonstrações do modelo com cerca de 10 desenvolvedores, optando por uma abordagem cautelosa quanto ao lançamento mais amplo após receber feedbacks de várias partes interessadas.

Entre as aplicações práticas já observadas, o Instituto de Neurociências Norman Prince, afiliado à ONG Lifespan, utilizou o Voice Engine para auxiliar pacientes que perderam a capacidade de falar claramente. Em um caso destacado, a tecnologia restaurou a voz de uma jovem paciente a partir de uma gravação feita antes de ela ser afetada por um tumor cerebral.

Além disso, empresas como o Spotify exploram o uso da ferramenta para traduzir conteúdos de áudio, como podcasts, para diferentes idiomas. Isso demonstra a versatilidade do modelo de IA da OpenAI, que não apenas recria vozes humanas realistas, mas também oferece potencial para aplicações em diversos campos, como entretenimento, educação e saúde.

Enquanto a OpenAI continua a desenvolver e refinar o Voice Engine, a ênfase está na colaboração com parceiros e especialistas para assegurar que a tecnologia seja lançada de maneira responsável, atendendo às necessidades de segurança e ética.

Receba as últimas notícias do Economic News Brasil no seu WhatsApp e esteja sempre atualizado! Basta acessar o nosso canal: CLIQUE AQUI!

conteúdo patrocinado

MAIS LIDAS

conteúdo patrocinado
conteúdo patrocinado