A OpenAI, empresa do ChatGPT, revelou testes preliminares de uma nova tecnologia chamada de Voice Engine. Esta nova ferramente de inteligência artificial (IA), capaz de converter texto em áudio imitando vozes humanas com precisão, necessita apenas de uma amostra de 15 segundos da fala de uma pessoa para replicar sua voz com fidelidade. Ainda em fase de testes com um grupo restrito de desenvolvedores, a tecnologia já desperta tanto admiração quanto preocupações éticas relacionadas à criação de deepfakes.
Como funciona o Voice Engine
Diferente de outras tecnologias de áudio da OpenAI, o Voice Engine pode gerar falas que ecoam a cadência e entonações específicas de um ser humano ao falar. A demonstração da ferramenta a jornalistas revelou um áudio do CEO da OpenAI, Sam Altman, explicando a tecnologia em uma voz praticamente indistinguível da sua, evidenciando o avanço e a qualidade técnica da inovação.
Aplicações e benefícios
Além da capacidade de criar vozes para conteúdo educacional e entretenimento, a ferramenta tem potencial para aplicações benéficas na saúde. Por exemplo, o Norman Prince Neurosciences Institute, vinculado ao sistema de saúde sem fins lucrativos Lifespan, utilizou a tecnologia para restaurar a voz de uma jovem paciente afetada por um tumor cerebral, demonstrando o impacto positivo que a Voice Engine pode ter na recuperação de pacientes. No caso da jovem, foi utilizado uma gravação que ele fez em um projeto escolar, disse a empresa.
Desafios e precauções
Apesar das promissoras aplicações, a OpenAI expressou cautela em relação aos riscos associados à capacidade de imitar vozes com precisão, especialmente considerando o contexto de eleições nos EUA e no Brasil. A empresa planejava inicialmente expandir o acesso à ferramenta, mas decidiu adiar o lançamento em função de preocupações com deepfakes e sua potencial utilização para fins maliciosos.
Prevenção e educação
Como medidas preventivas, a OpenAI exige que os desenvolvedores obtenham consentimento dos donos das vozes antes de utilizá-las e informem aos ouvintes que as vozes são geradas por IA. A empresa também propõe a implementação de marcas d’água de áudio inaudíveis para ajudar na identificação de conteúdos gerados pela ferramenta.
Reflexões e próximos passos
A OpenAI busca contribuições de especialistas globais antes de decidir sobre o lançamento amplo do Voice Engine, enfatizando a importância da consciência pública sobre os desafios e riscos das tecnologias de IA avançadas. A empresa também incentiva a adoção de medidas para reforçar a resiliência social e a segurança digital frente aos avanços em inteligência artificial.