Xiaomi lança projecto para pessoas com distúrbios da fala

A empresa refere que, através do projecto “Own My Voice” o utilizador pode comunicar utilizando a “sua própria voz”, em vez de uma típica voz electrónica.

A Xiaomi lançou uma aplicação de algoritmos avançados e tecnologia de voz autodesenvolvida para o campo da acessibilidade. A tecnologia Text-To-Speech de estilo espontâneo, que é desenvolvida pelo Xiaomi AI Lab, é utilizada para gerar uma voz única e personalizada para um utilizador com perturbações da fala.

A empresa refere que o utilizador pode comunicar com outros utilizando “a sua própria voz”, em vez de uma típica voz electrónica monótona.

A Xiaomi percebeu o desejo de muitos utilizadores com distúrbios da fala em possuir as suas vozes únicas para a comunicação diária e criou a equipa do projecto “Own My Voice” para convidar um utilizador com distúrbios da fala como o receptor da voz. Zhu Xi, responsável do Comité Tecnológico sobre “Tecnologia para o Bem” da Xiaomi Corporation, sublinhou que “estamos entusiasmados por explorar os múltiplos valores que a inovação tecnológica nos traz, tais como responder às exigências dos utilizadores em relação à sua identidade e à construção da identidade”.

A fim de gerar a voz mais adequada e personalizada para o destinatário, a equipa recrutou mais de 200 voluntários dentro da Xiaomi para doarem as suas vozes. Utilizaram o algoritmo de correspondência de vozes para fazer corresponder as características das vozes doadas pelos voluntários com as da voz do destinatário. Através desta abordagem, encontraram a voz mais adequada como o som básico de referência de voz para o destinatário. Tendo em conta a personalização e protecção da privacidade, a voz real escolhida foi manipulada com modificações acústicas complexas para formar um som de voz novo e original.

De seguida, utilizaram a tecnologia Text-To-Speech de estilo espontâneo para treinar o modelo AI, fazendo com que esta nova voz ganhasse gradualmente um ritmo natural e uma entoação capaz de expressar com verdade a emoção e o tom de um humano.

O projecto “Own My Voice” combina uma variedade de algoritmos com a tecnologia de fala autodesenvolvida da Xiaomi para assegurar a especificidade, segurança e elevada genuinidade da voz sintetizada, criando uma nova ideia de síntese de fala personalizada para utilizadores com perturbações da fala.

A tecnologia Text-To-Speech de estilo espontâneo torna a voz sintetizada como a de um verdadeiro ser humano na sua entoação, pausa, velocidade e outras características. Isto substitui a sensação monótona e antinatural da voz electrónica por uma voz mais natural. Actualmente, esta tecnologia aplica-se a muitos dispositivos inteligentes equipados com Xiaoai, o assistente de voz AI da Xiaomi.