El habla sintética puede ser un elemento temible en estos días cuando se combina con falsificaciones profundas y otros trucos de IA, pero también es una herramienta indispensable para cualquiera que ya no pueda hablar por sí mismo. Acapela Group tiene en mente a estas personas con su nuevo servicio “mi propia voz”, que permite a cualquier persona entrenar un perfil de voz de IA de forma gratuita.
Acapela ha estado en el espacio de texto a voz durante aproximadamente 25 años y fue adquirida recientemente por el gigante tecnológico de accesibilidad Tobii Dynavox, aunque todavía operan de forma independiente.
Al igual que muchas industrias, la accesibilidad se ha visto fuertemente influenciada por la llegada de los procesos de aprendizaje automático a escala del consumidor. Hace siete u ocho años, recuerda el cofundador de Acapela, Remy Cadic, no solo era tedioso personalizar una voz sintética para uno mismo, sino que los resultados no eran particularmente buenos.
“Tomó mucho tiempo: el paciente tuvo que entrenar durante 8 horas. Ahora podemos depositar una voz con solo 50 frases grabadas; tarda unos 10 minutos y la voz está lista al día siguiente”, dijo. “Definitivamente se está produciendo una revolución con las técnicas neuronales de texto a voz”.
Tener un generador de voz que usa tu propia voz es ciertamente algo que un número creciente de personas puede apreciar: elegir de una lista es un poco deshumanizante. Muchos tienen voces que preferirían usar, pero no fue hasta hace poco que fue una opción.
No bromeaban sobre lo rápido y fácil que es: pasé por el nuevo proceso de “mi propia voz”, y en realidad eran solo 50 oraciones cortas, seleccionadas de un corpus (al azar, al parecer) de novelas, libros de cocina y artículos. . La interfaz de grabación era simple y fácil de navegar y, efectivamente, un día después mi voz estaba lista para funcionar. La calidad es buena, no extraña como pueden ser algunos modelos, pero claramente mi propia voz (como se anuncia) y capaz de manejar cualquier oración que le lancé en la página de demostración.
Ahora que está ahí, si alguna vez lo necesito, puedo ir y descargarlo por una tarifa para usarlo en cualquier sistema de generación de voz compatible. Esto obviamente incluye dispositivos Tobii Dynavox y TD Talk; la compañía acaba de lanzar uno nuevo la semana pasada, de hecho, estas cosas se están poniendo bastante elegantes.
Delaina prueba el nuevo dispositivo Tobii Dynavox. Créditos de imagen: Grupo Acapela
Y ese es el punto real de todo esto: no es una demostración técnica del poder de la tecnología de voz neuronal o una demostración que permite a cualquiera alimentarla con la voz de una celebridad para clonar. Es una herramienta hecha específicamente para personas que hasta hace poco no tenían opciones o, en el mejor de los casos, un proceso difícil y complejo si querían preservar su voz.
Muchos que enfrentan condiciones degenerativas, cáncer o ciertos procedimientos saben que dentro de unos meses o años es posible que no puedan hablar bien o que ya no puedan hablar. Hacer que el proceso de almacenar su voz sea lo más fácil posible es un servicio que muchos apreciarán.
“Una gran ventaja es que también personalizamos para niños: hemos hecho que el guión de grabación sea más fácil de leer y hemos ajustado el sistema para mejorar la calidad de las voces sintéticas de los niños. Fuimos los primeros en el mundo en hacer eso, y todavía vamos en esa dirección”, dijo Cadic.
Ser capaz de grabar y volver a grabar artificialmente o envejecer la voz almacenada es una nueva capacidad desafiante, pero que parece estar dando sus frutos:
La compatibilidad con dispositivos fuera de línea que no tienen el último chip de procesamiento neuronal también es un diferenciador clave. “Hay soluciones en línea donde es fácil crear una voz, pero solo está disponible a través de la nube y eso no es práctico”, dijo.
Por cierto, si bien las 50 oraciones son geniales para las personas que todavía pueden leer y hablar, también puedes entrenar una voz con grabaciones de voz de personas que ya han perdido esa habilidad; simplemente no es tan simple.
La empresa también descubrió que la diversidad y la consideración en el proceso de capacitación son tan importantes como en otras aplicaciones de IA. Cadic señaló que un problema con algunas técnicas de capacitación súper rápidas es que “prácticamente solo intentará encontrar al orador en el material de capacitación más cercano al usuario. Pero si no hay un orador en el entrenamiento que se acerque a la voz original, simplemente no sonará como tal”.
El gerente de producto de Acapela, Nicolas Mazars, agregó que, al igual que muchos problemas de IA que se derivan de datos de capacitación insuficientes, este no se distribuye de manera uniforme: “Ese proceso funciona bien para el hombre blanco promedio de 50 años, pero no si eres un hombre afroamericano. , o no habla bien inglés. Trabajamos en 23 idiomas y tenemos muchos usuarios con discapacidad. Intentamos confiar en los comentarios de los usuarios y desarrollar algo para ellos, por ellos”.
El proceso de registro y banca es gratuito; puede registrarse para obtener una cuenta aquí y entrenar su propia voz sintética en minutos. Solo pagas si quieres descargarlo e instalarlo en un dispositivo.
Esta nota es parte de la red de Wepolis y fué publicada por el 2023-05-09 04:06:25 en:
Link a la nota original
Palabras clave:
#Acapela #permite #cualquiera #haga #una #copia #seguridad #propia #voz #forma #gratuita #minutos #por #acaso #Latino #News
