La revelación de que un documentalista usó software de clonación de voz para hacer que el difunto chef Anthony Bourdain dijera palabras que nunca pronunció ha generado críticas en medio de preocupaciones éticas sobre el uso de tecnología poderosa.
La película “Roadrunner: A Film About Anthony Bourdain” apareció en los cines el viernes y en su mayoría presenta imágenes reales del querido chef célebre y presentador de televisión trotamundos antes de morir en 2018. Pero su director, Morgan Neville, le dijo a The New Yorker un El fragmento de diálogo se creó utilizando tecnología de inteligencia artificial.
Eso ha renovado un debate sobre el futuro de la tecnología de clonación de voz, no solo en el mundo del entretenimiento, sino también en la política y en un sector empresarial de rápido crecimiento dedicado a transformar texto en habla humana de sonido realista. .
“La clonación de voz no aprobada es una pendiente resbaladiza”, dijo Andrew Mason, fundador y director ejecutivo de Descript Speech Generator, en una publicación de blog el viernes. “Tan pronto como ingresa a un mundo en el que está haciendo juicios subjetivos sobre si casos específicos pueden ser éticos, no pasará mucho tiempo antes de que todo sea válido”.
Antes de esta semana, la mayor parte de la controversia pública en torno a estas tecnologías se centró en la creación de deepfakes difíciles de detectar utilizando audio y / o video simulados y su potencial para alimentar la desinformación y el conflicto político.
Pero Mason, quien anteriormente fundó y dirigió Groupon, dijo en una entrevista que Descript ha rechazado repetidamente las solicitudes para recuperar una voz, incluso de “personas que han perdido a alguien y están en duelo”.
“Ni siquiera es tanto que queramos emitir un juicio”, dijo. “Solo decimos que debes tener algunas líneas claras sobre lo que está bien y lo que no”.
Las reacciones enojadas e incómodas a la clonación de voz en el caso Bourdain reflejan expectativas y problemas de divulgación y consentimiento, dijo Sam Gregory, director de programas de Witness, una organización sin fines de lucro que trabaja en el uso de tecnología de video para niños. derechos humanos. Habría sido apropiado obtener el consentimiento y divulgar la tecnología en el trabajo, dijo. En cambio, los espectadores se sorprendieron, primero por el hecho de la falsificación de audio, luego por el aparente rechazo del director de cualquier pregunta ética, y expresaron su disgusto en línea.
“También toca nuestros miedos a la muerte y las ideas sobre cómo la gente podría tomar el control de nuestra semejanza digital y hacernos decir o hacer cosas sin ninguna forma de detenerlo”, dijo Gregory.
Neville no ha identificado qué herramienta usó para recrear la voz de Bourdain, pero dijo que la usó para algunas oraciones que Bourdain escribió pero que nunca dijo en voz alta.
“Con la bendición de su patrimonio y agente literario, usamos tecnología de inteligencia artificial”, dijo Neville en una declaración escrita. “Era una técnica de narración moderna que utilicé en lugares donde pensé que era importante dar vida a las palabras de Tony”.
Neville también le dijo a la revista GQ que obtuvo la aprobación de la viuda y albacea literaria de Bourdain. La esposa del chef, Ottavia Busia, respondió con un tweet: “Ciertamente NO fui yo quien dijo que Tony habría estado bien con eso”.
Aunque gigantes tecnológicos como Microsoft, Google y Amazon han dominado la investigación de texto a voz, ahora también hay una serie de nuevas empresas como Descript que ofrecen software de clonación de voz. Los usos van desde chatbots de servicio al cliente parlantes hasta videojuegos y podcasting.
Muchas de estas empresas de clonación de voz muestran de forma destacada una política de ética en su sitio web que explica los términos de uso. De casi una docena de firmas contactadas por The Associated Press, muchas dijeron que no recrearon la voz de Bourdain y que no lo harían si se les preguntara. Otros no respondieron.
“Tenemos políticas bastante sólidas sobre lo que se puede hacer en nuestra plataforma”, dijo Zohaib Ahmed, fundador y director ejecutivo de Resemble AI, una empresa de Toronto que vende un servicio de generador de voz AI personalizado. “Cuando creas un clon de voz, se requiere el consentimiento de quien sea la voz”.
Ahmed dijo que las raras ocasiones en las que permitió la clonación póstuma de voces fueron para investigación académica, incluido un proyecto que trabaja con la voz de Winston Churchill, quien murió en 1965.
Ahmed dijo que un uso comercial más común es editar un comercial de televisión grabado por actores de voz reales y luego personalizarlo para una región agregando una referencia local. También se usa para doblar películas de anime y otros videos, al tomar una voz en un idioma y hacer que hable un idioma diferente, dijo.
Lo comparó con innovaciones pasadas en la industria del entretenimiento, desde acróbatas hasta tecnología de pantalla verde.
Solo unos segundos o minutos de voz humana grabada pueden ayudar a enseñar a un sistema de inteligencia artificial a generar su propia voz sintética, aunque lograr que capture la claridad y el ritmo de la voz de Anthony Bourdain probablemente requirió mucho más entrenamiento, dijo Rupal Patel. , profesor de la Northeastern University. que dirige otra empresa generadora de voz, VocaliD, que se centra en chatbots de servicio al cliente.
“Si quisieras que hablara realmente como él, necesitarías mucho, tal vez 90 minutos de datos buenos y limpios”, dijo. “Está construyendo un algoritmo que aprende a hablar como Bourdain”.
Neville es un documentalista aclamado que también dirigió el retrato de Fred Rogers “Won’t You Be My Neighbor?” y la ganadora del Oscar “20 Feet From Stardom”. Comenzó a hacer su última película en 2019, más de un año después de la muerte por suicidio de Bourdain en junio de 2018.
Esta nota es parte de la red de Wepolis y fué publicada por Oliver Roberts el 2021-07-20 00:36:37 en:
Link a la nota original
Palabras clave:
#Por #clonación #voz #Anthony #Bourdain #asusta #gente