Proyecto Euphonia de Google: qué es y cómo puede ayudar a las personas con habla atípica

Tabla de contenido:

Anonim

La mayoría de la gente asocia la Ley de Estadounidenses con Discapacidades con alteraciones físicas y de infraestructura que deben realizarse en edificios u otros lugares, pero a medida que se amplía la definición de discapacidad, la gente se está dando cuenta de que "accesible" también se aplica a cosas como sitios web y reconocimiento de voz.

En este caso, el gigante tecnológico Google está haciendo el esfuerzo de mejorar su software de reconocimiento de voz con Project Euphonia. Project Euphonia es una iniciativa para grabar muestras de voz de voluntarios y analizarlas para que las personas con ELA, trastornos neurológicos y otras dificultades del habla puedan utilizar sus dispositivos inteligentes con la facilidad de un individuo "típico".

Por qué me ofrecí como voluntario

Una cuerda vocal izquierda paralizada y una lengua asimétrica debido a un tumor cerebral han resultado en mi trastorno del habla Disartria. Mi dificultad para hablar y mi voz débil dificultan que mis amigos y familiares me entiendan o me escuchen, especialmente en un espacio lleno de gente. Esto me convirtió en un candidato principal para el Proyecto Euphonia, así que me ofrecí como voluntario tan pronto como leí sobre él. Al grabar muestras en un sitio web rudimentario, reiteré 4.500 frases de "¿Cómo llego a Mountain View, California?" A "Reproducir canciones de Cardi B".

Además de cumplir con los criterios del Proyecto Euphonia, me ofrecí como voluntario porque conocí por primera vez el principal programa de reconocimiento de voz Dragon Naturally Speaking en 1997, y fracasó espectacularmente. A lo largo de los años, probé programas análogos en el Laboratorio de Tecnología de Asistencia del Hospital Infantil de Boston, así como versiones actualizadas de Continuar, y aunque este software ha hecho grandes avances, todavía le cuesta identificar mi voz.

Esto es problemático por dos razones: soy un escritor con falta de motricidad fina, así que escribo con una mano o lentamente con dos si estoy cansado. Con tres libros de poemas autoeditados, una memoria y una colección de historias inéditas vinculadas a mi nombre, me estremezco al pensar cuánto más podría haber producido si escribir no fuera una tarea tan ardua físicamente.

La otra razón por la que el reconocimiento de voz por debajo del promedio crea una barrera para mí es por la proliferación de productos habilitados para voz en los hogares y en los teléfonos. Con solo usar mi historia, si pudiera acceder a computadoras y dispositivos inteligentes de la forma en que deben usarse, me daría más tiempo libre, me permitiría realizar tareas por completo y, potencialmente, transformar la forma en que vivo.

Proyecto Euphonia: ¿Cómo funciona?

Entonces, ¿cómo actúa Euphonia? Después de descargar una aplicación prototipo con un modelo de reconocimiento de voz personalizado en mi teléfono, coloqué el teléfono al lado de mi computadora portátil y le dicté; mientras hacía esto, vi todo lo que dije aparecer en mi documento de Google en mi computadora portátil. Hice esto durante unos meses, grabando frases de una novela que estaba escribiendo y corrigí cualquier inexactitud de Google usando la aplicación.

Después de varios meses más sin grabar frases, terminé el primer borrador de una novela (20.000 palabras) usando la aplicación. Esto no quiere decir que sea impecable; por cada hora que escribo, tengo que retroceder y dedicar una hora a hacer pequeñas correcciones. Pero no me importa porque Euphonia se encuentra en una etapa beta y en lugar de marcar lentamente 100 palabras por día, estoy generando 500 palabras por día.

Luego está el hecho de que Euphonia no fue diseñado para el procesamiento de texto, es más para comandos declarativos, y mi estilo de escritura es lo que ellos llaman un 'pantser' (volar por el asiento de tus pantalones), así que tengo muchas pausas porque no sé cómo va a terminar una oración, ya sabes, como Michael Scott. Sin embargo, cuando sé lo que quiero decir, como en mensajes de texto, correos electrónicos o dando instrucciones a mi asistente, es, con mucho, el reconocimiento de voz más preciso que he usado.

Cuando instituciones como Google dan voz a los discapacitados en el diseño de la arquitectura del futuro, dejándolos seguir siendo ellos mismos en lugar de tratar de convertirlos en algo "normal", me da la esperanza de que en la era de la inteligencia artificial prevalecerá el humanismo.

Si desea visitar el sitio web del Proyecto Euphonia, o tiene una discapacidad del habla y desea contribuir con una muestra de voz, puede ir a este enlace: https://sites.research.google/euphonia/about/