Comunicación, Cultura de Subtítulos, Tecnología

Transcriptores de voz a texto

Me encanta la tecnología, pero aún más cuando nos acerca a una vida más plena. Uno de los principales dramas de las personas con hipoacusia postlocutiva es la falta de oferta de formación en medios accesibles a nosotros. En algunos países se ofrecen planes formativos en lengua de señas, sin embargo, esa no es solución para toda la gente con pérdida auditiva que nunca ha aprendido esta lengua.

La mayoría de las personas que nacen sordas aprenden lengua de señas como medio prioritario para comunicarse. La mayoría de las personas que no nacen sordas, pero pierden la audición después de haber aprendido un lenguaje hablado, nunca aprenden lengua de señas y, en muchos casos, nunca tienen contacto con la comunidad sorda.

La mayoría de las personas que no nacen sordas, pero pierden la audición después de haber aprendido un lenguaje hablado, nunca aprenden lengua de señas y, en muchos casos, nunca tienen contacto con la comunidad sorda.

casa caracol

Para personas cuya audición no es suficiente para tomar un curso, pero no saben LS, un apoyo adecuado al impartir una formación son las transcripciones o mejor aún los subtítulos en tiempo real.

Mediante algoritmos, inteligencia artificial y el uso de Bluetooth y Wifi se han estado creado soluciones para transcribir en tiempo real conversaciones o diálogos que pueden suceder en distintas situaciones de la vida cotidiana. Estas herramientas digitales nos van a permitir a relacionarnos mejor en un sinfín de situaciones y ayudarnos a no perder datos importantes o información en el camino.

Estamos en un congreso y el conferencista no está de frente a nosotros o se encuentra demasiado lejos. En el mostrador de un consultorio o del banco, quien nos atiende habla mirando hacia otro lado, se encuentra detrás de un vidrio y su voz nos llega distorsionada por un micrófono o un altavoz. En una reunión de amigos, varios hablan a la vez y no podemos leer los labios de varios rostros simultáneamente. Nos llaman por teléfono y dada la mala calidad del sonido, no entendemos. En todas estas situaciones y muchas más, nos vendría bien un transcriptor automático a texto, donde podamos leer lo que dice nuestro interlocutor en tiempo real. Requerimos de apoyos visuales que faciliten captar la información que se nos da para relacionarnos con naturalidad.

Uno de los principales dramas de las personas con hipoacusia es la falta de oferta de formación en medios accesibles a nosotros. Estas Apps son un paso adelante para acercarnos al desarrollo personal y profesional.

casa caracol

Anteriormente hemos publicado sobre Apps para personas con sordera. Pero hoy nos enfocamos en las herramientas que transcriben voz a texto. Las voy a separar en dos partes: aquellas para usarse en conversaciones presenciales y aquellas para usarse para llamadas telefónicas. Intercaladamente les iré contando todos los usos que se me han ocurrido que pueden tener en la vida cotidiana.

¡Aquí vamos!

Transcriptores de voz a texto presenciales

Transcripción Instantánea de Google

¿Qué es? Es un App para el teléfono móvil que subtitula la voz en tiempo real.

Situación ideal para usarla: conversaciones presenciales espontáneas, conferencias o cursos.

¿Cómo funciona? Cuando no logramos entender lo que nos dice alguien que está frente a nosotros, espontáneamente sacamos el teléfono móvil y presionamos el micrófono, entonces va apareciendo escrito lo que esa persona nos dice.

Tiene la opción de usarlo con un micrófono externo, por ejemplo, un auricular manos libres que transmite vía Bluetooth. Así permite seguir una clase y ver los subtítulos en el celular mientras el profesor habla, siempre y cuando lleve el auricular/micrófono colocado cerca de su boca. Los alumnos irán viendo la transcripción en sus celulares que han sido previamente enlazados al micrófono.  

Otra manera de usarla es en un mostrador (del banco, del correo, de una tienda, etc) como apoyo al cliente que no oye, para que lea lo que se le dice y se eviten malos entendidos. Por ejemplo, en un consultorio donde se atiende a personas con pérdida auditiva habitualmente se puede tener un Tablet o un móvil permanentemente en la recepción, para que sin necesidad de que el paciente se descargue el App, vea transcrito todo lo que la recepcionista le dice. 

Aspectos positivos: La transcripción permanece en el dispositivo (no la guarda Google) y en la pantalla del App hay un espacio habilitado para escribir. En caso de que el transcriptor no haya escrito bien, manualmente se puede teclear y hacer la corrección. Se puede elegir el idioma de entre una gran variedad, por ejemplo: Español de España o de México, lo cual mejora mucho su capacidad de comprensión de expresiones locales o modismos.

Aspectos negativos: Solo transcribe cuando hay conexión a Internet. No funciona en iOS

Características técnicas: Solo para Android. Solo funciona con Wifi. Solo se puede usar con el App (no tiene página web)

¿Es Gratis?

Ava

¿Qué es? Es un App para teléfono móvil que transcribe conversaciones presenciales en tiempo real. Funciona como el App anterior, pero tiene también otras funciones como transcripción especial para conversaciones grupales, para eventos o centros de enseñanza a gran escala.

Situación ideal para usarla: Ava ya ha pensado en varias modalidades dirigidas para varios tipos de usuarios, entre otras, estas me parecen muy interesantes:

  • Conversaciones presenciales en grupo, por ejemplo, en una reunión, en un restaurante, etc.
  • Para empresas: para subtitular video conferencias o eventos de networking.
  • Para eventos: conferencias donde habrá un gran número de usuarios que requieran transcripción.
  • Para centros educativos donde acuden niños o adultos que ya saben leer, pero no oyen bien.

¿Cómo funciona?

Conversaciones en grupo: Si por ejemplo, estamos en una cena y nuestros amigos están hablando desde varias direcciones, en Ava vamos viendo en la pantalla del móvil lo que cada persona va diciendo, y aun mejor, cada persona de distinto color. Todos los interlocutores deben tener descargada la aplicación en su móvil y el móvil sobre la mesa o cerca de su boca, se enlazan contigo rápidamente (ya que tiene un QR Scanner) y la App comienza a escribir la conversación en tu móvil. Hay que indicarle qué idioma se está hablando para que lo transcriba bien.

En Eventos: en un evento en que requerimos subtitular una conferencia, tiene una manera de enlazar el micrófono de un ponente con los celulares de varias personas de la audiencia. Se instala una cajita que emite a ciertos metros a la redonda (tipo un aro magnético) la señal y son los celulares con la App quienes captan la señal y la transcriben. El usuario se descarga la App para el evento y en cada sala hay un código a la entrada. Mediante ese código empieza el móvil a recibir la voz del ponente y a transcribir. Con la ventaja que ni siquiera hay que tomar apuntes.

En una Escuela: si queremos que muchas personas puedan ver los subtítulos aunque no tengan teléfono móvil, conectamos una laptop que tenga AVA instalada y se conecta la laptop a un proyector o pantalla de dónde puedan los alumnos leer la transcripción de la clase en tiempo real.

Aspectos positivos: AVA fue creada por y para personas con pérdida auditiva. Es la que abarca más modalidades. Es posible indicar el idioma en que se está hablando para optimizar la transcripción. A elegir entre: inglés, francés, holandés, español, alemán, portugués, italiano, y muchos más.

Aspectos negativos: No es 100% gratis, aunque sí tienen un plan básico con 300 min gratis al mes.

Características técnicas: Está disponible para Android y iPhone. A diferencia de la App de Google, Ava se puede usar con o sin tener conexión a Wifi. Y permite guardar el archivo con la conversación transcrita.

¿Es Gratis? Hay una versión básica que es gratuita, son 300 minutos al mes y el primer mes es ilimitado. Existen planes para compañías, escuelas, universidades, hospitales, comercios, consultorios, etc con Modalidades que permiten algunas peculiaridades extra según su uso y precios acorde al número de usuarios y micrófonos a transcribir, etc.

Speechnotes

¿Qué es? Speechnotes es un block de notas poderoso habilitado para reconocer voz. Está diseñado para capturar dictados, se puede dictar también la puntuación. Es una página web, no una app. 

Situación ideal para usarla: Fue creada para capturar textos, no para personas sordas. Hay que vincular un micrófono inalámbrico al teléfono móvil o a la PC vía Bluetooth (como en las apps anteriores). Entonces, recoge la voz del ponente y la transcribe. Es ideal cuando tomamos un curso, del cual se desea luego dar formato al texto o editar y enviar como archivo.

¿Cómo funciona? Hay que entrar en la página web y conectar un micrófono al ordenador o al móvil, entonces dar clic en el micrófono para que empiece a capturar. 

Aspectos positivos: Es una página web siempre disponible, no requiere descargar un App. Promete una efectividad del 90% cuando se habla lenta y pausadamente, con claridad. Se guarda el archivo automáticamente y se puede exportar a Google Drive. También se puede imprimir o enviar por email con un clic. 

Aspectos negativos: No se puede acceder a estos archivos desde otra computadora, a menos que se exporte a Google Drive. Es probable que se llene la memoria de Speechnotes, entonces haya que borrar notas para generar espacio disponible. 

Características técnicas:  Funciona basada en el motor de reconocimiento de voz de Google. Por lo que, todo lo capturado pasa por el servidor de Google para ser interpretado y que se genere la transcripción. Necesita usarse con Google Chrome. 

¿Es Gratis? Si, sin tiempo límite. 

Transcribe – Speech to text

¿Qué es? Es un software de dictado que funciona mediante inteligencia artificial.  Funciona por medio de una App. 

Situación ideal para usarla: Para generar texto desde videos y mensajes de voz (voice memos), generar subtítulos de una película. También permite importar archivos desde Dropbox.  

¿Cómo funciona?  Se importan archivos de distintas fuentes en video o mensaje de voz y el App los transcribe. El resultado se puede exportar.  Ya no es necesario escuchar un mensaje de voz mil veces hasta entenderlo, se transcribe y lo podremos leer, ¡listo!

Aspectos positivos:  Ofrece opción de transcribir en 80 idiomas distintos. Exportar el archivo de texto a diferentes aplicaciones para editar. No tiene Anuncios. 

Aspectos negativos: No funciona en Android.

Características técnicas:  Requiere iOS 11 o posterior.

¿Es Gratis? Descargarla sí, pero hay que pagar una cuota para usarla a su máximo potencial. Ofrece un periodo de prueba gratis de 15 min de transcripción, después ofrecen distintos paquetes.

Apps para transcribir llamadas telefónicas a texto

El no poder oír una conversación telefónica es, quizá, la situación cotidiana más incapacitante para una persona con pérdida auditiva.

casa caracol

Aun con auxiliares auditivos e implantes cocleares la comprensión de las palabras vía telefónica es normalmente complicada para alguien con pérdida auditiva. En algunos países se han creado centros de servicios de transcripción donde una 3ª persona escucha la llamada y envía lo que se dice en texto al usuario. Sin embargo, hablar con algún amigo sabiendo que un tercero está escuchando no es muy cómodo que digamos.

El teléfono es, además, un factor clave para muchas personas para poder trabajar, por mucha preparación que tengan, usar el teléfono es algo necesario en gran cantidad de puestos. Desde para conseguir un empleo, las primeras entrevistas son habitualmente por teléfono. Antes de conocerle, el candidato ha quedado descartado. Por eso, estos pequeños apoyos pueden cambiar la calidad de vida de una persona con hipoacusia drásticamente.

Las siguientes son Aplicaciones que buscan resolver este problema.

Roger Voice

¿Qué es? Es una Aplicación para teléfono móvil para subtitular llamadas o video llamadas en tiempo real. Fue creada específicamente para personas con pérdida de audición.

Situación ideal para usarla: Llamadas entre teléfonos móviles que tengan descargada el App. Para recibir llamadas de un teléfono fijo en el móvil.

¿Cómo funciona? No requiere de intermediarios por lo que es confidencial. La transcripción la hace el App. Se elige el idioma que se debe transcribir en la esquina del lado superior derecho, hay una larga lista de idiomas a elegir. Se crea una lista de contactos a quienes se puede invitar a descargar el App. Las llamadas se realizan de usuario a usuario de Roger Voice, a través del App. Cuando se habla va apareciendo el texto en la pantalla del móvil en tiempo real. Adicionalmente ofrece una función opcional de video intérprete a Lengua de Señas.

Aspectos positivos: Es para Android o iOS. Tiene una versión básica gratuita. Se puede llamar a amigos que tienen Roger Voice de manera gratuita. Se puede responder de forma oral o por escrito.

Aspectos negativos: Las instrucciones y el idioma de los menús en el App están solo en francés e inglés.

Características técnicas: Es una interfaz que con un sistema de reconocimiento de voz hace las llamadas telefónicas accesibles. Descargable en Android o iOS.

¿Es Gratis? Entre dos teléfonos móviles de usuarios del App la llamada es gratuita, para recibir llamadas de teléfonos fijos o de móviles sin la App hay tarifas. Hacer llamadas a teléfonos fijos o móviles sin el App también tiene tarifas. También hay planes especiales para empresas, con la idea de que éstas subvencionen el servicio a sus empleados como una prestación.

Text hear 

¿Qué es? Es un APP similar a Ava y Transcriber de Google que transcribe voz en tiempo real. Sin embargo, tiene la función adicional de que, vinculada a un convertidor de llamadas telefónicas de teléfono fijo, transcribe también las llamadas de teléfono.  Este convertidor se vende por separado.

Situación ideal para usarla: Para transcribir las llamadas que recibimos o hacemos en nuestro teléfono fijo.

¿Cómo funciona? Text hear Personal sirve tanto para subtitular conversaciones presenciales, como para subtitular llamadas del teléfono fijo. Se conecta un convertidor a la red telefónica con el cable de teléfono y esta caja se conecta, a su vez, al auricular y al celular.  En el celular descargamos el App «Text Hear Personal» y es ahí donde se muestra la transcripción de la llamada. Agrega puntuación de manera automática, pues utiliza el traductor de voz a texto de Google. No guarda las conversaciones en el servidor, solo en nuestro dispositivo móvil. 

Este App tiene 3 modalidades:

  • Transcriptor de voz de forma presencial (como transcriptor de Google o AVA)
  • Transcripción de llamada telefónica a texto mediante su convertidor
  • Emisión del sonido enlazándolo con un Sistema de Aro Magnético, para que las personas lo reciban directamente en sus oídos a través del modo T-coil de los auxiliares auditivos. Proponen esta modalidad en mostradores, estaciones de transporte, bancos, en vehículos y en pequeñas reuniones.

Aspectos positivos: Es el único transcriptor de llamadas de teléfonos fijos (fuera de los que subvenciona la seguridad social en Estados Unidos a las personas con sordera).

Aspectos negativos: Sin una conexión telefónica de alta calidad, no transcribe bien. No funciona con iOS. 

Características técnicas: Se puede elegir entre una gran cantidad de idiomas. Requiere una conexión a internet y buena conexión telefónica. Es compatible con casi todas las redes telefónicas fijas. Está disponible para Andrioid. 

¿Es Gratis? El servicio es gratis, pero el convertidor se compra aparte. 

Skype con subtítulos

¿Qué es? Es una página web y su respectiva App que nos permite hacer llamadas de audio y de video con otros usuarios. Al habilitar la opción de Subtítulos, podemos tener videollamadas y leer lo que uno o todos los usuarios dicen.

Situación ideal para usarla: Video llamadas de móvil a móvil o vía ordenadores.

¿Cómo funciona? Hay que descargar Skype y activar la opción de subtitulado. Entrando en Ajustes, dando clic en «Opciones de Llamada», dar clic en Activar Subtítulos. Nuestro interlocutor debe hacer esto para que nosotros veamos subtítulos de lo que él dice. Así mismo, él deberá seleccionar su idioma para que Skype lo transcriba adecuadamente.

Aspectos positivos: Muchas personas ya usan Skype habitualmente, es compatible con Android y iOS.

Aspectos negativos: Hay que tener la última versión de Skype para poder ver la opción de subtitulado.

Características técnicas: Es compatible con Android y iOS. También funciona como página web desde un ordenador.

¿Es Gratis? Subtitular es gratuito.  

Conclusiones

En la práctica, desde que descubrí estas herramientas y las he empezado a incorporar en mi vida, he notado que la precisión en la transcripción depende muchísimo de que los siguientes 6 puntos se cumplan, pues son determinantes de que el reconocimiento de voz funcione. En llamadas telefónicas, donde además hay una distorsión natural de la voz en la conexión telefónica, es aún más complicado lograr estas condiciones. 

  • Hablar con claridad y de manera pausada
  • Buena dicción
  • Ambiente silencioso (reducir ruido ambiente al máximo)
  • Idioma adecuado (previamente seleccionado)
  • Buena conectividad (Wifi, línea de teléfono, etc)
  • Micrófono de calidad

Como la inteligencia artificial avanza cada día estoy segura de que seguirán mejorándose así mismas estas aplicaciones. Los invito a probarlas y comentar su experiencia. Dar a conocer a instituciones y prestadores de servicios, que ES POSIBLE habilitar estos servicios para atender a las personas con pérdida auditiva. Amigos lectores, ¿ustedes que otras herramientas utilizan para transcribir?

Anneliese Castro es la creadora de Casa Caracol, el portal en español para personas con pérdida de audición. Accede a más artículos como este en nuestro Blog: Vivir con pérdida auditiva y síguenos en Facebook.

4 comentarios sobre “Transcriptores de voz a texto”

    1. Hola Fernando,
      Cualquiera que se compatible con tu teléfono móvil. Es importante elegir uno que cumpla con el rango de alcance que vas a necesitar. Es decir la distancia entre quien traerá el micrófono y tu teléfono móvil. También que tenga buena calidad de sonido y si es preciso cancelación de ruido.
      En nuestra tienda online tenemos algunos. Echa un vistazo http://www.casacaracolstore.com
      Saludos

Deja un comentario