Hicimos el primer chequeo en vivo del mundo con transcripción automática
Si alguna vez desgrabaste una entrevista, charla o clase, sabés el tiempo y trabajo que demanda. Si la grabación dura una hora y tenés que hacerla con precisión, desgrabarla te llevará mucho más que eso. De alguna manera -en principio difícil de entender-, seguimos desgrabando como antes de que la humanidad llegara a la Luna, desarrollara Internet y creara cohetes y coches autónomos. Hasta hoy. Pero tenemos una buena nueva.
En el último chequeo colectivo en vivo que hicimos para seguir el debate en el Senado por la legalización de la interrupción voluntaria del embarazo pudimos por primera vez tener una transcripción en tiempo real de todo lo que se dijo en la sesión. El resultado que se condensa en la línea anterior llevó casi dos años de trabajo del equipo de Chequeado que construye la plataforma “Chequeabot” y décadas de trabajo de las empresas de tecnología que trabajan en el desarrollo de estas herramientas que traducen de audio a texto los discursos (speech to text, en la jerga).
Desde que decidimos comenzar a trabajar en el desarrollo de herramientas de automatización en nuestro Laboratorio de innovación para generar tecnología que ayude a los chequeadores a generar chequeos de manera más rápida sin perder calidad frente a la acelerada desinformación sabíamos que “speech to text” era la siguiente frontera. En los últimos dos años probamos la tecnología de empresas como Google, IBM y Microsoft para tratar de entender cuándo íbamos a poder usarla. En 2017 la calidad en español (en inglés funciona mejor), todavía dejaba bastante que desear, con matices entre esas compañías, para un trabajo de precisión como el de chequeo, pero en los últimos meses la calidad mejoró notablemente en parte ayudada por los aprendizajes tras el ingreso de dispositivos basados en voz, como los de Amazon y Google, a los hogares.
En este #ChequeoAborto por primera vez pudimos tener transcripción en tiempo real de lo dicho en el Senado gracias a Live de los colegas de @fullfact y @Speechmatics.
En esos textos #Chequeabot, nuestro ?, encontró frases chequeables y las relacionó con chequeos anteriores. ✔️ pic.twitter.com/uaAxXBOgRh— Chequeado (@Chequeado) 9 de agosto de 2018
Con este contexto, a comienzos de 2018 comenzamos a hablar con nuestros colegas de FullFact, la organización británica de chequeo de datos con la que trabajamos codo a codo en automatización, para avanzar en esta línea. Así hicimos una prueba interna utilizando la tecnología de Speechmatics a través de FullFact en nuestro chequeo en vivo del 1 de marzo último. Allí salió todo bien, la transcripción funcionó muy bien, pero se trataba del presidente, Mauricio Macri, hablando de manera pausada y sin interrupciones. El desafío de tomar distintas voces en un contexto diferente como el del Senado lo testeamos la semana anterior al debate y ahí nos encontramos con la buena sorpresa de que también funcionaba bien. Con esto resuelto nos animamos a sumarlo a nuestro chequeo regular. Y funcionó muy bien.
Eso, como se ve en la imagen donde resaltamos la palabra protocolo, nos permitió tener por primera vez en tiempo real el texto completo de lo que se decía. Así, periodistas y Chequeabot, con esta función en modo beta, pudieron encontrar frases chequeables para realizar un chequeo más veloz y preciso. Además, luego, nos permitió hacer un análisis de texto y búsqueda de información en el debate mucho más precisa. Pensando en los próximos 14 meses hasta las elecciones presidenciales esta herramienta será central.
¿Esto resuelve todo? No. En el mundo aún no es fácil saber cómo identificar quién habla y en una discusión de 17 horas esto resultó clave. Sin embargo, pese a eso, durante la transmisión en nuestro equipo de Innovación los desarrolladores Mariano Falcón y Joaquín Saralegui fueron trabajando en una posible solución intermedia para situaciones como el debate. Capturaron imágenes del video a intervalos fijos por lo que tenemos los nombres de cada senador que hablaba gracias al zócalo que se veía en video. Esto, que surgió sobre la marcha, es una posibilidad que quizás aplicaremos a futuro nosotros u otros con problemas similares.
Uno de los desafíos más interesantes del desarrollo de una plataforma como Chequeabot es que cada nueva pieza del rompecabezas del chequeo de datos con apoyo de automatización genera un nuevo abanico de posibilidades hasta ahora inexploradas. Para Chequeado. Y para todos.
Comentarios
Valoramos mucho la opinión de nuestra comunidad de lectores y siempre estamos a favor del debate y del intercambio. Por eso es importante para nosotros generar un espacio de respeto y cuidado, por lo que por favor tené en cuenta que no publicaremos comentarios con insultos, agresiones o mensajes de odio, desinformaciones que pudieran resultar peligrosas para otros, información personal, o promoción o venta de productos.
Muchas gracias