Hace unos meses, os hablamos de una aplicación llamada Buzz, que recomendábamos por su eficacia a la hora de transcribir audios a texto, así como de traducir dichas transcripciones. Aquel artículo se titulaba «En un año increíble para la inteligencia artificial, ninguna me ha resultado tan útil como Whisper» y, por poner en contexto, lo publicamos justo una semana antes de que ChatGPT rompiera las expectativas en el campo de la IA.
Pero, espera, ¿’Whisper’? ¿no estabamos hablando de algo llamado ‘Buzz’? Os explico: Buzz no es más que la interfaz gráfica que facilita el uso de un modelo de IA open source llamado Whisper (desarrollado, por cierto, por OpenAI, los creadores de ChatGPT).
Así, al instalar Buzz en nuestro equipo, se descarga también el modelo de IA, y la labor de procesamiento de la misma queda en manos de nuestro propio PC (no es apto, por tanto, para equipos poco potentes).
¿Qué aporta Writeout que no aporten otras interfaces de Whisper?
Pero, ¿y si no queremos que sea nuestro PC quien tenga que ejecutar la IA? ¿Y si queremos usar Whisper del mismo modo en que usamos ChatGPT: abriendo el navegador y esperando a que nos conteste? Pues hasta ahora eso no era sencillo, pero un servicio web recientemente lanzado, Writeout.ai, lo hace posible.
Y de manera 100% gratuita: la única limitación con que nos encontraremos será la del tamaño de los audios que podremos subir a la plataforma: 25 MB. Por otro lado, nada nos impide dividir un archivo más grande y subirlo en varias tandas, si fuera necesario.
Bueno, también habrá otra limitación: el español sólo está soportado como lenguaje de destino, no de origen. Así que no nos servirá para transcribir audios en español, pero sí para transcribirlos a español (o alemán, o francés, o klingon -sí, klingon-, así como otros seis idiomas).
Así es usar Writeout
Cuando accedemos a la página web de Writeout, nos encontraremos con una breve descripción de su funcionalidad. Para hacer uso de la herramienta sólo tenemos que clicar en el botón ‘Transcribe for free’. Tras eso, nos pedirá que iniciemos sesión en… ¿Github? Sí, necesitamos una cuenta (gratuita) en la popular plataforma de repositorios de Microsoft.
Una vez iniciada la sesión, y concedido acceso de la aplicación a nuestra cuenta (clic en el botón ‘Authorize beyondcode‘), nos encontraremos ante una sencilla pantalla en la que podremos seleccionar un fichero de audio o vídeo (en formato MP3, MP4, MPEG, MPGA, M4A, WAV o WEBM) y, de forma completamente opcional, introducir un prompt (al más puro estilo DALL-E 2, MidJourney y cía):
«El prompt puede usarse para proporcionar información adicional sobre el audio. Esto puede resultar muy útil para corregir palabras o acrónimos que el modelo de IA podría reconocer de manera errónea».
Nosotros lo hemos probado extrayendo un fragmento de dos minutos y medio del capítulo de ayer del popular podcast de tecnología estadounidense ‘Accidental Tech Podcast’, y hemos optado por no usar ningún prompt. Cuando el audio se haya subido y hayas escrito (si así lo estimas necesario) el prompt, sólo tienes que clicar en el botón de ‘Transcribe’. Y esperar (brevemente).
El resultado se nos presenta listo para descargar en formato *.VTT (de subtítulos), y también lo podemos consultar directamente en la web, con un reproductor que va destacando el fragmento de transcripción que suena en cada momento, y con un buscador que nos permite localizar una palabra o frase en concreto.
Primero aparece en inglés, aunque nos da la opción de traducirlo directamente en la web… y de descargar y visualizar la transcripción traducida del mismo modo que la original:
A nuestro entender, el mejor sistema de transcripción/traducción que hayamos experimentado hasta ahora, mucho más preciso que el resultado obtenido hace unos meses con Buzz (aunque en ese momento usamos un audio de origen en español, por lo que no es del todo comparable).
Si el audio a trascribir no es material sensible en términos de privacidad (en cuyo caso Buzz puede seguir siendo una opción preferible), sino un vídeo o audio extraído de Internet, Writeout.ai es la solución perfecta para ti.
En Genbeta | Cinco herramientas para convertir audios en texto en tu PC y gratis
En Genbeta | OpenAI ha rebajado un 90% el acceso a la tecnología de ChatGPT y ha lanzado su API. Esto lo cambia todo