Whisper: transcribir una entrevista ahora es posible

Transcribir es con toda seguridad la peor parte de hacer una entrevista. Me encanta hablar con personas que tienen algo que contar, pero luego pasarlo a texto es un proceso muy lento. Tienes que volver a escuchar el audio e ir escribiendo rápidamente. Ese es el proceso manual. Afortunadamente existen programas que convierten el audio a texto. ¿Qué ocurre? Básicamente que o bien son de pago o  funcionan muy mal.

Pero la inteligencia artificial ha llegado para solucionar las cosas. Y hablamos en concreto de Whisper, de los creadores de ChatGPT.

Quizás no es tan conocida como la herramienta de chat o la de creación de imágenes, pero Whisper es una herramienta para pasar audio a texto que funciona de maravilla. Y en todos los idiomas. Porque aquí está precisamente lo que más me gusta; también ofrece un gran nivel de precisión en español.

En inglés es cierto que sí teníamos más alternativas, pero en español la mayoría de herramientas gratuitas fallaban mucho. Con Whisper la cosa cambia.

Whisper se define como un “un sistema de reconocimiento automático de voz (ASR)”. Un modelo que ha sido entrenado con más de 680.000 horas de datos. Y podemos acceder a él a través de la web, ya que es abierto.

En Replicate tenemos la opción de acceder al modelo large v2. No hace falta instalar nada, simplemente subimos el archivo de audio que queremos y nos devolverá el texto al cabo de un tiempo, que varía en función de la longitud y el tamaño del archivo de audio.

Leave a Reply

Your email address will not be published. Required fields are marked *