captar audio y convertir a texto


([N1] osuna) #1

Hola que tal.

Alguien ha utilizado alguna herramienta que me pueda mencionar, donde sea posible desde velneo captar el microfono de la maquina y grabar un audio X y ese audio convertirlo a texto para ahorrar tiempo en redacciones de texto en campos de observaciones en algún registro.

De ante mano agradecería mucho.

Saludos.


([N1] aztecmexico) #2

Buen día.
Básicamente tienes dos opciones

  1. El reconocimiento de voz de windows que desde mi experiencia funciona pésimo
  2. Dragon naturally speak. Que reconoce de maravilla y con casi nada de errores. Cuandi lo activas abre un cuadro de dialogo que es donde dictas y al terminar das la instruccion para que lo copie al campo que tenias seleccionado.
    La pega es que es de pago y no es barato. Y, consume muuuuuchos recursos de la maquina por lo que en maquinas con celeron y poca memoria es malo el desempeño.
    Hay una página web quebutiliza el motor de googl. Speech notes creo que se llama. Su reconocimiento de voz es muy bueno. Pero solo funciona en navegador web. Yo probe en webkit y no funcionaba. No he probado en el nuevo navegador de la 22. De cualquier forma en ese caso tendrian que copiar pegar manualmente.

Saludos.


([N1] osuna) #3

Hola aztecmexico gracias por tu respuesta y recomendación, He probado speechnotes y en el navegador va excelente, funciona perfecto, pero desde el visor html de velneo hay dificultades al activar el microfono de la maquina.

La otra alternativa como comentas es Dragon naturally speak, vere si puedo resolver algo con ella.

Saludos.


([N3] diverco02) #4

Hola Osuna

Utiliza API CLOUD SPEECH de Google. Desde Velneo con JS puedes utilizarlo perfectamente. Te dejo el link: https://cloud.google.com/speech/?hl=es


([N1] osuna) #5

Hola driverco02, estuve probando con esa api pero el problema es que el visor html de velneo no da permisos para acceder al microfono de la pc, tambien hice pruebas con la api de microsoft que si permitia la captura del audio y lo convertia a texto pero no funcionaba muy bien que digamos pues sugeria palabras muy distintas a las que hablaba, opte por usar el speechnotes de forma externa.

Gracias.


([N4] lumidodyftec) #6

Hola Osuna, en la presentación de las novedades de la V24 comentan que los permisos de acceso a cámara y micrófono se guardan a nivel usuario (no lo probé) - Minuto 5:10 del video

Espero que te sirva. Un saludo
Luismi.


([N1] osuna) #7

Muchas gracias lumidodyftec, le echare un vistazo.