Bienvenidos a Café Shibe

Cafe Shibe

Escribir código usando reconocimiento de voz, una nueva barrera superada en el desarrollo de software (con algunos inconvenientes)

Sele

IA No-Binaria
Registrado
15 Feb 2019
Mensajes
2.165
Reacciones
1.567
Awards
2
Edad
36
Ubicación
Preguntando a Nekotina
  • SA Geek 2021
  • Shibe Awards 2020: Geek
Shibecoins
$3.254
Bitshibe
$0
Alexa, Siri, Android Auto... cada vez, nuestra voz cobra mayor peso en el modo en que interactuamos con las nuevas tecnologías. En muchos casos, lo hacemos por mera comodidad, pero podemos hacerlo porque otros trabajaron antes espoleados por la necesidad.

Y es que cada vez son más las tecnologías que nos permiten desarrollar software mediante la voz (es decir, dictando comandos que permiten manipular el código y automatizar flujos de trabajo), pero es posible porque algunos desarrolladores se vieron antes en la disyuntiva (afectados por discapacidades y lesiones) de crear estos sistemas o dedicarse a otra cosa.

Ryan Hileman empezó a desarrollar Talon en 2017, cuando se vio obligado a dejar su trabajo de programador a tiempo completo tras haber sufrido durante un año de fuertes dolores en una mano.

Quería desarrollar un 'manos libres' para programadores que permitiera "a cualquier reemplazar por completo el ratón y el teclado".

Dos años después, a Matt Wiethoff, ingeniero de software en Quota, le fue diagnosticada una lesión por esfuerzo repetitivo. Él también tuvo que abandonar tu trabajo y empezó a trabajar en su propia plataforma de programación mediante la voz: Serenade.

Wiethoff lo hizo por pura necesidad, ante la perspectiva de tener que dedicarse a otra cosa que requiriera menos esfuerzo tipográfico. Unos meses más tarde Serenade recaudaba 2,1 millones de dólares en una ronda de financiación inicial.

Serenade cuenta con un motor de conversión de voz a texto desarrollado específicamente para reconocer código (y transcribirlo a una sintaxis válida), a diferencia de su equivalente de Google, diseñado para el reconocimiento del habla conversacional.

Talon, por su parte, está compuesto de tres elementos principales: sistema de reconocimiento de voz, de ruido y de seguimiento ocular. Estos dos últimos permiten sustituir por completo al ratón: el primero para usar chasquidos con la boca a modo de clic, y el segundo para mover el puntero. Según Hileman,

"Ese sonido [de chasquido] es fácil de hacer: requiere poco esfuerzo y requiere baja latencia para reconocerlo, por lo que es una forma mucho más rápida y no verbal de hacer clic con el mouse que no causa tensión vocal".

Existen diferencias de enfoque entre ambos, como se aprecia en el gráfico adjunto; mientras que Talon suena muy distinto del habla conversacional humana, con comandos específicos para cualquier acción, Serenade apuesta por un enfoque más abstracto, en el que el programa asume ciertas acciones vinculadas a cada comando, sonando así mucho más natural (si sabes inglés, claro).

35502

Fuente: Escribir código usando reconocimiento de voz, una nueva barrera superada en el desarrollo de software (con algunos inconvenientes) (genbeta.com)
 
shape1
shape2
shape3
shape4
shape7
shape8
Arriba