Diseño de Interfaces de usuario para el uso adecuado de la voz

Aunque es posible intentar obligar a los usuarios  a memorizar frases o  tratar de que ellos descubran por su cuenta la clave para iniciar o realizar alguna acción en tu aplicación no es recomendable la práctica de estos puntos.

Aquí están unos tip’s que te ayudaran a mejorar la interfaz de los usuarios, y que estos puedan utilizar más fácilmente el comando de voz y para que sepan que frases están disponibles.

Puntos clave y consejos básicos:

Si hay un comando de voz disponible, el usuario debe ser capaz de verlo escrito en la pantalla exactamente cómo tienen que decirlo para que pueda ser reconocido

Indicar visualmente que la aplicación esta “escuchando” los comandos.

Por ejemplo: Xbox 360 utiliza un icono de micrófono para mostrar esto:

Si utiliza una palabra clave, mostrar esa palabra clave en la pantalla, o llevar al usuario a través de un tutorial en el principio

En caso de que tu aplicación debe utilizar alguna frase para activarse pero hay un problema con la conexión del micrófono, lo más conveniente en estos casos es mostrar un icono de error o un mensaje para que el usuario sepa del problema y pueda ser solucionado.

Si por alguna razón el usuario no puede estar mirando la pantalla, tener  la opción de leer en voz alta las frases disponibles para ellos puede ser de mucha ayuda, incluso para personas invidentes podrán utilizar su aplicación sin ningún problema si las instrucciones son claras.

El uso de la voz no debe ser el único método por el cual un usuario puede interactuar con la aplicación, ya que en caso de que la voz no funcione la aplicación podría convertirse en una poco fiable, por eso es recomendable usar otro método de entrada.

Uso de “Voz” en alguna aplicación para Kinect

La voz es otra entrada que permite tener al usuario experiencias nuevas y una sensación natural, pero es todavía limitado en cuanto a lo que es compatible. El uso de voz en alguna aplicación permite elegir determinadas palabras o frases para escuchar y utilizar como disparadores. Palabras o frases habladas como comandos no es conversacional y no puede parecer como una forma natural de interactuar, pero cuando la entrada de voz se diseña y se integra bien puede hacer experiencias en las que el usuario se sienta agusto y aumentar su confianza en la intención usuario-kinect.

Palabra clave o gatillo

El Kinect sólo escucha una sola palabra que toma como clave o el gatillo. Una vez que escucha esa palabra la repite para especificadas palabras o frases adicionales. Se trata de la mejor manera de reducir los falsos positivos. La palabra clave que elijas debe ser muy distinta para que no es fácilmente malinterpretado. Por ejemplo, en Xbox 360, “Xbox” es la palabra clave. No muchas palabras suenan como “Xbox”, por lo que también es una palabra clave fuerte.

Elección de palabras y frases

Al elegir qué palabras o frases puedes utilizar en tu aplicación debes tener en cuenta algunas cosas importantes como:

  • Utiliza palabras sencillas y comunes donde sea posible obtener una  experiencia más natural y más fácil memorización
  • De preferencia utiliza frases de no más de 5 palabras.
  • Trata de mantener la frase o las palabras en la pantalla mientras se este activado el comando de voz.
  • Trata de no seleccionar como palabras clave, palabras con una sola sílaba ya que estas son muy fácil de confundir con otras similares.
  • Evitar la aliteración, palabras que riman, longitudes de sílaba común, común sonidos vocálicos, mismas palabras en diferentes frases.
  • Si las cosas se complican demasiado, o el texto basado en contenido no ayuda mucho, considera el uso de números para asignar opciones en la pantalla.

Para comandos reconocidos con poca confianza, ayuda mucho el proporcionar indicaciones al usuario en la pantalla de tu aplicación. Por ejemplo: ¿quiso decir” cámara?

Poner a prueba tus palabras y frases en el ambiente acústico al que quieres llegar con tu aplicación para comprobar que realmente funcione y que se pueda utilizar correctamente en ese entorno.

Otro punto de apoyo a la hora de utilizar el comando de voz para tu aplicación es utilizar un evento. Por ejemplo: Escuchar la palabra clave sólo cuando se detecte un esqueleto en un área determinada.

Ajustar los niveles de confianza que aceptas para reducir una activación falsa. Esto puede resultar en tasas más bajas de reconocimiento, pero podría ser menos frustrante para los usuarios.

Prueba y error. Si una palabra específica siempre falla o se reconoce falsamente, intenta  pensar en una nueva forma de describirlo