Tipos de interfaces de usuario
Una interfaz de usuario es el medio con el que una persona puede interactuar con una máquina.
Gracias a las interfaces de usuario, las personas podemos interpretar la información y el funcionamiento de un sistema digital y accionarlo de acuerdo a nuestra voluntad.
Todos los puntos de interacción entre personas y tecnología están mediadas por la interfaz, por lo que nuestras experiencias con el entorno tecnológico se ven influenciadas por su diseño necesariamente. De ahí que debamos ser capaces de diseñarlas teniendo en cuenta el factor humano, que es el centro de la experiencia de usuario.
Cómo percibimos las interfaces de usuario
En la introducción al diseño de interacción vimos que las personas tenemos un proceso de percepción de la información que nos permite tomar decisiones con mayor o menor esfuerzo dependiendo de lo que percibimos. También vimos el concepto de affordance o invitación al uso que nos indica cómo espera ser usado un objeto según está diseñado.
Dependiendo de los sentidos involucrados en la interacción (vista, oído, tacto, olfato, gusto) y de los modos de entrada y salida de información de la máquina, las interfaces de usuario adaptan su diseño para ajustarse a una modalidad o múltiples modalidades que permitan la interacción.
Cada uno de estos paradigmas están optimizados para un uso específico y sus características ofrecen algunas ventajas y limitaciones que conviene conocer.
Command-line interfaces (CLI)
Los sistemas basados en líneas de comandos (CLI) representan sin duda uno de los estilos de interacción con mayor recorrido histórico en la era de la computación, y siguen siendo utilizados en multitud de entornos actualmente.
En estos sistemas el usuario debe introducir comandos o instrucciones a través de un prompt que pueden ser combinados con ciertos parámetros. Tras la introducción del comando, el sistema evalúa la instrucción y la ejecuta, o por el contrario devuelve un mensaje de error.
Este estilo de interacción puede resultar muy frustrante para usuarios no expertos, porque su uso requiere que la persona posea previamente el conocimiento sintáctico y semántico necesario que le permita saber qué comandos debe introducir en función del objetivo perseguido.
Además su aprendizaje puede resultar muy costoso, por la ambigüedad y, en muchos casos, arbitrariedad de los nombres de los diferentes comandos.
Pero no todo son desventajas en este estilo de interacción. En el caso de usuarios con conocimiento avanzado, las interfaces de líneas de comandos pueden permitirles llevar a cabo acciones de forma mucho más eficiente que con otro tipo de interfaces.
Por ejemplo, estos sistemas suelen posibilitar el empleo de ‘macros’ – series de comandos que se almacenan para poder ser ejecutados conjuntamente con una sola llamada –, con lo que permiten realizar operaciones frecuentes de forma automática sin esfuerzo.
Características de las líneas de comandos
- Las CLI están focalizadas a scripting o automatización.
- Las CLI no suelen utilizarse para el trabajo final, sino como recurso.
- Las CLI son un white canvas y por tanto no son fáciles de descubrir ni de explorar.
- Las CLI obligan al usuario a saber lo que quiere.
- Las CLI no facilitan la prevención de errores, aunque son muy precisas para la recuperación.
- La satisfacción de uso de una CLI es muy alta una vez superada la curva de aprendizaje.
- La eficiencia es la ventaja más destacable de las CLI.
Graphical User-Interfaces (GUI)
Las interfaces gráficas de usuario (GUI) representan la información mediante elementos gráficos a través de una pantalla y nos permiten interactuar con ellas desde la manipulación directa de dichos elementos.
Las GUIs se hicieron muy populares desde la creación del primer ordenador personal en 1973 por Xerox PARC, diseñado por Alan Kay para ser usado con un ratón (inventado por Douglas Engelbart) con el que interactuar directamente sobre los objetos gráficos. Posteriormente la metáfora de escritorio demostró una mayor usabilidad para un público general que no tuviera ninguna experiencia previa con la tecnología pero sí con el trabajo de oficina.
La visión de Kay fue fundamental no sólo para el desarrollo de las GUIs sino para el diseño de ordenadores portátiles y tablets, llegando a impulsar el proyecto Un ordenador para cada niño.
Hoy en día, las interfaces gráficas están presentes en ordenadores personales, dispositivos móviles, coches, electrodomésticos, gafas de realidad virtual o aumentada, y todas aquellas superficies que presenten una pantalla.
Además de la interacción mediante teclado y ratón, pueden ser táctiles, dirigidas por el movimiento del cuerpo, por la voz (interfaces de voz), incluso mediante actividad neuronal (a estas últimas se las conoce como interfaces cerebro-máquina).
Cuando las interfaces gráficas se combinan con modos de interacción alternativos, tendremos una interfaz multimodal.
Características de las interfaces gráficas
- Las GUI son interfaces son muy difíciles de automatizar, pero no imposible, existen formas de registrar y reproducir macros como una secuencia de interacciones concreta.
- Las GUI no son interfaces fácilmente portables.
- Las GUI permiten al usuario explorar y descubrir su funcionamiento.
- Las GUI permiten percibir mucha información en poco tiempo.
- Las GUI son adaptables y personalizables.
- Las GUI son más fáciles de usar para personas que no tienen experiencia previa con el dispositivo.
Voice User Interfaces (VUI)
Las interfaces de voz (VUI) son aquellas que permiten la interacción mediante el habla y, más concretamente, mediante el uso del lenguaje natural.
Este tipo de interfaces responden a la interacción emitiendo una respuesta igualmente cercana al lenguaje natural de la persona. Aunque los dispositivos hardware donde se ubican pueden permitir otro tipo de respuestas visuales, llegando incluso a combinarse con interfaces gráficas en un modo de interacción multimodal, el feedback y el affordance suelen comunicarse mediante sonidos y/o desde la propia conversación.
Las interfaces de voz permiten una interacción muy natural y, por tanto, intuitiva, ya que las personas que interactúan con ellas no tienen que aprender nada nuevo, sólo deben expresarse como lo harían habitualmente con otra persona.
Sin embargo, el desarrollo de estas tecnologías ha tenido sus dificultades en cuanto a las capacidades de entendimiento (adaptación al hablante) y su capacidad de respuesta (satisfacción).
Las interfaces de voz, no obstante, han demostrado una enorme eficacia y accesibilidad, permitiendo ofrecer información concisa a preguntas concretas y facilitando el acceso a dicha información a personas que por sus características o su contexto no pueden manipular una pantalla o no están cerca del dispositivo.
Características de las interfaces de voz
- Las VUIs permiten usar lenguaje natural, por tanto, la curva de aprendizaje es casi inexistente para personas que hablan el idioma que entiende el dispositivo.
- El descubrimiento de acciones (lo que se puede hacer) está limitado a la conversación y no puede anticiparse con facilidad.
- La respuesta está limitada al uso del lenguaje y de los sonidos que deben ser aprendidos dentro de un contexto.
- La capacidad de entendimiento de las VUI está limitada a los datos usados para entrenarla.
- La eficiencia para la búsqueda de información es muy alta, no así para la navegación o exploración.
Virtual Reality/Augmented Interfaces (VR/AR)
Las interfaces de realidad virtual (VR) y las de realidad aumentada (AR) son un tipo de interfaz que permiten a las personas interactuar en un entorno tridimensional. Esto genera una experiencia inmersiva donde se permite la interacción con objetos tanto físicos como virtuales dentro de un espacio físico real que se transforma digitalmente en un escenario virtual.
La gran diferencia entre la realidad virtual y la aumentada, es que la primera es una interfaz completamente virtualizada mientras que la segunda es una interfaz donde las personas aún pueden percibir el espacio físico tal cual es.
Las interfaces de VR/AR crean nuevos desafíos en su diseño, ya que requiere entender y tener en cuenta cómo funciona un espacio en tres dimensiones. Además, por su carácter inmersivo, hace que cualquier falta de sincronización entre los movimientos físicos de la persona y los objetos virtuales que percibe (incluido el sonido) y lo que ésta espera que suceda, provoque mareos y disonancia cognitiva.
Características de las interfaces de realidad virtual/aumentada
- Las interfaces VR/AR permiten una inmersión total dentro de la experiencia.
- Las interfaces VR/AR pueden aumentar la carga cognitiva ya que la atención puede tener que dividirse entre los estímulos físicos y virtuales.
- Las interfaces VR/AR sólo pueden presentarse en entornos físicos controlados.
- Las interfaces VR/AR son más dadas a la multimodalidad y por tanto a más modos alternativos de interacción.
- Puede existir cierta falta de naturalidad dependiendo de cómo el dispositivo usado proyecte la cámara que permite ver el mundo virtual.
- Las escalas, movimientos y proporciones virtuales deben ajustarse al mundo físico.
- La curva de aprendizaje es reducida dada la naturalidad con la que se utilizan los movimientos físicos del cuerpo.
- La satisfacción de su uso es elevada mientras no provoque disonancias ni mareos.
Multimodal User Interfaces
“Any exchange between a device and a human being where multiple input or output modalities may be used simultaneously or sequentially depending upon context and preference.” - Design beyond devices, Cheryl Platz, 2020
Las interfaces multimodales son aquellas que permiten la interacción alternativamente desde múltiples dispositivos de entrada y salida (de las máquinas) y a través de múltiples sentidos (de las personas).
Este tipo de interfaces son muy comunes en entornos de realidad virtual y aumentada, pero también en dispositivos integrados en el hogar (asistentes de voz con pantalla), automóviles (con control por voz y pantalla táctil) o videojuegos.
Es menos común en aplicaciones webs, móviles o de escritorio, que están mucho más dirigidas por la vista y mediadas por ratón, teclado y manipulación táctil en exclusiva.
Sin embargo, desde la entrada de la inteligencia artificial generativa y recientes publicaciones de soluciones que permiten interpretar de forma masiva imágenes, textos, vídeos y audios de forma simultánea, la multimodalidad se está haciendo más viable tecnológicamente hablando en esos entornos, lo que permite también un desarrollo de interfaces multimodales más eficaces.
Eficiencia
Las interfaces multimodales han demostrado ser más eficientes que las unimodales.
En el experimento “Touch? Speech? Or Touch and Speech? Investigation multimodal interaction for visual networking and analysis” publicado por Ayshwarya Saktheeswaran, Arjun Srinivasan y John Stasko, analizaron cómo interactúa la gente con una red de información donde se conectan puntos (nodos) creando relaciones entre ellos.
Se les hizo un test de usuario donde se les pidió que realizaran cierto tipo de tareas.
Cuando se les pedía buscar información en concreto, localizar un nodo o un camino: usaban la voz principalmente. Cuando se les pedía explorar o entender cómo relacionaban esos nodos: usaban la interacción táctil sobre la pantalla. Y para filtrar y buscar conexiones usaban ambas interacciones casi por igual.
La satisfacción final era siempre positiva ya que permitía a la gente elegir entre alternativas de interacción para cada tarea.
Accesibles
Las interfaces multimodales son también más accesibles ya que amplían los contextos de uso y se adaptan mejor a las capacidades de cada persona y el contexto donde sucede la interacción.
En esta charla, explico mejor las oportunidades que ofrecen y qué cosas debemos tener en cuenta para diseñar interfaces multimodales.
Member discussion