UTLAI PUNTO DOC

 

Nº 22 --- julio 2004

 

UNA APROXIMACIÓN AL USO DEL RECONOCIMIENTO DE VOZ CON EL LECTOR DE PANTALLA BASADA EN EL USUARIO

 

Traducido por: Rafael Gómez Márquez

 Correo electrónico: duneska@terra.es

 

 

2004 Conference Proceedings

 

El artículo original se encuentra en:

http://www.csun.edu/cod/conf/2004/proceedings/155.htm

 

Ponentes Karen McCall, M.Ed.

Karlen Communications

Adaptive Technology and consulting Practice

Phone: 905-510-6014

Website:

http://www.iprimus.ca/~martha/

Email:

martha@iprimus.ca

 

Estracto

 

A medida que los lectores de pantalla y el software de reconocimiento de voz evolucionan, se hace más fácil integrar las tecnologías para usuarios que necesitan soluciones mixtas.

Este artículo muestra las tecnologías y discute las técnicas para unas mejores prácticas.

 

Introducción

 

En el pasado, la gente confundía el reconocimiento de voz con la lectura de pantalla.

Llevar a cabo el deseo de que las computadoras “le hablen a uno” es bastante atractivo cuando estamos perdiendo la visión, somos ciegos o deficientes visuales.

Tradicionalmente, se ha descrito por los usuarios como un medio para no tener que aprender a usar el teclado.

Aunque aún no estamos en el punto en el que podemos esperar una experiencia total de manos libres combinando el reconocimiento de voz con la lectura de pantalla, las dos tecnologías están trabajando juntas de una forma más colaborativa.

WindowsEyes de GW Micro trabaja junto con Dragon NaturallySpeaking;

JAWSde Freedom Scientific puede trabajar por sí solo o en combinación con JawBone de Next Generation Tecnology.

Sabiendo que las tecnologías trabajan con una colaboración más estrecha, el siguiente paso está en cómo valora el usuario la tecnología mixta.

Aprender a usar el reconocimiento de voz añade otro ámbito de la competencia de la computadora a la base de conocimientos del usuario.

¿Qué clase de destreza necesita este usuario para poder utilizar esta tecnología mixta??

¿Hay un mejor proceso de prácticas para aprender el uso de los conocimientos del ordenador, los del lector de pantalla y los del reconocimiento de voz?

¿Cuáles son las ventajas e inconvenientes que se pueden esperar de estos usuarios que utilicen estos múltiples niveles de tecnología?

Este artículo está enfocado al uso de Dragon NaturallySpeaking con la tecnología de lectura de pantalla.

El Via Óbice de Ibm será discutido como la herramienta alternativa al reconocimiento de voz.

La ventaja sobre Dragon NaturallySpeaking Profesional es la mayor variedad de usuarios con discapacidad que pueden utilizar el producto. NaturallySpeaking tiene más apoyo de teclado y un mayor nivel de adecuación mediante la creación de macros.

El proceso empieza con el análisis de las necesidades.

Éste se fragmenta en las tareas de la vida diaria que el usuario necesita realizar;

Las tareas académicas que necesitan hacerse y tareas de tiempo libre que el cliente pudiera querer realizar.

Un componente del análisis de necesidades es el de las habilidades cognitivas y coordinadoras del usuario.

Éste incluye una habilidad para entender y trabajar con plataformas de Windows XP, así como una habilidad para mantener puntos de referencia y focos dentro de la aplicación en la que el usuario esté trabajando.

Un tercer componente capital es la capacidad del usuario para actuar con el software de reconocimiento de voz.

En ocasiones, el software de reconocimiento de voz tiene dificultades con algunas voces debido a su tono, formas de hablar, perceptibilidad y la habilidad para crear frases y estructuras mediante el dictado y la revisión en lugar de tecleando y comprobando.

Mientras tecleamos, podemos hacer una pausa para reflexionar; Mientras dictamos, puede haber una tendencia a perdernos en pensamientos o en el documento.

Estos aspectos necesitan ser especificados en el proceso de valoración.

El usuario debe de ser capaz de crear un archivo de voz y trabajar con el software de voz en el mismo a un nivel somero.

 

Valoración

 

La valoración comienza con una “entrevista” con el usuario.

Esto puede hacerse mediante el teléfono o en persona.

Si la entrevista se realiza en persona, sería estupendo que hubiese un ordenador disponible con la misma tecnología adaptada que utiliza el usuario, o que, más probablemente, pueda usar.

Hay tres niveles de competencia en el aprendizaje de utilizar el reconocimiento de voz con la lectura de pantalla, o la tecnología de la ampliación de pantalla para esa materia.

El usuario debe ser capaz de demostrar unos conocimientos básicos del ordenador en términos del uso del mismo. Esto debe hacerse en la entrevista inicial cuando se hable con el usuario.

En esta entrevista, se tratará de averiguar la habilidad de ordenar pensamientos sin lápiz, papel u ordenador.

Una fortaleza bocal sostenida se requiere para el reconocimiendo de voz.

El usuario necesitará también ser capaz de hablar alto, sin gritar, y claro al micrófono.

Uno de los beneficios de usar el reconocimiento de voz para cualquier persona es que las obliga a enunciar y pronunciar palabras como deberían ser en lugar de mantener hábitos de habla descuidada, tales como palabras arrastradas, acabar palabras de forma prematura, tartamudeos tales como: “ya sabes, como como”, jerga o perdona mis orejas, el ordenador toma cualquier palabra o sonido.

Los buenos modelos de habla nos evitan el redactar.

Durante esta entrevista, es una buena idea que el usuario demuestre su habilidad con el ordenador.

Si el usuario ha utilizado un ordenador antes, debería tener un cierto nivel de manejo.

Si no ha usado un ordenador, es fácil crear un tosco archivo de voz y enseñar al usuario unas tareas básicas para valorar su habilidad para trabajar con el ordenador.

Si está disponible un lector de pantalla, una somera evaluación del usuario para equilibrar las tres tecnologías se puede examinar, pues el reconocimiento de voz no es para todos.

No es una solución para no querer escribir.

Esta primera entrevista debería durar incluso más de dos horas si se hace con el equipamiento del ordenador.

En este punto, un asesor no busca unir una herramienta a una tarea, sino que busca una habilidad para usar y combinar tecnologías.

Una vez que el asesor tiene una idea de la habilidad del usuario para combinar tecnologías, una valoración más formal debe ser acordada.

Ese es el momento de asociar una herramienta a una tarea asociada por el usuario.

Este es también el momento para establecer los logros por los que se puede medir el éxito de un usuario una vez que éste ha utilizado el equipamiento durante seis meses.

El asesor ya tendrá una lista de actividades y, durante la valoración formal, el usuario puede realizarlas para asegurar una habilidad para hacerla satisfactoriamente..

 

Entrenamiento

 

El entrenamiento es un componente capital para el uso del reconocimiento de voz con la lectura de pantalla.

Es un componente vital en el uso de cualquier tecnología adaptada en un sistema informático.

Los usuarios intentan equilibrar y combinar el sistema operativo de Windows con un lector de pantalla y una herramienta de reconocimiento de voz.

Esto significa que hay tres cosas que pueden “ir mal” cuando el usuario recibe un mensaje de error, ¿cuál de las tres cosas está dando el error? La resolución de problemas es parte integral del entrenamiento.

Si el usuario requiere el apoyo técnico de un amigo o un miembro de su familia, ese amigo o miembro de la familia debería estar presente durante el entrenamiento.

Un usuario debería estar en su propia casa y con su propio sistema para el entrenamiento.

Si el equipamiento debe ser usado en un colegio o lugar de trabajo, se le debería dar tiempo para que se familiarice con el antes de llevarlo al colegio o lugar de trabajo.

El instructor debería crear un vitae que le permita al usuario trabajar con la computadora, el lector de pantalla y el software de reconocimiento de voz.

Aunque una lección pueda parecer caótica y autónoma, un instructor debe ser capaz de desmenuzar las habilidades para asegurarse de que el usuario es capaz de enseñar todas las capacidades durante una lección antes de seguir adelante.

Se debe animar a los usuarios también a crear nuevos archivos de voz conforme se vayan familiarizando más con la tecnología.

Muchos usuarios creen que una vez que su archivo de voz ya se crea, ya se han “hecho con él” y piensan que no necesitan crear otro.

Durante la creación del archivo de voz, es útil revisar el texto con un usuario.

Aunque el ordenador no se preocupa por si las cosas tienen sentido, lo leemos para la comprensión y leer las palabras por separado, siempre da como resultado un proceso de creación de un archivo de voz más largo y usuarios frustrados y confundidos.

Sin entender lo que están leyendo, por qué lo están leyendo, los usuarios no logran una conexión con la tecnología de reconocimiento de voz.

Están en efecto, siguiendo instrucciones sin tener acceso a la representación visual que los usuarios que no usen lector de pantalla tienen.

Asegurarse de que un usuario trabaja a su propio ritmo, es también una parte importante del proceso.

El entrenamiento no debería durar más de dos horas por sesión y hacerse una o dos veces por semana, dependiendo del nivel de conocimientos que tenga el usuario de la computadora.

Los usuarios necesitan tiempo para usar y practicar con la tecnología así que darles un día de aprendizaje y después dejarlos por sí solos resulta un fracaso.

¡Los usuarios también necesitan tareas!, los usuarios tienen que mandarles ejercicios para que refuercen todo lo que han aprendido durante una sesión de entrenamiento.

 

Sumario

 

Es importante que los usuarios se sientan unidos a la tecnología.

Es también muy importante unir la herramienta a la actividad.

La entrevista introduce al usuario en una tecnología de la que puede sólo haber leído algo o haber visto una demostración.

Habérsele explicado la tecnología por alguien que tiene conocimientos en los tres estratos de las habilidades informáticas necesitadas para dominar la tecnología que trabajan de forma coordinada siempre les da a los usuarios una visión más realista de la tecnología.

Es una buena oportunidad para que el usuario y el instructor determinen si el reconocimiento de voz es una buena solución.

Una valoración más profunda determina y refina así como define el uso de la tecnología.

Le proporciona al usuario una mejor comprensión del trabajo llevado a cabo al usar un ordenador, un lector de pantalla y una tecnología de reconocimiento de voz.

En el entrenamiento, están abandonados y condenados al fracaso usando el reconocimiento de voz con la lectura de pantalla.

Un complejo equilibrio de habilidades cognitivas.

Tener un programa y unos ejercicios con los que trabajar entre sesión y sesión, es un componente clave.

Durante todo este proceso, una buena relación de trabajo entre el asesor y el usuario es vital.

El asesor puede dar su punto de vista e información acerca de cómo el usuario se aproxima a la tecnología, y dónde están las áreas más fuertes o débiles.

La valoración es, después de todo, el marco de trabajo para el entrenamiento.

Crea las metas, los objetivos y los resultados que medirán los éxitos de los usuarios.

La colaboración entre el asesor y el usuario es tan importante como la del sistema operativo, el lector de pantalla y el reconocimiento de voz.

 

Fuentes de consulta

ANU Administration and support Services [Australian National University], "A Quick Guide to the Training Process for Voice Recognition"

http://www.anu.edu.au/disabilities/atproject/Guide to Training VR.htm

Closing the Gap Forums: Voice Recognition Assessment for Dummies,

http://www.closingthegap.com/cgi-bin/ultimatebb.cgi?ubb=forum;f=76;t=

Georgia Assistive Technology Project, Assistive Technology Resources [checklists and assessment tools]

http://gpat.org/AT resources_1.htm

Karlen Communications, Computer Literacy Checklist, Writing Aids Checklist - Screen Readers

http://www.iprimus.ca/~martha/tutorials.htm

National Centre to Improve Practices in Special Education, Update on Speech Recognition,

http://www2.edc.org/NCIP/VR/VR_Bob.html

Next Generation Technologies,

http://www.ngtvoice.com/products/software/jawbone/

 

 

Si has llegado a este artículo a partir de un mensaje de correo electrónico, pulsa alt+f4 para cerrar esta ventana y volver a él.

Si lo estás leyendo a través de la red, desde aquí puedes:

 

Volver al nº 22 de la revista

Volver a la web de UTLAI