|
ELIETTE ANGEL V.
Marge habla un perfecto
inglés, corrige si uno pronuncia mal y es muy expresiva.
Es una excelente tutora.
El punto es que Marge
es una dinosaurio (¿sauria?).
Ronald Cole es su padre.
La concibió en el Centro de Investigación para el
Lenguaje Hablado de la Universidad de Colorado (EE.UU.) para enseñarles
a los niños y jóvenes con dificultades para hablar
y leer.
Cole vino a Chile la
semana pasada a visitar a su contraparte chilena, el profesor Néstor
Becerra Yoma, coordinador del Laboratorio de Procesamiento y Transmisión
de Voz (LPTV) del Departamento de Ingeniería Eléctrica
de la Universidad de Chile.
Es parte del acuerdo
de cooperación que existe entre la National Science Foundation
(NSF), de Estados Unidos, y la Comisión Nacional de Investigación
Científica y Tecnológica (Conicyt), de Chile.
Marge, junto a varios
otros tutores, es un ejemplo de interfaz hombre-máquina audiovisual.
Es decir, que el computador puede interactuar con las personas:
escucharlas - reconocimiento de la voz- y responderles mediante
un agente visual, es decir, Marge.
Terapia digital
Cole trabaja hace 25
años con estas tecnologías. En 2001 recibió
US$ 14 millones ($10.150 millones) para desarrollar el Proyecto
del tutor de lectura, un software educacional gratuito.
La razón de
ser del programa es bien práctica: una cosa es que los niños
sepan leer y escribir, y otra muy distinta es que lo hagan realmente
bien.
La educación
personalizada es la mejor solución para que esos pequeños
y jóvenes superen sus dificultades. Pero un profesor por
niño es muy caro. No así un PC con un software que
apoye la labor del docente.
Cole, además,
cree que los pequeños se involucran más con un tutor
virtual - que puede ser escogido entre distintos modelos- porque
se asemeja más a un videojuego que a una clase convencional.
El sistema es bien
entretenido. El programa identifica a los estudiantes con problemas.
Luego, el tutor va guiando y corrigiendo a los chicos los que pueden
ir creando sus propios cuentos: graban su voz y marcan las distintas
caritas - como los emoticons- que quieren que vaya poniendo su tutor
mientras cuenta su historia.
Este tipo de tecnologías
está basado en la arquitectura Gallaxy II que desarrolló
la Darpa, la Agencia de Proyectos de Investigación Avanzada
en Defensa, donde partió la internet hace más de 30
años.
En la arquitectura
de Gallaxy II pueden funcionar hasta ocho elementos como el reconocedor
de voz, el sintetizador de la voz, la base de datos y el conductor
de diálogo.
Pero en el caso de
las interfaces audiovisuales, como la que desarrolla Cole, se agregan
otros elementos, como el tutor.
La iniciativa de Cole
no es la única del laboratorio de Colorado.
La fonoaudióloga
Lorraine Olson Raming cuenta que el 89% de las personas con Parkinson
tienen dificultades para hablar. Por eso aplica la interfaz por
voz para ejercitar a estos pacientes mediante un software que carga
en una Palm.
El programa le da un
ejercicio a la persona. Por ejemplo, diga Aaaaaaaaa (bien fuerte).
El software reconoce y mide la voz del paciente, que la mayoría
de las veces no logra igualar la intensidad del ejemplo. Entonces
el sistema le dice que no lo está haciendo bien y lo motiva
para que lo siga intentando.
Según Lorraine,
este sistema es un apoyo al trabajo de rehabilitación del
fonoaudiólogo y permite que el paciente ejercite en su hogar.
Como el software de
Cole ni el de Lorraine son muy conocidos, ambos profesores vinieron
a nuestro país, para motivar a la gente a buscar más
aplicaciones, de mejor calidad y más baratas. Una gran oportunidad
para el laboratorio de la Universidad de Chile que, por el momento,
trabaja con interfaces por voz. Aunque Becerra Yoma aclara: La tecnología
es la misma, la aplicación es la distinta.
En internet
Artículo sobre
interfaz de voz de noviembre pasado:
www.emol.com/noticias/documentos/interfaz.asp
El laboratorio de Colorado:
cslr.colorado.edu/index.html
El laboratorio de la
U. de Chile:
www.die.uchile.cl/LPTV
|