De la fonética a las máquinas que hablan
Al igual que el resto de participantes en el blog, me presento, explicando cómo se llega a la accesibilidad desde la fonética.
Hay que reconocer que la fonética es una disciplina con una cierta mala fama, al menos entre los estudiantes de Filología. A menudo se confunde con el aprendizaje del Alfabeto Fonético Internacional, o con la enseñanza de una buena pronunciación al estilo del profesor Higgins en My Fair Lady. Lo cierto es que los conocimientos en fonética puede aplicarse a muchos campos y, uno de ellos, son las tecnologías del habla, es decir, las que se ocupan que mejorar nuestra interacción con los sistema informáticos mediante el uso del habla. El grupo del que soy responsable, formado por especialistas en fonética y en lingüística, ha colaborado con el Centre National d’Études des Télécommunications, Telefónica I+D, el Centro Studi e Laboratori Telecomunicazioni y con Loquendo en el desarrollo de sistemas de conversión de texto en habla en castellano, en catalán y en otras lenguas, y hemos trabajado también en proyectos relacionados con sistemas de diálogo como aTTemps, utilizado en la actualidad por el Servei Meteorològic de Catalunya (Temps per Telèfon). Con el paso del tiempo nos hemos ido dando cuenta de que una interfaz hablada bien diseñada pueder tener una importancia vital a la hora de utilizar un determinado servicio y de que, además de la tecnología, tienen que intervenir otros factores, muchos de ellos estrechamente relacionados con el uso del lenguaje, algo que se supone que los lingüistas conocemos bien.
Si tenéis curiosidad por saber más, aquí está mi página y aquí está mi blog.
Tags: Ninguno









Sindicación

2006-10-16 a las 11.23 am
Es muy interesante la cantidad de investigación que parece ser que hay detrás de las tecnologías, y sin embargo la poca importancia que se le da a su aplicación, quiero decir a intentar explicar cómo utilizarlas y a hacer que sean útiles para la sociedad.
Otro problema que sucede a menudo, y que no tiene nada que ver con la tecnología o la usabilidad, es la traducción. ¿Cuántas veces me ha pasado que no puedo saber cómo funciona un nueva aparato porque sus instrucciones son incomprensibles?
Es una pena que haya una buena investigación y muy cuidadosa, como dice Joaquim, y sin embargo su aplicación es desastrosa.
2006-10-16 a las 11.19 pm
España es un caso típico al que se puede aplicar “tradutore” = “ traditore”. Muchos de los textos traducidos por estar tradicionalmente mal pagados se ralizan al vuelo y sin ser supervisados por un editor o especialista. Mejor tomar un manual en otro idioma, francés, inglés o alemán y se avanza mucho más
2006-10-17 a las 9.35 am
Es una pena, pero supongo que hasta que no se cuantifiquen las consecuencias económicas que tiene el no tener una buena documentación (en cualquier idioma), las empresas no dedicarán recursos a tener un buen equipo de redacción técnica y de traducción. Me consta que en algunos países eso se ha empezado a hacer…
2006-10-18 a las 10.42 pm
En efecto, el problema de redacción y traducción es muy interesante. Por motivos que desconozco cualquier persona con conocimientos mínimos se atreve a hacer una traducción. Los resultados son desastrosos. Lo mismo sucede con la redacción de las instrucciones. En ocasiones las instrucciones en el lenguaje original de redacción son incomprensibles, por lo tanto su traducción llega en ocasiones a ser imposible de entender.
Como dice Román, hasta que no haya un control de calidad, y un estudio que demuestre las consecuencias económicas me temo que seguiremos con instrucciones inverosímiles.
2006-10-19 a las 10.35 am
Al hilo del comentario inicial de Joaquim, me gustaría preguntar a los expertos si estamos ya en condiciones técnicas de incorporar la prosodia en la interacción persona máquina. Creo que los sistemas artificiales que nos “atienden” por télefono podrían ser más eficaces si detectaran la impaciencia o incluso la ironía en nuestra voz. Pido disculpas de antemano por mi ignorancia en este campo.
2006-10-20 a las 12.04 am
Al contrario Olga, yo creo que es un campo muy interesante porque sin duda las emociones que se pueden percibir por la voz son importantísimas.
Si las empresas que ofrecen servicios personales automatizados pudieran cuantificar las pérdidas por culpa de falta de reconocimiento de acentos, o de emociones, quizá se invertiría más en acelerar esta investigación que yo también creo que es muy necesaria.
Quizá Joaquim nos puede explicar lo avanzado que está este campo.
2006-10-25 a las 6.02 pm
Efectívamente, en un sistema automático de diálogo llega a ser importante detectar el enfado del usuario al detectar fallos de cualquier tipo en el funcionamiento del sistema. Y, como resulta lógico, hay muchos grupos de investigación intentando detectar automáticamente el estado emocional del locutor que accede a un sistema de reconocimiento automático. Aunque los resultados prácticos son aún modestos, estoy seguro de
2006-10-25 a las 6.06 pm
Decía que estoy seguro de que se llegará pronto a considerar la detección de emociones como un componente fijo de un sistema automático de diálogo
2006-11-24 a las 5.05 am
Tengo la fortuna de estar estudiando fonética y tecnologías del habla al mismo tiempo y, sin lugar a duda, de esta forma pude apreciar la aplicación práctica de la fonética en la vida moderna. Sorprendentemente, ahora, puedes llamar por teléfono con sólo mencionar en la bocina el nombre de la persona, sin necesidad de marcar el número; también existen traductoras que hablan, las cuales ayudan a la pronunciación del estudiante que quiere aprender otra lengua. Valgan estos breves ejemplos para mostrar el amplio futuro que le espera a la fonética, estarán de acuerdo conmigo.
Por otro lado, me gustaría saber qué tantos avances ha habido en cuanto a la tecnología del habla aplicada a personas que tiene alguna discapacidad física.
2006-11-24 a las 9.59 am
Por lo que veo, la fonética tiene un gran potencial por desarrollar en el plano de lo tecnológico, donde se complementan con igual grado de importancia la fonética y la tecnología para dar solución a las necesidades específicas del hombre actual como en el caso de la fonética forence.
Las posibilidaes de la fonética son infinitas hoy en día porque existe una multiplicidad de proyectos en los que se pone en práctica, ya que es una diciplina esencial para le avance tecnológico debido a que proporciona estudios de la realización del habla con la finalidad de que las máquinas la reproduzcan o la entiendan, por ejemplo, al darles una orden. Por todo esto, la fonética va adquiriendo más importancia e interés, se podría decir que es como una caja de grandes posibilidades y herramientas para la tecnología.
2006-11-24 a las 11.38 pm
Me interesan mucho las tecnologías del habla. Soy estudiante de fonética en la UNAM de México y tomo un seminario llamado Tecnologías del habla.
Es cierto lo que dice Joaquim. La fonética tiene mala fama, sin embargo aqui en México el problema es peor: la fonética casi no tiene fama; ni buena ni mala. Las grandes compañías de que yo he escuchado hablar están en Europa y en Estados Unidos; estamos rezagados en lo que a fonética se refiere y más todavía en lo concerniente a tecnologías del habla. En lo personal no tenía idea de las tan diversas aplicaciones de la fonética. Es una lástima, pero la mayoría de las personas nunca la tandrán y seguiremos consumiendo programas computacionales, aparatos telefónicos, etc, hechos en otros países.
Foros de discusión como este deberían ser más abundantes y tener más promoción para que más personas se interesen en la materia y nuestras opciones como estudiantes y nuestras opciones laborales se amplíen y ayuden a que nuestro país se desarrolle.
2006-12-02 a las 7.19 am
Creo que como todo lo desconocido o lo que no tiene un fin práctico inmediato la fonética tiene mala fama, sin embargo ésta ha ido desapareciendo poco a poco al ser aplicable al ramo de la tecnología, cosa que mucho aún creen imposible o, en el pero de los casos, inservible. Estoy de acuerdo que con una interfaz bien desarrollada se puede acceder a servicios o entender la tecnología, que cada vez es más elaborada. Pero hay que resaltar también el hecho de saber que lo sistemas informáticos que han sido desarrollados en base a la fonética sirven mucho a la hora de aprender un lenguaje extranjero (para la pronunciación), a personas con discapacidades física por medio de la voz (desarrollar programas para acciona una computadora, un televisor o, como en otro articulo de este blog, lavadoras, etc.) o bien incluso utilizarla en el reconocimiento de delitos (cuando aplican la tecnología y la fonética forense) sino a la hora de aprender el propio lenguaje. Me he topado con un juguete que co-participa en el proceso de desarrollo de lenguaje en niños, el cual reproduce los sonidos ya sea de vocales y consonantes tan cual los pronunciamos, no se si me explique, pero los niños ya no responden “efe” cuando se le muestra la imagen de la letra “f” sino reproducen el sonido labiodental fricativo sordo. Entonces ¿esta tecnología ya no solo va dedicada específicamente a elaborar programas sino a completar un desarrollo de las personas desde un principio? ¿Con esto la gente se interesará más en ver que la fonética está mas cerca que solo en un salón de clases?
2006-12-04 a las 12.36 pm
Conocer “algo” con lo que podamos dialogar, como especie. Qué cosa más divertida que hacer que una máquina hable como nosotros, entenderla y que nos entienda a la vez, pero antes que eso que pronuncie humanamente y reconozca nuestra pronunciación. A mi muy desvanecido juicio, para que pudiera hablar como nosotros, sería útil hacer una representación virtual de un aparato respiratorio en un ordenador, desde los pulmones, pasando por la garganta, esófago, cuerdas bucales, la boca (con sus determinadas características: lengua, dientes, concavidad del paladar, etc.), la nariz, y, como agregado, los labios, esto con el fin de hacer al ordenador pronunciar fonemas y consecuentemente palabras, y que suene como sonaría uno humano, podría hacerse un sistema con las variables que serían la respiración, la fuerza con la que se emite, la vibración de la cuerdas bucales, la libertad de expulsión de aire por la nariz, toda la fisiología del sistema respiratorio, dar un rango de longitud, anchura y grosor de la lengua (que es diferente en cada persona), concavidad del paladar, posición de los dientes, tamaño exterior de la boca, grosor de los labios, y después introducir la información de los posibles rangos de variación de cada fonema estereotípico (alófonos), en cada elemento, con ello y tomando en cuenta que la emisión-recepción de aire es continua y que la lengua junto casi todos los otros elementos son órganos o músculos que están en constante movimiento durante el ejercicio del habla, podría, a mi muy pobre y perdido juicio, ayudar a generar un sistema que reprodujera el habla humano con todo y continuum. Todo esto con el afán de aportar algo microscópico a este tema tan complejo que es el lenguaje.
2006-12-04 a las 2.58 pm
Considero que lo dicho por Luis Manuel es el gran reto de las tecnologías del habla, hacer que una máquina, que no tiene ninguna de las partes que constituyen el cuerpo humano, pueda comprender y reproducir nuestro lenguaje. En esa labor, la fonética tiene un papel fundamental, pues es sorprendente comprobar que el habla es tan libre y variada como lo es cada persona.
En mi opinión el problema de la fama (buena, mala, inexistente) de la fonética es, en primer lugar, que en México no existe una conciencia del idioma, no tenemos aprecio, ni orgullo de nuestra lengua y por lo tanto la ignoramos; de ahí que ni siquiera estemos concientes de la importancia que estudios aplicados como el de la fonética pueden llegar a tener.
El campo de las telecomunicaciones es una de las áreas que más se ha desarrollado y avanzado en últimas fechas, es necesario que se vea la importancia del estudio fonético y su correcta aplicación en áreas como esa, la gran mayoría lo desconoce o tiene una diminuta idea de ello.
Se debe concientizar a las personas que la fonética no sólo es una materia “rara” que llevan los estudiantes de letras, sino lo que producimos cada vez que hablamos, y al mismo tiempo difundir el trabajo que se está haciendo y lograr despertar el interés de más personas y de organizaciones que apoyen sus diversas aplicaciones. Porque sin lugar a dudas, aún queda mucho que conocer y hacer con lo que se refiere a tecnologías del habla.
2006-12-05 a las 4.54 am
El problema con la difusión de disciplinas relativas a las tecnologías del habla no se circunscribe al desconocimiento de los estudios fonéticos, ni a la negación de estos como algo productivo y útil a la sociedad; este es sólo un problema superficial que, hasta cierto punto, no es demasiado grave. El problema de fondo es el atraso en que se encuentran sumidos países que, como México, se caracterizan por presentar un perfil de desarrollo bajo, especialmente en todo lo que se refiere a tecnologías de cualquier tipo. Hay que recordar que la tecnología le pertenece a las urbes y que sus habitantes no representamos en México ni la mitad de la población total del país.
Intento decir que las lagunas teóricas son subsanables, mientras que las materiales no lo son tanto. No podemos esperar -si somos realistas- que las tecnologías del habla tengan una enorme difusión y reconocimiento público si, para empezar, el sector de la sociedad al que le son asequibles es reducido. De momento, creo que es la investigación más que la difusión lo que rendirá frutos en este nuevo campo de trabajo de la fonética porque así además de acrecentar nuestros conocimientos, será más factible dejar de importar las tecnologías que se hacen en otras latitudes. Aclaro que no estoy negando la utilidad de los espacios informativos, pero creo que por el momento no es posible pasar -con éxito- de ciertos límites en el rubro de la difusión.
Quiero finalizar con algunas preguntas: ¿las posibilidades de las tecnologías de habla son tan perfectibles que puedan llegar a suplir al interlocutor? ¿Qué tan cerca estamos de una verdadera inteligencia artificial? ¿Hasta que punto una maquina puede manejar implicaturas y otras cuestiones pragmáticas que son inherentes al diálogo (algo similar a lo que arriba se mencionaba acerca de las emociones captadas por el reconocedor de voz)?
2006-12-05 a las 7.56 am
Pienso que uno de los problemas de las tecnologías del habla a los que no se ha hecho referencia es el económico. Sin duda, es muy interesante el desarrollo de los reconocedores y sintetizadores de voz, además de ser útiles por realizar tareas que originalmente pertenecían al hombre. Sin embargo, creo que su uso masivo bien podría quedar limitado a países con una economía sólida y estable, en los que no tenga un impacto económico el hecho de sustituir el trabajo del hombre por el de una máquina. En naciones tercermundistas sería una verdadera dificultad reemplear a los trabajadores desplazados por la tecnología. ¿Es viable introducir plenamente este tipo de tecnologías en países subdesarrollados sin tener una grave repercusión económica?
2008-05-07 a las 2.13 am
malditos perros
2008-05-07 a las 2.15 am
Considero que lo dicho por Luis Manuel es el gran reto de las tecnologías del habla, hacer que una máquina, que no tiene ninguna de las partes que constituyen el cuerpo humano, pueda comprender y reproducir nuestro lenguaje. En esa labor, la fonética tiene un papel fundamental, pues es sorprendente comprobar que el habla es tan libre y variada como lo es cada persona.
En mi opinión el problema de la fama (buena, mala, inexistente) de la fonética es, en primer lugar, que en México no existe una conciencia del idioma, no tenemos aprecio, ni orgullo de nuestra lengua y por lo tanto la ignoramos; de ahí que ni siquiera estemos concientes de la importancia que estudios aplicados como el de la fonética pueden llegar a tener.
El campo de las telecomunicaciones es una de las áreas que más se ha desarrollado y avanzado en últimas fechas, es necesario que se vea la importancia del estudio fonético y su correcta aplicación en áreas como esa, la gran mayoría lo desconoce o tiene una diminuta idea de ello.
Se debe concientizar a las personas que la fonética no sólo es una materia “rara” que llevan los estudiantes de letras, sino lo que producimos cada vez que hablamos, y al mismo tiempo difundir el trabajo que se está haciendo y lograr despertar el interés de más personas y de organizaciones que apoyen sus diversas aplicaciones. Porque sin lugar a dudas, aún queda mucho que conocer y hacer con lo que se refiere a tecnologías del habla.
Pienso que uno de los problemas de las tecnologías del habla a los que no se ha hecho referencia es el económico. Sin duda, es muy interesante el desarrollo de los reconocedores y sintetizadores de voz, además de ser útiles por realizar tareas que originalmente pertenecían al hombre. Sin embargo, creo que su uso masivo bien podría quedar limitado a países con una economía sólida y estable, en los que no tenga un impacto económico el hecho de sustituir el trabajo del hombre por el de una máquina. En naciones tercermundistas sería una verdadera dificultad reemplear a los trabajadores desplazados por la tecnología. ¿Es viable introducir plenamente este tipo de tecnologías en países subdesarrollados sin tener una grave repercusión económica?