Percepción y accesibilidad

¿Reconocer la voz?

Martes, Diciembre 5th, 2006, por Joaquim Llisterri

Si alguien me llama por teléfono y reconozco su voz, sé de quién se trata, pero quizás no llegue a entender lo que me está diciendo por el ruido de la línea o por cualquier otro motivo. Las voces sirven, entre otras cosas, para identificar a las personas, igual que la cara o las huellas; el habla, en cambio, es un medio para comunicarnos, que empleamos para transmitir contenidos o cualquier tipo de información. Cuando un ordenador reconoce mi voz (voice) no hace otra cosa que verificar mi identidad, mientras que cuando reconoce el habla (speech) convierte una señal sonora en una representación que le permite, por ejemplo, escribir mis palabras en una pantalla o reservarme una entrada de cine. Por eso me resulta curioso que se siga empleando “reconocimiento de voz” cuando, en realidad, se quiere decir “reconocimiento del habla”. ¿Serán manías de lingüista?

Comparte o imprime artículo:Estos Áconos enlazan con webs de marcadores sociales que permiten a los lectores compartir y descubrir nuevas webs.
  • Blog Memes
  • del.icio.us
  • digg
  • fresqui
  • meneame
  • neodiario
  • YahooMyWeb
  • Enviar esta entrada por E-Mail
  • Imprimir esta entrada

Tags: ,

Lavadoras con voz

Martes, Noviembre 21st, 2006, por Joaquim Llisterri

Ya que estamos hablando de accesibilidad, esto es lo que he visto hoy mismo en una tienda de electrodomésticos de mi barrio en Barcelona (y en una zona que no es precisamente “alta” en ningún sentido). Da que pensar…

Lavadoras con voz (Barcelona, 21 de noviembre de 2006)

Comparte o imprime artículo:Estos Áconos enlazan con webs de marcadores sociales que permiten a los lectores compartir y descubrir nuevas webs.
  • Blog Memes
  • del.icio.us
  • digg
  • fresqui
  • meneame
  • neodiario
  • YahooMyWeb
  • Enviar esta entrada por E-Mail
  • Imprimir esta entrada

Tags:

to emote or not to emote

Lunes, Noviembre 13th, 2006, por Verschure Paul

One aspect of the interaction between humans and artefacts has become the issue of emotions. As Raquel Navarro points out robots (humanoid or not) - as the prototypical example of a futuristic artefact - have so far not been too convincing in generating emotions. For an example of current work you can take a look at the Kismet system (http://www.ai.mit.edu/projects/humanoid-robotics-group/kismet/) developed by Cynthia Braezeal (http://web.media.mit.edu/~cynthiab/). A more psychologically grounded approach towards the synthesis of emotional expresion is found in the work on Boldy and other animated talking heads by Dom Massaro (http://mambo.ucsc.edu/psl/dwm/). What is important in Dom’s work is that he addresses the issue of emotion in the context of communication. What is still missing in these approaches, however, is that we do not have a good understanding of how the human observer exactly interprets the emotions that can be generated by the facial expression and the prosodic cues of the synthetic head.

Now these questions can be addressed by exposing human subjects to these cues and to ask them how they interpret these cues. But here we enter the murky territory of psychological research. Murky because we have not guarantee that what humans will tell us is actually true. To circumvent this problem researchers are turning more and more to using tools from cognitive neuroscience in order to correlate behavior, subjective experience and states of the human brain. Hence, in the context of this blog, we see that humans themselves are still not that accessible by modern day science.

In our own research we have worried about this issue from the perspective of music communication. Music is a great medium for the communication of emotional states. We can all experience the impact of music on our emotional state. We often play music or attend a concert to be transported into a different subjective state. As part of a large interactive exhibit, called Ada (www.ada-exhibition.ch), we have investigated with Jonatas Manzolli of the Nucleus of Sound Communication of the University of Campinas in Brazil (www.nics.unicamp.br) how specific musical parameters lead to a specific emotional interpretation. The idea was that Ada – a 200 m^2 human accessible robot - could communicate with its 560.000 visitors how it “felt” about the world. Hence, Ada would communicate “anger” when it could not achieve specific goals such as grouping visitors. This illustrates an important issue in the context of accessibility: what do we want the emotional cues generated by humanoid robots and/or talking heads to exactly communicate? Are they puppets that express “emotions” at their surface that are decoupled from their inner working or is their goals, as in the case of Ada, they want to express? But in the latter case they should have goals to start with, from what are these goals derived? This means that the use of emotional cues only is meaningful when we are dealing with a technology that has goals. Hence, artefacts that do not induce an emotional state in the observer but that actively want to communicate with its users as part of their social environment. This seems a different game we should inspect in a following post.

Comparte o imprime artículo:Estos Áconos enlazan con webs de marcadores sociales que permiten a los lectores compartir y descubrir nuevas webs.
  • Blog Memes
  • del.icio.us
  • digg
  • fresqui
  • meneame
  • neodiario
  • YahooMyWeb
  • Enviar esta entrada por E-Mail
  • Imprimir esta entrada

Tags: Ninguno

Qué ocurre cuando el ordenador, el teléfono, o la tele puede expresar emociones

Martes, Noviembre 7th, 2006, por Raquel Navarro

Relacionado con el tema de la entrada anterior, pero desde otro ángulo, ¿qué ocurriría si un día los ordenadores/teléfonos/etc. pudieran no solo detectar sino reproducir emociones?

Bastantes investigadores están en la actualidad estudiando este tema y se han creado muchos robots que intentan imitar emociones:

Por ejemplo: “Feelix is a humanoid robot built out of LEGO, it reacts to tactile stimulation by changing its facial expression. It is capable of displaying anger, sadness, happiness, fear, and surprise”

http://www.daimi.au.dk/~chili/feelix/feelix_home.htm

Entre las propuestas que se están investigando sobre cómo podrían ayudar esta:

- Un sistema tutor que ayude a los estudiantes mediante el reflejo de las emociones percividas. http://affect.media.mit.edu/pdfs/06.burleson-phd.pdf

“The system realizes non-invasive multimodal realtime sensing of elements of user’s affective state and couples this ability with an agent capable of supporting learners by engaging in real-time responsive expressivity.”

- ayudar a personas autistas a interactuar con su entorno http://affect.media.mit.edu/pdfs/06.kaliouby-teeters-picard-bsn.pdf

“We propose the application of the social-emotional prosthetic to assist the growing number of individuals diagnosed with Autism Spectrum Disorder (ASD) in perceiving communication in a natural rather than a structured environment, bootstrapping their ability to learn and develop in social settings.”

Es fácil sonar con muchas más posibilidades…

¿Será este uno de los caminos para ayudar a la accesibilidad de las tecnologías?

Comparte o imprime artículo:Estos Áconos enlazan con webs de marcadores sociales que permiten a los lectores compartir y descubrir nuevas webs.
  • Blog Memes
  • del.icio.us
  • digg
  • fresqui
  • meneame
  • neodiario
  • YahooMyWeb
  • Enviar esta entrada por E-Mail
  • Imprimir esta entrada

Tags: Ninguno

¿Cómo sabe mi teléfono si soy feliz? (2)

Jueves, Octubre 26th, 2006, por Joaquim Llisterri

Continuando con el mensaje anterior, quizás sea útil ofrecer, a modo de ejemplo, algunas muestras - que no son, naturalmente, exhaustivas- de los logros en el reconocimiento automático de emociones alcanzados en España. (more…)

Comparte o imprime artículo:Estos Áconos enlazan con webs de marcadores sociales que permiten a los lectores compartir y descubrir nuevas webs.
  • Blog Memes
  • del.icio.us
  • digg
  • fresqui
  • meneame
  • neodiario
  • YahooMyWeb
  • Enviar esta entrada por E-Mail
  • Imprimir esta entrada

Tags: Ninguno

¿Cómo sabe mi teléfono si soy feliz? (1)

Jueves, Octubre 26th, 2006, por Joaquim Llisterri

Como muy acertadamente señalaba Antonio Rubio, el reconocimiento automático de las emociones del hablante a través de su voz es uno de los temas más candentes en el campo de las tecnologías del habla. También Olga Soler y Pilar Orero insistían en la importancia de detectar el estado de ánimo del usuario de un servicio –por ejemplo, el enfado-, algo que un operador humano puede llevar a cabo con relativa facilidad, pero que resulta extraordinariamente complejo para un ordenador.

Tengamos en cuenta, en primer lugar, que en una interacción telefónica tradicional –es decir, que no contemple la multimodalidad- los indicios que permiten reconocer un determinado estado del interlocutor se reducen a los que se encuentran en la voz. Bien es cierto que la sintaxis y el léxico también aportan información, pero tratarla requeriría desarrollar analizadores específicos de los que no siempre se dispone. (more…)

Comparte o imprime artículo:Estos Áconos enlazan con webs de marcadores sociales que permiten a los lectores compartir y descubrir nuevas webs.
  • Blog Memes
  • del.icio.us
  • digg
  • fresqui
  • meneame
  • neodiario
  • YahooMyWeb
  • Enviar esta entrada por E-Mail
  • Imprimir esta entrada

Tags: Ninguno

usabilidad o accesibilidad o diseño para todos?

Jueves, Octubre 19th, 2006, por Raquel Navarro

 

Hola a todos,

me parece que en los blogs anteriores se han mezclado dos temas que, si bien están relacionados, de hecho hablan de dos formas muy diferentes (incluso opuestas) de entender el mismo problema.

  • Por un lado, hemos hablado de la frustración con las nuevas tecnologías y como a veces parecen que están hechas para hacernos la vida más difícil, estamos hablando de hacer la tecnologías más fáciles de usar o “usabilidad” en general para todo el mundo. El tema de los interfaces de voz de calidad para mi, encajaría aquí (y el último punto también).
  •  Por otro lado, Pilar ha mencionado las “digital media accessibility” y tecnologías de “audiovisual translation”. En estos casos parece que estamos hablando de cambiar las tecnologías o contenidos para que los usuarios con discapacidad puedan acceder a contendidos como traductores del web (WAI), o subtitulación de los contenidos, como pelis, para sordos.
  • Además los investigadores y diseñadores en los últimos años hablan del concepto de “Design for all” (segun wikipedia: Universal design, which is related to “inclusive design” and “design for all,” is an approach to the design of products, services and environments to be usable by as many people as possible regardless of age, ability or situation). Es decir, no se trata de cambiar los “cacharros” y los contenidos sino que todo el mundo pueda usarlos desde el principio.

Muchas veces para alcanzar la usabilidad a un público determinado necesitamos acomodarlo a sus necesidades/contexto. Por otro lado parece que otros buscan que TODO  lo que se diseñe puede ser usado por TODOS. ¿Con qué nos quedemos? ¿podemos tenerlo todo? ¿deberíamos ir hacia universal design o herramientas que ayuden a convertir cosas en accesibles?

Hasta pronto.

Raquel

Comparte o imprime artículo:Estos Áconos enlazan con webs de marcadores sociales que permiten a los lectores compartir y descubrir nuevas webs.
  • Blog Memes
  • del.icio.us
  • digg
  • fresqui
  • meneame
  • neodiario
  • YahooMyWeb
  • Enviar esta entrada por E-Mail
  • Imprimir esta entrada

Tags: Ninguno

De la fonética a las máquinas que hablan

Viernes, Octubre 13th, 2006, por Joaquim Llisterri

Al igual que el resto de participantes en el blog, me presento, explicando cómo se llega a la accesibilidad desde la fonética.
Hay que reconocer que la fonética es una disciplina con una cierta mala fama, al menos entre los estudiantes de Filología. A menudo se confunde con el aprendizaje del Alfabeto Fonético Internacional, o con la enseñanza de una buena pronunciación al estilo del profesor Higgins en My Fair Lady. Lo cierto es que los conocimientos en fonética puede aplicarse a muchos campos y, uno de ellos, son las tecnologías del habla, es decir, las que se ocupan que mejorar nuestra interacción con los sistema informáticos mediante el uso del habla. El grupo del que soy responsable, formado por especialistas en fonética y en lingüística, ha colaborado con el Centre National d’Études des Télécommunications, Telefónica I+D, el Centro Studi e Laboratori Telecomunicazioni y con Loquendo en el desarrollo de sistemas de conversión de texto en habla en castellano, en catalán y en otras lenguas, y hemos trabajado también en proyectos relacionados con sistemas de diálogo como aTTemps, utilizado en la actualidad por el Servei Meteorològic de Catalunya (Temps per Telèfon). Con el paso del tiempo nos hemos ido dando cuenta de que una interfaz hablada bien diseñada pueder tener una importancia vital a la hora de utilizar un determinado servicio y de que, además de la tecnología, tienen que intervenir otros factores, muchos de ellos estrechamente relacionados con el uso del lenguaje, algo que se supone que los lingüistas conocemos bien.
Si tenéis curiosidad por saber más, aquí está mi página y aquí está mi blog.

Comparte o imprime artículo:Estos Áconos enlazan con webs de marcadores sociales que permiten a los lectores compartir y descubrir nuevas webs.
  • Blog Memes
  • del.icio.us
  • digg
  • fresqui
  • meneame
  • neodiario
  • YahooMyWeb
  • Enviar esta entrada por E-Mail
  • Imprimir esta entrada

Tags: Ninguno

De la psicología cognitiva a la accesibilidad o de la ciencia a la realidad

Miércoles, Octubre 11th, 2006, por Raquel Navarro

Lo que quería comentar en este blog es precisamente porque estoy en este blog. En una palabra por “frustración”; frustración con productos que salen al mercado y nadie sabe utilizar, frustración por todo el conocimiento acumulado durante los últimos 30 años que se queda en artículos científicos que nadie conoce. (more…)

Comparte o imprime artículo:Estos Áconos enlazan con webs de marcadores sociales que permiten a los lectores compartir y descubrir nuevas webs.
  • Blog Memes
  • del.icio.us
  • digg
  • fresqui
  • meneame
  • neodiario
  • YahooMyWeb
  • Enviar esta entrada por E-Mail
  • Imprimir esta entrada

Tags: Ninguno

¿Está la tecnología diseñada para ser útil o para hacernos sentir inútiles?

Martes, Octubre 10th, 2006, por Pilar Orero Clavero
english

Este documento es el punto de partida de nuestro blog. A menudo entraremos el mismo mensaje en inglés ya que nos interesa la opinión de las personas que se encuentran en otro contexto social y en otra realidad. Creemos que el poder ofrecer un blog bilingüe enriquecerá nuestra sección de “Percepción y accesibilidad”.

En la actualidad nos encontramos inmersos en la Sociedad de la Información. Tanto la palabra sociedad como información tienen significados complejos y el resultado de su combinación crea la situación en la que nos encontramos, donde el calificativo de compleja se queda muy corto con la realidad. (more…)

Comparte o imprime artículo:Estos Áconos enlazan con webs de marcadores sociales que permiten a los lectores compartir y descubrir nuevas webs.
  • Blog Memes
  • del.icio.us
  • digg
  • fresqui
  • meneame
  • neodiario
  • YahooMyWeb
  • Enviar esta entrada por E-Mail
  • Imprimir esta entrada

Tags: Ninguno

Sindicar Percepción y accesibilidad (RSS)