Javier Valenzuela Manzanares, Universidad de Murcia, España Según un reciente estudio, las lenguas tienen un mecanismo que regula la velocidad de transferencia de información. Así, las lenguas que tienden a hablarse más lentamente suelen también ser “informacionalmente más densas”, es decir, a condensar en pocos elementos lingüísticos una gran cantidad de información, y viceversa. Existe, pues, un equilibrio entre velocidad de habla y densidad informacional, que hace que la tasa de transferencia de información de las distintas lenguas sea aproximadamente la misma.
Imagínese a un típico alemán hablando de manera natural en su idioma; las palabras surgen a una determinada velocidad. A continuación, haga lo mismo con un hablante italiano. ¿A cuál de los dos se imagina hablando más rápido? Si se basa en el estereotipo presente en nuestra cultura, la respuesta será que al hablante italiano: en nuestra percepción, los hablantes italianos tienden a hablar a toda velocidad (y gesticulando mucho). Esa misma percepción tienen los ingleses de los hablantes españoles: para ellos el hablante típico español es el equivalente sonoro de una metralleta disparando ráfagas de palabras. Si las distintas velocidades en producción de sonidos fueran emparejadas con una mayor o menor velocidad en la transferencia de información, bien podría pasar que al traducir una película italiana de dos horas, con su acelerado ritmo lingüístico, al más pausado alemán, esa película pasara en su versión doblada a durar tres horas, por ejemplo. Claramente, no es éste el caso, así que debe de haber algún mecanismo en las lenguas que mantiene la tasa de transferencia de información aproximadamente constante, al margen de la velocidad con que sus hablantes encadenen sonidos.
Este asunto es que el que han analizado los investigadores de la Universidad de Lyon François Peregrino, Christophe Coupé y Egidio Marsico, en un estudio cuyos resultados han sido publicados recientemente en la revista Language (2011). Empezaron tomando como material veinte textos del corpus multilingüe MULTEXT, originalmente escritos en inglés británico y traducidos de manera libre a siete idiomas (francés, alemán, italiano, español, japonés, y chino mandarín), intentando en la medida de lo posible que el contenido semántico se mantuviera intacto. Los textos, de unas cinco oraciones semánticamente conectadas, eran informes orales formales, pequeñas narraciones, o instrucciones de corte más informal (p.ej., un texto describía una situación en la que se pedía comida por teléfono). A continuación, estos textos fueron analizados por expertos nativos, que contaron el número de sílabas de cada uno, además del número de palabras. Seguidamente, los textos fueron grabados por una serie de hablantes nativos (entre seis y diez, dependiendo del idioma), que los leyeron a una velocidad considerada “normal”, ni muy apresurada ni tampoco excesivamente cuidadosa.
El siguiente paso fue medir la “densidad informacional” de cada lengua, es decir, decidir cómo de “comprimida” está la información al ser codificada en la señal hablada. Como se puede asumir que la cantidad de información de los distintos textos es la misma (al ser un mismo texto traducido a distintos idiomas), es relativamente sencillo calcular esa “densidad informacional” de cada idioma; en este caso, utilizaron el número de sílabas para hacer este cálculo. La idea era comprobar si existen lenguas “informacionalmente densas”, que expresan una cantidad dada de información con pocos elementos lingüísticos, frente a lenguas “informacionalmente ligeras”, o “poco densas”, que necesitarán una mayor cantidad de elementos lingüísticos para expresar esa misma cantidad de información, y valorar su relación con la tasa de producción de sílabas.
[caption id="attachment_348" align="aligncenter" width="590"] Tabla 1[/caption]
Los resultados indicaron que las lenguas que se hablaban más rápidamente eran también las menos densas informacionalmente; y al contrario, las lenguas de ritmo más lento eran también las que contenían una mayor densidad informacional. Por ejemplo, de la muestra analizada, el japonés es la lengua de habla más rápida, en la que se pronuncia un mayor número de sílabas por segundo (7,84), como indica la Tabla 1; sin embargo, su densidad de información es también la más baja (0,49). Igualmente, el español es también muy rápido en su pronunciación (7,82 sílabas por segundo) y de nuevo, tiene una densidad de información bastante baja (0,63). Comparadas con el español, lenguas como el inglés (6,19 sílabas por segundo) o el alemán (5,97 sílabas por segundo) son más lentas, pero compensan este hecho con densidades informacionales de las más altas. Finalmente, el idioma más lento de los analizados, el mandarín, con tan sólo 5,18 sílabas por segundo, es también el de mayor densidad informacional. En la Figura 1 se puede observar que no sólo la ordenación de las lenguas en estas medidas se ajusta a la hipótesis, sino que existe una clara relación lineal entre ellas. Si se observa la tasa media de velocidad de información (cuarta columna de la Tabla 1), vemos que casi todos los idiomas oscilan alrededor de los mismos valores (cercanos al 1).
[caption id="attachment_349" align="aligncenter" width="835"] Figura 1[/caption]
Estos resultados muestran un mecanismo de las lenguas desconocido hasta ahora: su tendencia a modular la tasa de transferencia de información. Una posible explicación de este “termostato informacional” podría ser que las lenguas deben mantener unos valores de transferencia de información dentro de unos límites que garanticen una comunicación máximamente eficiente: lo suficientemente rápida para que la información transmitida sea útil, y al mismo tiempo lo suficientemente lenta para no incurrir en costes comunicativos (hablar excesivamente deprisa podría complicar mucho la articulación de determinados sonidos, así como la decodificación perceptual de la señal, entre otros problemas).
Este estudio no es más que una primera aproximación y sus resultados serán sin duda refinados en futuros trabajos (cuando se incorporen nuevas lenguas al estudio, un mayor número de hablantes, o se usen datos de contextos conversacionales, más naturales que la lectura de textos), pero sus datos apuntan al descubrimiento de un nuevo mecanismo regulador en las lenguas. Gracias a él, no existirían unas lenguas más eficaces que otras: todas mantienen una tasa de transferencia de información aproximadamente equivalente.
Imagínese a un típico alemán hablando de manera natural en su idioma; las palabras surgen a una determinada velocidad. A continuación, haga lo mismo con un hablante italiano. ¿A cuál de los dos se imagina hablando más rápido? Si se basa en el estereotipo presente en nuestra cultura, la respuesta será que al hablante italiano: en nuestra percepción, los hablantes italianos tienden a hablar a toda velocidad (y gesticulando mucho). Esa misma percepción tienen los ingleses de los hablantes españoles: para ellos el hablante típico español es el equivalente sonoro de una metralleta disparando ráfagas de palabras. Si las distintas velocidades en producción de sonidos fueran emparejadas con una mayor o menor velocidad en la transferencia de información, bien podría pasar que al traducir una película italiana de dos horas, con su acelerado ritmo lingüístico, al más pausado alemán, esa película pasara en su versión doblada a durar tres horas, por ejemplo. Claramente, no es éste el caso, así que debe de haber algún mecanismo en las lenguas que mantiene la tasa de transferencia de información aproximadamente constante, al margen de la velocidad con que sus hablantes encadenen sonidos.
Este asunto es que el que han analizado los investigadores de la Universidad de Lyon François Peregrino, Christophe Coupé y Egidio Marsico, en un estudio cuyos resultados han sido publicados recientemente en la revista Language (2011). Empezaron tomando como material veinte textos del corpus multilingüe MULTEXT, originalmente escritos en inglés británico y traducidos de manera libre a siete idiomas (francés, alemán, italiano, español, japonés, y chino mandarín), intentando en la medida de lo posible que el contenido semántico se mantuviera intacto. Los textos, de unas cinco oraciones semánticamente conectadas, eran informes orales formales, pequeñas narraciones, o instrucciones de corte más informal (p.ej., un texto describía una situación en la que se pedía comida por teléfono). A continuación, estos textos fueron analizados por expertos nativos, que contaron el número de sílabas de cada uno, además del número de palabras. Seguidamente, los textos fueron grabados por una serie de hablantes nativos (entre seis y diez, dependiendo del idioma), que los leyeron a una velocidad considerada “normal”, ni muy apresurada ni tampoco excesivamente cuidadosa.
El siguiente paso fue medir la “densidad informacional” de cada lengua, es decir, decidir cómo de “comprimida” está la información al ser codificada en la señal hablada. Como se puede asumir que la cantidad de información de los distintos textos es la misma (al ser un mismo texto traducido a distintos idiomas), es relativamente sencillo calcular esa “densidad informacional” de cada idioma; en este caso, utilizaron el número de sílabas para hacer este cálculo. La idea era comprobar si existen lenguas “informacionalmente densas”, que expresan una cantidad dada de información con pocos elementos lingüísticos, frente a lenguas “informacionalmente ligeras”, o “poco densas”, que necesitarán una mayor cantidad de elementos lingüísticos para expresar esa misma cantidad de información, y valorar su relación con la tasa de producción de sílabas.
[caption id="attachment_348" align="aligncenter" width="590"] Tabla 1[/caption]
Los resultados indicaron que las lenguas que se hablaban más rápidamente eran también las menos densas informacionalmente; y al contrario, las lenguas de ritmo más lento eran también las que contenían una mayor densidad informacional. Por ejemplo, de la muestra analizada, el japonés es la lengua de habla más rápida, en la que se pronuncia un mayor número de sílabas por segundo (7,84), como indica la Tabla 1; sin embargo, su densidad de información es también la más baja (0,49). Igualmente, el español es también muy rápido en su pronunciación (7,82 sílabas por segundo) y de nuevo, tiene una densidad de información bastante baja (0,63). Comparadas con el español, lenguas como el inglés (6,19 sílabas por segundo) o el alemán (5,97 sílabas por segundo) son más lentas, pero compensan este hecho con densidades informacionales de las más altas. Finalmente, el idioma más lento de los analizados, el mandarín, con tan sólo 5,18 sílabas por segundo, es también el de mayor densidad informacional. En la Figura 1 se puede observar que no sólo la ordenación de las lenguas en estas medidas se ajusta a la hipótesis, sino que existe una clara relación lineal entre ellas. Si se observa la tasa media de velocidad de información (cuarta columna de la Tabla 1), vemos que casi todos los idiomas oscilan alrededor de los mismos valores (cercanos al 1).
[caption id="attachment_349" align="aligncenter" width="835"] Figura 1[/caption]
Estos resultados muestran un mecanismo de las lenguas desconocido hasta ahora: su tendencia a modular la tasa de transferencia de información. Una posible explicación de este “termostato informacional” podría ser que las lenguas deben mantener unos valores de transferencia de información dentro de unos límites que garanticen una comunicación máximamente eficiente: lo suficientemente rápida para que la información transmitida sea útil, y al mismo tiempo lo suficientemente lenta para no incurrir en costes comunicativos (hablar excesivamente deprisa podría complicar mucho la articulación de determinados sonidos, así como la decodificación perceptual de la señal, entre otros problemas).
Este estudio no es más que una primera aproximación y sus resultados serán sin duda refinados en futuros trabajos (cuando se incorporen nuevas lenguas al estudio, un mayor número de hablantes, o se usen datos de contextos conversacionales, más naturales que la lectura de textos), pero sus datos apuntan al descubrimiento de un nuevo mecanismo regulador en las lenguas. Gracias a él, no existirían unas lenguas más eficaces que otras: todas mantienen una tasa de transferencia de información aproximadamente equivalente.