El español: segunda lengua romance en la Red
Aparece el nuevo estudio de FUNREDES

 

José Antonio Millán

1x1c3.gif (41 bytes)
 

 

Datos 2005:

inglés alemán francés español
45,0% 7,00% 5,00% 4,50%

El francés crece más que el español y por primera vez supera a nuestra lengua.

EE.UU. produce más páginas en español que Argentina o México

Nicaragua y Cuba: las cifras más altas de productividad en español.

García Márquez, Almodóvar, Dalí  y Mafalda, las presencias hispánicas más destacadas en cultura.

 

La métrica de las lenguas en la Red

La Web pública es un objeto de estudio abierto a todos (por definición). En una red dominada inicialmente por el inglés, los hablantes de otras lenguas con pujanza cultural pronto intentaron descubrir cuál era su posición (Millán, 1997).

Los primeros estudios se desdoblaron en dos aspectos, los cuantitativos y los cualitativos. Desde el punto de vista cuantitativo interesaba ver qué cantidad de páginas había en cada lengua. Cualitativamente, importaba ver la presencia de determinados elementos de una cultura en las páginas web de distintas lenguas. El pionero de ambos estudios fue Daniel Pimienta, desde la Fundación Redes y Desarrollo (FUNREDES, 1996a y b), inicialmente para el español y el francés (en relación con el inglés), y que hoy en día abarca (con el apoyo de Unión Latina: http://www.unilat.org/ y de la Délégation générale à la langue française: http://www.culture.gouv.fr/culture/dglf/) las otras lenguas romances y además el alemán. El catalán ha estado ausente de estas medidas, porque Unión Latina se ocupaba sólo de las lenguas oficiales de los estados miembros (este año acaba de adherirse Andorra) y porque (a pesar de las reiteradas invitaciones) ninguna institución catalana ha requerido hasta ahora la colaboración de FUNREDES.

Para el estudio cuantitativo, que es el que nos ocupará, Pimienta utilizó inicialmente el buscador Altavista y un algoritmo de reconocimiento de lenguas (mediante palabras exclusivas de cada lengua) para determinar las cifras totales (FUNREDES, 1996a). Estudios posteriores como el de Alis Technologies (1997), con el apoyo de Internet Society, utilizaron un muestreo muy pequeño de sitios.

Las medidas, más fiables, que se extraían utilizando buscadores generales tenían el problema fundamental de saber si el buscador indizaba la totalidad del espacio web, o si se centraba en el conjunto más antiguo de páginas, dando poca cuenta de las nuevas incorporaciones a la Web, y primando de esta manera las cifras de las páginas en inglés. (Para una perspectiva global de la situación en aquel momento de los buscadores con respecto a la totalidad véase Millán, 2000). El catalán —que se había iniciado en la Red muy tempranamente: Partal, 2004— acogió una iniciativa temprana para decir a los buscadores en qué lengua estaban sus sitios, mediante etiquetas meta (Yzaguirre, 1997), como forma de aumentar su visibilidad.

La evolución de los estudios con una misma metodología (los de FUNREDES) a lo largo de los distintos años ha conducido a refinar no sólo el uso simultáneo de varios buscadores y los procedimientos de cálculo, sino también las medidas absolutas, poniéndolas en relación con el número de hablantes y también con el numero de personas con conexión a la Red (productvidad de un espacio web) . Estos parámetros se pueden utilizar también para cada país, lo que proporciona una visión muy rica de comunidades geográficamente dispersas como la hispanohablante.

 

El español y las otras lenguas

Según el último estudio estudio, en vías de publicación y del que he recibido un adelanto provisional (Pimienta 2005), la presencia relativa del inglés no ha dejado de bajar desde 1998 (cuando tenía el 75% de la red) hasta el 45% en la actualidad. El resto de las lenguas estarían así:

Inglés Epañol Francés Italiano Portugués Rumano Alemán Resto
45,0% 4,50% 5,00% 3,00% 2,00% 0,15% 7,00% 35,00%

La novedad respecto a las cifras anteriores (2003) es que el español pierde el primer lugar de las lenguas romances frente al francés.

Éste es el resumen que aporta FUNREDES de los principales datos detectados:

El francés crece mas que el español y el portugués y pasa encima del español. Para el español y el portugués se confirma una parada en el fuerte crecimiento de los años pasados. El despertar tardío de Francia (y Belgica) parece explicar el auge del francés, ademas de una política voluntarista de la francofonía para la producción de contenidos. Los nuevos internautas de los países con fuerte penetración de Internet ya son mas consumidores que productores. Eso daría aun mas razón a una política de apoyo a la producción de contenidos. No aparece ninguna reducción de la brecha en Africa.

 

Producción de páginas en español

País % de páginas en español Productividad
ESPAÑA 47,7% 2,38
EEUU 14,3% 0,40 Sigue muy baja la productividad a pesar del crecimiento
ARGENTINA 10,6% 1,85
MEXICO 7,4% 0,53 Sigue baja la productividad
CHILE 3,9% 1,05
VENEZUELA 1,3% 0,71
PERU 1,0% 0,30
URUGUAY 0,8% 1,51

Recordemos que la productividad es la relación entre el número de internautas y el número de páginas producidas.

Es de notar el despertar de la producción de contenidos en español procedente de EEUU y la alza notable de Chile. España sigue estable y con una alta cifra de productividad. Las cifras más altas de productividad proceden de Nicaragua y Cuba. Una curiosidad: el dominio .PR de Puerto Rico aunque poco utilizado parece concentrar la producción de páginas en español de este estado asociado de EEUU.

 

Conclusión

Con casi una década de datos tal vez estemos en situación de aventurar evoluciones cuantitativas para las lenguas que se incorporan a la Red: inicios de crecimientos rápidos, seguidos de mesetas de estabilización. El inglés se estabilizó hace años, el español habría alcanzado ya una de esas mesetas y el francés estaría llegando a la suya. Pero para estas y otras muchas cosas es mejor esperar la publicación definitiva del último estudio de FUNREDES. Y en cuanto a los estudios cualitativos... véase el Apéndice inmediato:

 

Apéndice: presencia de personajes: culturas anglosajonas/neolatinas

Para la anécdota, estos indicadores sociológicos:

  • En "Ciencia" no hay cambios notables: Einstein y Marie Curie es la pareja más citada.
  • En "Letras" hay muchos más cambios. Descartes pasa a Victor Hugo y se instala en los cinco mas citados, en el orden: Shakespeare, Descartes, García Márquez (quien se transforma en el autor vivo más citado), Wilde y Tolkien.
  • En "Cine" sólo Depardieu y Almodovar compiten con la supremacia anglófona.
  • En "Artes" el trío ganador es: Dalí, Warhol, Khalo...
  • Para los personajes históricos, Napoleon gana 17 lugares y se coloca en cuarta posición detrás de Washington, Cristo y Jefferson, adelante de Lincoln, Franklin... y Bolívar.
  • Batman pasa bien encima de Satán y la Cenicienta hace su aparición entre los personajes imaginarios de cabeza... mientras Mafalda sigue subiendo.

 

Referencias

Alis Technologies (1997), "Palmarès des langues de la toile": http://alis.isoc.org/palmares.html

FUNREDES (1996a), "El primer estudio de las lenguas y la Internet": http://funredes.org/LC/espanol/L1.html

FUNREDES (1996b), "El primer estudio de la cultura y la Internet": http://funredes.org/LC/espanol/L1.html

FUNREDES (2005), "Observatorio de las lenguas y culturas": http://funredes.org/LC/espanol

Millán, J.A. (1997), "El español en las redes globales", en Actas del I Congreso Internacional de la Lengua Española. http://cvc.cervantes.es/obref/congresos/zacatecas/tecnologias/ponencias/millan.htm

Millán, J.A. (2000), "El libro de mil millones de páginas. La ecología lingüística de la Web", en Revista de Libros (Madrid), nº 45. Versión ampliada en la web: http://jamillan.com/ecoling.htm

Partal, V (2004), "El català a la xarxa: història i raons d'un cas d'èxit": http://www.softcatala.org/articles/article39.htm 

Pimienta, D. (2005), comunicaciónpersonal. El último estudio aparecerá también en http://funredes.org/LC/espanol/

Yzaguirre, Ll. (1997) "Indexem en catalá": http://www.iula.upf.es/altres/pub/indexem/indexem.htm

 

 

Una primera versión de este artículo se publicó el 21 de septiembre del 2005 en Thinkepi

Primera publicación en esta web: 11 de octubre del 2005

 

Creative Commons License
Este artículo está bajo esta licencia de Creative Commons:
Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Spain License..
y es reproducible citando el nombre del autor, José Antonio Millán, y la URL de origen.

salida