Google Scholar, el motor de búsqueda de publicaciones científicas, relega al final de la lista el 90% de los documentos que no están en inglés

Una investigación de la Universidad Pompeu Fabra publicada en la revista Future Internet revela que el buscador académico de Google, Google Scholar, relega los documentos que no están escritos en inglés a las posiciones más bajas de los resultados en las búsquedas, lo que, a efectos prácticos, los invisibilizan. El estudio está a cargo de Cristòfol Rovira, Lluís Codina y Carlos Lopezosa, del Departamento de Comunicación de la UPF,

Para que las publicaciones académicas de cualquier tipo tengan visibilidad, deben ser fáciles de encontrar en los buscadores. Por este motivo, en los últimos años se está extendiendo el uso del ASEO (Academic SEO, optimización de motores de búsqueda académicos), que comprende el conjunto de prácticas que ayudan a incrementar la visibilidad y la facilidad de acceso a las publicaciones académicas.

Los autores del estudio han analizado una muestra de 45 búsquedas de 1.000 resultados (un total de 45.000 documentos) de tres tipos: por autor, por palabras clave y por año de publicación. Para sus cálculos han utilizado una metodología de investigación de ingeniería inversa que se basa en el análisis estadístico de datos con el coeficiente de correlación de Spearman.

El estudio ha podido determinar que el idioma del artículo científico, ponencia o comunicaciones a congresos influye en el algoritmo de ordenación de los resultados de búsquedas en Google Scholar, es decir, se produce una discriminación por idioma.

Google Scholar discrimina artículos de calidad y con muchas citas

La calidad de las publicaciones académicas por lo general depende del prestigio de la revista que los publica y del número de citaciones, es decir, el número de veces que otros artículos hacen referencia a esta publicación. Los resultados del estudio confirman no solo que las publicaciones en idiomas que no sean el inglés quedan relegadas a posiciones más bajas, sino que esto es así aunque se trate de artículos de calidad que hayan recibido cientos de citas.

Los autores consideran que desconocer este hecho puede perjudicar a los investigadores de todo el mundo de habla no inglesa, ya que pueden llegar a creer que no hay artículos en su lengua materna cuando hacen búsquedas. Esto sucede, sobre todo, en las búsquedas por año de publicación, pero pasa incluso con palabras clave que no cambian independientemente del idioma, como siglas, marcas comerciales o compuestos químicos.

Mientras no se solucione este sesgo en el algoritmo de Google Scholar, cuyo funcionamiento interno no se conoce del todo, los autores de producciones académicas tendrán muchísimas más posibilidades de posicionarse si escriben en inglés.

REFERENCIA

Language Bias in the Google Scholar Ranking Algorithm