La IA ayuda en la preservación de lenguas indígenas
<![CDATA[
Aprender un idioma es una acción que en los últimos años se modificó con la tecnología, y ahora en mayor medida por la inteligencia artificial generativa , pues cambió el acceso a la información, la creación de contenidos y las herramientas de comunicación en múltiples lenguas. Un reciente informe elaborado por la firma de comunicación Llorente y Cuenca, en conjunto con BID Lab y Microsoft, abre esta conversación al analizar el desempeño de los modelos generativos en siete lenguas indígenas americanas. El diagnóstico revela tanto oportunidades inexploradas como serias advertencias. Según el documento, titulado El desempeño de la inteligencia artificial en el uso de lenguas indígenas americanas , los sistemas de IA más avanzados (como ChatGPT o Gemini) muestran un rendimiento deficiente cuando interactúan en lenguas originarias.
“Las respuestas generadas en estos idiomas suelen ser hasta cuatro veces más breves que sus equivalentes en español, con una puntuación promedio de apenas 2.4 sobre 10 en calidad expresiva, y 2.3 en comprensión”, apunta el informe. Además, detectó una tendencia sistemática a desviar las respuestas hacia referentes occidentales, incluso si la pregunta se formula en una lengua indígena. Es decir, la IA responde como si el mundo fuera monolingüe y monocultural, un sesgo relevante. En un contexto donde las tecnologías digitales se posicionan como intermediarios entre personas e instituciones, un modelo que no comprende la identidad cultural del usuario puede reproducir las lógicas coloniales que han negado históricamente la voz de los pueblos originarios. Yásnaya Aguilar, lingüista ayuujk y activista, señala que “el idioma no solo comunica, sino que construye el mundo”. Si una IA no puede comprender ni representar adecuadamente esa visión, está excluyendo de facto a cientos de personas. La Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura (Unesco) estima que cada dos semanas desaparece una lengua indígena, lo que supone la pérdida potencial de unas 3,000 lenguas únicas para finales de siglo.
Una IA que preserve, enseñe y conecte A pesar de estas deficiencias, el informe también plantea una visión optimista. Lejos de cancelar la IA, propone 21 estrategias para construir modelos más inclusivos y representativos. Entre ellas destaca la necesidad de incrementar el volumen de datos digitales en lenguas indígenas, desarrollar tecnologías de traducción y reconocimiento de voz, visibilizar influencers indígenas y proteger archivos digitales de tradiciones orales. Todo esto, articulado en colaboración con las propias comunidades, no como beneficiarias pasivas sino como agentes de diseño tecnológico. En un conversatorio que organizó Motorola con algunos artistas y autores de la lengua zapoteca, la estritora Irma Pineda señaló la relevancia de preservar la identidad de los pueblos originarios, pues más allá de un idioma, se trata de proteger una visión del mundo. Esta perspectiva que proponen en el estudio se alinea con los principios de la Década Internacional de las Lenguas Indígenas, impulsada por la Unesco, que subraya el papel de la tecnología como vehículo de preservación y transmisión intergeneracional. También conecta con experiencias de inteligencia artificial comunitaria, como el proyecto Masakhane en África, que logró entrenar modelos multilingües en decenas de lenguas africanas gracias a redes de colaboración descentralizada. En América Latina, iniciativas como Colmena Lab o el trabajo del Instituto Nacional de Lenguas Indígenas (INALI) en México avanzan en una dirección similar, aunque con menos apoyo de las grandes tecnológicas. “La IA puede ser una herramienta transformadora si se entrena con datos culturalmente diversos y si se incorpora la mirada de los hablantes en su diseño”, afirma César Buenadicha, jefe de Ecosystem Building en BID Lab. Uno de los hallazgos más contundentes del informe es la correlación del 91% entre el volumen de contenido digital en una lengua y el desempeño de la IA en ese idioma. En otras palabras: si no hay datos disponibles, la IA no puede aprender.
]]>