Un algoritmo descifra la gramática del sánscrito después de 2.500 años
Una página de una copia del siglo XVIII del Dhatupaha de Panini en poder de la Biblioteca de la Universidad de Cambridge.- CAMBRIDGE UNIVERSITY LIBRARY
Un estudiante indio de doctorado en la Universidad de Cambridge ha resuelto por fin un problema gramatical que ha frustrado a los estudiosos del sánscrito desde el siglo V a.C. El sánscrito es la lengua sagrada del hinduismo y hoy en día apenas es hablada por 25.000 personas.
El descubrimiento permite “derivar” cualquier palabra sánscrita -construir millones de palabras gramaticalmente correctas, como “mantra” y “gurú”- utilizando la venerada “máquina del lenguaje” de Panini —eminente gramático sánscrito de la India antigua—, considerada uno de los mayores logros intelectuales de la historia´.
Mientras investigaba su tesis doctoral, publicada ahora, Risi Rajpopat descifró un algoritmo de 2.500 años de antigüedad que hace posible, por primera vez, utilizar con precisión la “máquina del lenguaje” de Panini. El sistema de Panini —4.000 reglas detalladas en su obra cumbre, el Astadhyayi, que se cree fue escrito alrededor del año 500 a.C.— está pensado para funcionar como una máquina: introduce la base y el sufijo de una palabra y la convierte en palabras y frases gramaticalmente correctas mediante un proceso paso a paso.
Hasta ahora, sin embargo, había un gran problema. A menudo, dos o más de las reglas de Panini son aplicables simultáneamente en el mismo paso, dejando a los estudiosos en la incertidumbre sobre cuál elegir.
Resolver los llamados “conflictos de reglas”, que afectan a millones de palabras sánscritas, incluidas ciertas formas de “mantra” y “gurú”, requiere un algoritmo. Panini enseñó una metarregla para ayudarnos a decidir qué regla debe aplicarse en caso de “conflicto de reglas”, pero durante los últimos 2.500 años, los eruditos la han interpretado de manera errónea, lo que significa que a menudo terminaban con un resultado gramaticalmente incorrecto.
En un intento de solucionar este problema, muchos eruditos desarrollaron laboriosamente cientos de metarreglas más, pero Rajpopat demuestra que no sólo son incapaces de resolver el problema en cuestión (todas producen demasiadas excepciones), sino que además son completamente innecesarias.
Rajpopat demuestra que la “máquina del lenguaje” de Panini es autosuficiente.
Rajpopat afirmó en un comunicado: “Panini tenía una mente extraordinaria y construyó una máquina sin parangón en la historia de la humanidad. No esperaba que añadiéramos nuevas ideas a sus reglas. Cuanto más jugueteamos con la gramática de Panini, más se nos escapa”. Tradicionalmente, los estudiosos han interpretado la metarregla de Panini en el sentido de que, en caso de conflicto entre dos reglas de igual fuerza, gana la que viene después en el orden serial de la gramática.
Rajpopat rechaza esto, argumentando en su lugar que Panini quería decir que entre las reglas aplicables a los lados izquierdo y derecho de una palabra respectivamente, eligiéramos la regla aplicable al lado derecho. Empleando esta interpretación, Rajpopat descubrió que la máquina lingüística de Panini producía palabras gramaticalmente correctas casi sin excepciones. El sánscrito es una lengua indoeuropea antigua y clásica del sur de Asia. Es la lengua sagrada del hinduismo, pero también el medio a través del cual se han transmitido durante siglos gran parte de la ciencia, la filosofía, la poesía y otra literatura profana más importantes de la India. Aunque hoy sólo lo hablan en la India unas 25.000 personas, el sánscrito tiene una importancia política creciente en el país y ha influido en muchas otras lenguas y culturas de todo el mundo.
Rajpopat afirmó: “Parte de la sabiduría más antigua de la India se ha producido en sánscrito y aún no comprendemos del todo lo que consiguieron nuestros antepasados. A menudo nos han hecho creer que no somos importantes, que no hemos aportado lo suficiente. Espero que este descubrimiento infunda a los estudiantes de la India la confianza, el orgullo y la esperanza de que ellos también pueden lograr grandes cosas”. Una de las principales consecuencias del descubrimiento del Dr. Rajpopat es que, ahora que tenemos el algoritmo que ejecuta la gramática de Panini, podríamos enseñar esta gramática a los ordenadores.
Según Rajpopat, “los informáticos que trabajan en el procesamiento del lenguaje natural abandonaron los enfoques basados en reglas hace más de 50 años... Así que enseñar a los ordenadores a combinar la intención del hablante con la gramática basada en reglas de Panini para producir habla humana sería un hito importante en la historia de la interacción humana con las máquinas, así como en la historia intelectual de la India”.
La investigación se publica en la revista Apollo-University of Cambridge Repository.