javier_rodriguez_panepica_redleonardo
Entrevista a Javier Rodríguez Molina, becario Leonardo en Humanidades

“Panépica va a permitir una lectura mucho más precisa del ‘Poema de mio Cid’ y otros textos de la épica primitiva hispánica”

FUNDACIÓN BBVA

Javier Rodríguez Molina, profesor titular del Departamento de Lengua Española y Teoría de la Literatura de la Universidad Complutense de Madrid, explica en esta entrevista los detalles de Panépica, una poderosa herramienta de investigación lingüística desarrollada gracias a una Beca Leonardo que integra por primera vez los textos principales de la épica primitiva castellana.

27 febrero, 2025

Perfil

Javier Rodríguez Molina

Pregunta.- ¿Qué es Panépica y cómo se estructura?

Respuesta.- Panépica es un proyecto de investigación centrado en los textos de la épica primitiva castellana: el Poema de mio Cid, el Cantar de Roncesvalles —poema sobre la heroicidad de Roldán en Navarra, del que se conservan un centenar de versos—, la Gesta de las Mocedades de Rodrigo —dedicado a la juventud de Díaz de Vivar— y el Epitafio épico del Cid, un poema de solo seis versos para la tumba del Cid que estuvo en el monasterio de San Pedro de Cardeña.

El objetivo del proyecto es triple. El primero es crear un corpus digital de los textos manuscritos que se conservan en diferentes bibliotecas, como la Biblioteca Nacional. Y no se presentan sin más, sino con un trabajo de etiquetado y lematización, operaciones lingüísticas que asignan a cada término una etiqueta gramatical y definen una serie de propiedades lingüísticas que luego permiten recuperar información de manera rápida y eficiente al hacer búsquedas en el corpus.

El segundo objetivo es crear un glosario, basado fundamentalmente en el Poema de mio Cid, el más largo de esos cuatro textos. Un glosario es una especie de diccionario centrado en un texto o en una serie de ellos, como es el caso de estas cuatro piezas épicas.

El tercer objetivo es integrar estas herramientas en una página web científica, pero también divulgativa, que permita a un público amplio acceder a este caudal de investigación e información sobre la épica castellana,  junto con enlaces y recursos de interés.

P.- ¿Por qué hacía falta un proyecto de este tipo?

R.- Aunque los textos épicos son conocidos y existen muchas ediciones, sobre todo del Poema de mio Cid,  faltaba, para empezar, un recurso que los  integrara en un único sitio, pues eso nos permite tener una visión de conjunto de todos ellos.

Pero hay otra razón aún más importante. Este tipo de obras se pueden estudiar como monumento literarios o como documentos. El Cid ha sido muy estudiado como monumento literario, pero su sustancia lingüística no ha recibido una atención similar y se ha avanzado comparativamente menos desde los estudios que realizara Menéndez Pidal hace 120 años. Faltaba un estudio lingüístico detallado que permitiera editarlos de una manera más precisa, construir un glosario actualizado —no hay nada posterior al vocabulario que realizó Pidal— y responder a algunas preguntas que siguen abiertas sobre su fecha y lugar de composición. Y, en fin, para comprender un texto literario lo primero es comprender la lengua en la que está escrito, por lo que el proyecto va a permitir una lectura mucho más precisa de estas obras épicas.

P.- Panépica es un proyecto en curso. ¿Qué está concluido y cuáles son los próximos avances?

R.- Ya se puede encontrar el Poema de mio Cid entero: de cada página presentamos la imagen correspondiente del manuscrito, con su transcripción paleográfica (que vierte directamente el original) y una presentación crítica, es decir, una interpretación que hace que el texto sea legible y se pueda trabajar con él: regulariza las grafías, expande las abreviaturas, introduce puntuación, tildes, signos de interrogación… En las ediciones en papel, estos tres niveles de información -manuscrito, transcripción paleográfica, edición crítica- están dispersos, mientras que en la web está unificada y con un simple clic se puede ver cada folio del manuscrito tanto en la fotografía del original como con las dos formas de transcripción.

Para El Cid también está concluido ya el trabajo lingüístico, pues todo el texto está etiquetado: a cada una de las palabras que aparecen se le ha asignado una etiqueta gramatical e información detallada: por ejemplo, si es un sustantivo, el género, el número y el tipo de nombre que es. El texto está, asimismo, lematizado, es decir, cada término está asignada a un lema, que es la forma de la palabra que encabeza el paradigma y que hace que “amaba” o “amaré” se vinculen en un diccionario al infinitivo “amar”, que es como la buscamos.

La aplicación práctica de esta tarea es que permite recuperar con una simple búsqueda y en menos de un minuto información que antes requería una indagación manual que llevaba días. Por ejemplo, puedo pedir al buscador que me facilite todos los topónimos que aparecen en el poema, o todos los adverbios de manera…

Este es uno de los logros diferenciales de este proyecto, pues la mayoría de los corpus sobre textos antiguos —como el CORDE, de la Real Academia Española— no están lematizados ni etiquetados y eso hace, a veces, difícil trabajar con ellos desde el punto de vista lingüístico. En cambio, herramientas más modernas como las que usamos en Panépica permiten recuperar esa información gramatical y sintáctica con búsquedas sencillas y eficientes. Hay que pensar, además, en el valor que la información, por ejemplo, sobre los topónimos tienen para otras disciplinas.

Toda esta parte de la edición está ya en abierto para el Poema de mio Cid y próximamente se podrá consultar para los otros tres poemas.

P.- ¿En qué estado se encuentra el glosario?

R.- El glosario tendrá unas 1.600 entradas, pero es la siguiente etapa que podremos mostrar al visitante de la web. Cuando empezamos el proyecto nos dimos cuenta de que para tener un buen glosario era preciso terminar primero la tarea de edición de los textos, es decir, el corpus digital, que estamos a punto de concluir. Ahora mismo, en la sección de Glosario presentamos algunos términos con los que es posible hacerse una idea del tipo de análisis que ofrecerá, pero queremos sacarlo cuando esté completo, en lugar de entregas parciales.

P.- La investigación que estás llevando a cabo para la construcción del glosario, ¿ha generado hallazgos de alcance?

R.- Es pronto para exponer hallazgos, pero uno importante consistirá en poder afinar la fecha de los manuscritos que conservamos, que son copias de originales perdidos. Para el caso del Poema de mio Cid en la actualidad se discute si el códice es de finales del siglo XIII o de comienzos del XIV.

Otro aspecto de interés es la ubicación dialectal del texto, que da pistas relevantes sobre el lugar donde su compuso a través del análisis como la gramática o las grafías que se utilizan en los manuscritos. Las principales hipótesis sobre las que hay que precisar sitúan la redacción del texto bien en la zona de Soria, bien en Burgos o bien en la frontera entre Soria y Guadalajara.

Por otra parte, al hacer un glosario surgen aportaciones de interés sobre la historia de las palabras, cuyo significado y riqueza se amplía. “Camello” se entiende hoy como un animal de dos jorobas, pero históricamente e incluso para muchas personas en la actualidad puede incluir al dromedario, como así ocurre en el cantar del Cid. “Escaño” hoy es un banco de madera que se asocia principalmente al asiento parlamentario, pero en el Cid vemos que tiene una acepción que se refiere a un pequeño banco para subirse a las camas y otra que alude a un lecho bajo en el que se recostaban las personas, acepciones que no registran los diccionarios, como el Diccionario de la lengua española de la RAE.

Una vez que esté completo el glosario no solo se entenderán mejor estos poemas épicos, sino que habrá muchísima información que los diccionarios generales podrán utilizar para rectificar definiciones, etimologías, acepciones…

P.- ¿Qué distingue a Panépica respecto a otras plataformas digitales sobre la figura del Cid?

R.- Es el primer recurso en el que toda la información sobre los textos épicos está en el mismo sitio y la primera  edición pensada desde el principio para un medio digital. Por eso permite un triple acceso a los textos respaldado por un tratamiento lingüístico a cuyos detalles se puede acceder con solo clicar en cada palabra. Ningún otro soporte tiene el texto completo del Cid etiquetado y lematizado como está en Panépica.

Desde un punto de vista técnico, Panépica utiliza la plataforma informática TEITOK, que es bastante reciente y está pensada sobre todo para textos documentales como cartas o documentos notariales, pero nunca se había utilizado para textos literarios. Panépica es el primer corpus literario editado con esta plataforma y no hay ningún texto literario del español que tenga un tratamiento lingüístico y técnico tan profundo como el que le hemos dado nosotros y en ese sentido creo que va a ser también un modelo para la edición digital.

P.- ¿A qué público o públicos va destinada la web?

R.- Es un público amplio. El primero es la comunidad investigadora, que incluye a lingüistas, historiadores de la lengua e historiadores de la literatura. Pero su destinatario potencial es cualquier que quiera acercarse a estos textos, desde estudiantes de secundaria hasta público general

P.- ¿Qué nuevos desarrollos tendrá la plataforma?

R.- El pasado mes de diciembre obtuvimos un nuevo proyecto del programa Generación del Conocimiento, del Ministerio de Ciencia, Innovación y Universidades para ampliar Panépica a otros textos en prosa de la Edad Media, como el Cantar de los siete infantes de Salas o la Crónica particular del Cid. Esta nueva financiación de 69.000 euros nos permitirá etiquetarlos, lematizarlos y hacer crecer el proyecto a lo largo de los próximos cuatro años, con la incorporación de nuevos investigadores.

 

Accede al archivo de Σ