Un equipo de investigadores del Instituto
de Filología del CSIC y del ISYS
del Dpto. de Inteligencia Artificial de la Universidad Politécnica
de Madrid, en colaboración con especialistas europeos, trabaja en la
creación de un banco de datos para analizar, desde un punto de vista
crítico, lenguajes antiguos como el ugarítico o el fenicio.
Estas técnicas podrían utilizarse en cualquiera de los lenguajes
modernos.
Si alguien merece un monumento por sus aportaciones a la inteligencia artificial o simplemente a la inteligencia, es el inventor del alfabeto, aquél que hace 3.500 años fue capaz de pasar de un sistema de escritura silábica, que combinaba más de 350 signos con casi una decena de valores fonéticos cada uno, a un sistema alfabético, que con sólo 30 signos connotaba todos los fonemas de los que se componía su lengua, el ugarítico.
El "inventor" del alfabeto habitaba la región de Siria-Palestina allá por los años 1.500 antes de nuestra era y hablaba una lengua semítica, protofenicia. Es el precursor de la escritura, también alfabética, llamada fenicia, de la que provienen nuestros alfabetos modernos.
El alfabeto se utilizó por primera vez en escritura cuneiforme, es decir, en forma de clavo (del latín "cuneus"). Como soporte de la escritura se empleaban tablillas de barro cocidas al horno una vez inscritas. De ellas se encontraron más de 2.000 en la antigua ciudad de Ugarit (Siria), testimonios de la épica, mítica, jurisprudencia, correspondencia y de otros géneros literarios.
Hay que tener en cuenta que el autor de un texto, antiguo o moderno, ha recorrido un camino desde la primera idea creativa hasta el producto terminado, externo a él, que es el texto. Por el contrario, el lector parte del documento escrito, objeto que se ofrece a su comprensión. El lector tiene que ir reconociendo todos los códigos que consciente o inconscientemente ha utilizado el autor. Desde los códigos lingüísticos hasta los códigos históricos propios de la época en la que escribe y de la cultura a la que pertenece el autor. El lector al que nos referimos aquí es un lector crítico, entrenado para reconocer los códigos utilizados por el autor y probar que la descodificación, la interpretación, es correcta.
El camino crítico que conduce al re-conocimiento de un texto es bien conocido de algunos especialistas, en particular de aquellos que se dedican al estudio de documentos antiguos. En la reproducción artificial de la inteligencia, en su vertiente del lenguaje, se ha trabajado partiendo siempre de lenguas contemporáneas, p. e. inglés-ruso, de las que se conocen el diccionario y la gramática.
El intérprete de tablillas del II milenio a.C. está más cerca del ordenador ignorante porque no conoce de antemano las estructuras sintácticas de la lengua que interpreta y cuenta con pocas personas capaces de ayudarle en su búsqueda. A esos inconvenientes corresponden algunas ventajas.
El intérprete de tablillas avanza de forma escalonada hacia el reconocimiento del texto. Tiene que recorrer, durante su trabajo, la línea completa de la interpretación. Si le falla un solo eslabón, la interpretación correcta no se produce.
Nos pareció, pues, en la segunda mitad de los años ochenta, que las lenguas caídas en desuso, como el ugarítico, representaban un terreno nuevo y prometedor donde se podía intentar comprender la línea del proceso cognoscitivo-interpretativo en todas y cada una de sus fases y eslabones. La sistematización del circuito interpretativo del texto se denomina hermeneumática.
La palabra hermeneumática es un neologismo, formado mediante acronimia, con los componentes hermeneu (de hermenéu[tica] del griego hermeneuo, "interpret[ar]") y -mática (de [infor]mática). Significa, literalmente "interpretación informática", concentración semántica que designa la "automatización del proceso de interpretación".
La hermeneumática pretende alcanzar, como objetivo final, la automatización de todo el proceso de interpretación crítica de los textos. Ahora bien, llegar a la interpretación automática de un texto puede parecer, y por el momento lo es, una utopía. Nadie puede pretender en un futuro inmediato llegar a la interpretación automática, completa y perfecta del texto. Pero puede hacer camino al andar.
El objeto de la hermeneumática es la construcción de Bancos de Datos y la formalización de las reglas hermenéuticas, es decir, de las normas que utiliza el experto para relacionar los datos de su especialidad. Lo que da nacimiento a un Banco de Conocimientos.
La hermeneumática se desarrolla gracias a un trabajo interdisciplinar entre filología e informática. El objetivo primero es conocer cada uno de los pasos que forman parte de los sistemas expertos mentales que utiliza el filólogo. El informático juega el papel de espejo que devuelve al remitente filólogo su propio mensaje traducido a las posibilidades de la máquina. Bajo el impulso o la presión del informático, el filólogo va adquiriendo consciencia de que lo que él identificaba como una sola operación se descompone en realidad en múltiples pasos, todos concatenados entre sí Localizado cada paso en el trayecto del conocimiento, deberá ser formalizado por el informático.
Se detecta y describe primero y se formaliza después cada una de las etapas que componen el circuito hermenéutico o fase de re-conocimiento del texto, en sus mínimos detalles. En general, el especialista describirá como un sólo y único acto lo que en realidad son varios. No está acostumbrado a diseccionar cada uno de sus actos. Si los pasos que conducen a la comprensión de un texto están bien descritos y bien formalizados, el ordenador tiene que ser capaz de reproducirlos. Si no lo hace, es que el factor humano que ha analizado el circuito del re-conocimiento de un texto ha fallado. Se busca el error, se corrige y se prosigue en la búsqueda del circuito del re-conocimiento del texto, hasta que el ordenador sea capaz de reconocerlo íntegramente.
En realidad, el filólogo trabaja con sistemas expertos que ha ido creándose él mismo y que se encuentran en el ordenador de su cerebro. Un sistema experto es un sistema informático basado en el conocimiento de un grupo de especialistas en resolver un problema. Un sistema experto se compone de unidades de conocimiento y de un motor de inferencia (J. Cuena). En las unidades de conocimiento se almacena, mediante una representación adecuada, el saber y la experiencia profesional de los especialistas. El motor de inferencia es el que maneja estos conocimientos para resolver el problema.
Tres son los requisitos indispensables: a) una materia objeto de estudio recogida en un Banco de Datos que, a su vez, sirva de banco de pruebas; b) métodos de interpretación que hayan logrado resultados comprobados; c) especialistas capaces de describir y de formalizar los métodos de interpretación.
En el Instituto de Filología del CSIC, en asociación con el Grupo de Investigación de Sistemas Inteligentes (Intelligent Systems Research Group (ISYS)) del departamento de Inteligencia Artificial de la Universidad Politécnica de Madrid, y en colaboración con colegas franceses, italianos, etc. se está construyendo el prototipo del Banco de Conocimientos Filológicos. Se llama Banco de Datos Filológicos Semíticos Noroccidentales (BDFSN). El proyecto, concebido y dirigido por el Profesor Cunchillos, lleva ya casi una década trabajando en la informatización de las fuentes y en la interpretación automática de las mismas mediante herramientas de inteligencia artificial. El equipo a su cargo, tan internacional como interdisciplinar, divide su labor entre las diferentes lenguas semíticas noroccidentales. La tarea en curso se centra en las lenguas ugarítica, fenicia y púnica. La parte encomendada al grupo español del Instituto de Filología del CSIC, es la correspondiente a la lengua ugarítica, la más antigua y extensamente conservada. Se trata, precisamente, de la parte de la investigación más avanzada, por metodología y resultados.
BDFSN es un Banco de Datos que incluye conocimientos filológicos sobre una lengua semítica noroccidental: el ugarítico. La aplicación siamtu ii permite la introducción de datos filológicos, tratarlos y consultarlos navegando a través de las relaciones establecidas entre ellos. Del ugarítico se extenderá al fenicio, hebreo y dialectos palestinenses.
Hasta el momento hemos descubierto que el circuito hermenéutico o trayecto de reconocimiento de un texto antiguo se compone de las siguientes parcelas o unidades de conocimiento: 1) Contexto arqueológico con su correspondiente crítica arqueológica, 2) Contexto y crítica comparada lingüística, 3) Fonética, 4) Morfología, 5) Sintaxis, 6) Contexto literario y su correspondiente crítica literaria, tanto interna al texto mismo (estructura, estilística), como externa (literatura comparada), 7) Contexto y su correspondiente crítica histórica, tanto interna al documento, como externa (historiografía comparada), 8) Semántica. Cada una de esas unidades de conocimiento se compone de datos específicos y de normas que regulan la relación entre los datos. Las reglas hay que descubrirlas, describirlas y formalizarlas. Lo que ya se ha realizado en parte.
El Banco de Datos dispone en la actualidad de todos los textos conocidos en lengua ugarítica. El investigador puede acceder a cualquiera de los documentos (más de 1400, con imágenes digitales del original en curso de introducción, 6 por tablilla) y a cualquiera de las palabras atestiguadas (más de 6000). Puede conocer el número de veces y lugar exacto en el que aparecen, con contexto inmediato y estadísticas. Se trata de algo fundamental para establecer su significado. Puede ayudarse de un léxico con las opiniones de diferentes autores (y bibliografía adicional) sobre más de 6000 raíces, radicales y sintagmas, clasificados gramatical y semánticamente (antropónimos, teónimos, topónimos, sustantivos, pronombres, verbos regulares e irregulares diferenciados por su irregularidad, adverbios, preposiciones, conjunciones, interjecciones, etc.), a los que puede asignársele el campo semántico en el que intervienen.
Dispone de un analizador morfológico de palabras que permite encontrar
automáticamente la raíz/lexema, preformantes, prefijos, infijos,
terminaciones y sufijos de las palabras, incluidas las de estructura más
complicada. La herramienta sustituye a los ejercicios que todo semitista ha
tenido que llevar a cabo durante los tres primeros años de su especialización.
Alcanza, incluso, niveles que sorprenderán al más avezado especialista.
Al analizar las palabras aparecen en la pantalla todas las opciones, incluso teóricas, lo que puede significar una ayuda inestimable para el especialista del más alto nivel al desvelarle la existencia de palabras provenientes de una raíz que él estimara no atestiguada, o al contrario, análisis que el especialista no hubiera deducido en un primer momento, pero que son perfectamente correctos. El analizador es utilizable, con pocas variantes, para otras lenguas. El analizador morfológico está conduciendo a los investigadores hacia un analizador etimológico del que se han puesto las primeras bases.
Las siguientes fases continuarán con el análisis sintáctico, semántico, contexto histórico, etc. Se está perfeccionando el entorno K. S. M., Knowledge Structure Manager, manejador de estructuras cognitivas, en el que es posible inducir modelos computables de los datos que conoce el experto en interpretación de textos antiguos.
Esos modelos, llamados modelos del Conocimiento, son abstracciones informáticas de los Sistemas Expertos del investigador, es decir, del fondo teórico, de las reglas heurísticas y del método de aplicación del experto. La aplicación pretende ser flexible y aplicable, más tarde, a las lenguas modernas.
Cada una de las etapas que recorremos, cada producto informático, herramienta, sistema experto o entorno, podrá ser mejorado con la intervención de otros especialistas, más competentes en el contenido de alguna de las unidades de conocimiento antes mencionadas. Para añadir esa mayor sabiduría, el segundo colega ya no tendrá que recopilar toda la información, sino dar las instrucciones precisas que podrán incorporarse al entorno informático.
Durante el trayecto se pueden ir construyendo herramientas que sustituyan parte del trabajo que actualmente realiza el investigador de manera repetitiva. Herramientas abiertas que puedan siempre mejorarse.
Crear
Bancos de Datos, dotados de un sistema de gestión (Base de Datos) con
aplicaciones propias a cada especialidad, ése es el presente que construyen
los hermenéumatas. Verter los conocimientos científicos en Sistemas
Inteligentes Fundados en el Conocimiento, ése es el futuro inmediato
que preparan los que se dedican a la hermeneumática.
Jesús-Luis
Cunchillos, en Fronteras de la Ciencia y la Tecnología, 12 (julio-septiembre
1996) p. 52-55.
Proyecto de Investigación "Banco de Datos Filológicos Semíticos Noroccidentales: Ugarítico, Fenicio, Púnico (PB 93-0107)
Financiación
del proyecto PB 93/0107:
DGICYT del Ministerio de Educación y Ciencia
Director de Investigación / Head Research:
Jesús-Luis Cunchillos Ilarri (CSIC-Instituto de Filología-Madrid)
Miembros del Proyecto:
Ý José Cuena Bartolomé (Univ.Politécnica de Madrid-Dpto: Inteligencia Artificial - ISYS)
Ana García-Serrano (Univ.Politécnica de Madrid-Dpto: Inteligencia Artificial - ISYS)
José-Ángel Zamora López (CSIC-Instituto de Filología-Madrid)
Paolo Xella (CNR-Istituto Civiltà Fenicia e Punica-Roma)
Sergio Ribichini (CNR-Istituto Civiltà Fenicia e Punica-Roma)
Diego Ruiz Mata (Universidad de Cádiz)
Carmen Pérez (Universidad de Cádiz)
Mª Paz García Bellido (CSIC-C.E.H.-Madrid)
Florence Malbran-Labat (CNRS-Paris)
Corinne Bonnet (Université Namur)
André Lemaire (EPHE, IVème Section-Paris)
Raquel Cervigón Moreno (Univ. Politécnica de Madrid - Facultad de Informática)
Joaquín A. Siabra Fraile (Univ. Politécnica de Madrid - Facultad de Informática)
Alberto Castro Chicharro (Univ. Complutense de Madrid)
El laboratorio de Hermeneumática tiene en marcha una serie, dentro de las publicaciones del Consejo Superior de Investigaciones Científicas donde, bajo el epígrafe "Banco de Datos Filológicos Semíticos Noroccidentales", se enmarcan obras de referencia y monografías. Ofrecemos a continuación la lista de las obras ya publicadas, según la clasificación del laboratorio. Para artículos en revistas científicas, obras divulgativas y otras publicaciones fuera de esta serie, véanse los currícula de los miembros del proyecto.
Obras publicadas:
Primera parte: datos ugaríticos
I.- Jesús-Luis Cunchillos y Juan-Pablo Vita, Textos Ugaríticos (TU), XXI + 906 páginas. Madrid 1993.
II.- Jesús-Luis Cunchillos y Juan-Pablo Vita, Concordancia de Palabras Ugaríticas en morfología desplegada (CPU), 3 volúmenes, XXII + 2786 páginas. Madrid 1995.
III.- Jesús-Luis Cunchillos, Raquel Cervigón, Juan-Pablo Vita, José Manuel Galán y José-Ángel Zamora, Generador de Segmentaciones, Restituciones y Concordancias (GSRC), CD-ROM, para Mac. Madrid 1996.
IV.- Jesús-Luis Cunchillos, Juan-Pablo Vita, José Manuel Galán y José-Ángel Zamora, Banco de Datos, GSRC - Internet. Febrero 1997 en Sapanu. Publicaciones en Internet del Laboratorio de Hermeneumática (http://www.labherm.filol.csic.es). Madrid 1997-...
Segunda parte: datos fenicios y púnicos
I. - Jesús-Luis Cunchillos y José-Ángel Zamora, Gramática Fenicia Elemental (GFE), XVI + 170 páginas. Madrid 1997.
Monografías
1. - Juan-Pablo Vita, El Ejército de Ugarit, XIV + 238 páginas. Madrid 1995.
2. - José-Ángel Zamora, Sobre «el modo de producción asiático» en Ugarit, XIV + 189 páginas. Madrid-Zaragoza 1997.
3. - José Manuel Galán, Cuatro Viajes en la Literatura del Antiguo Egipto, XII + 250 páginas. Madrid 1998.
4.- Jesús-Luis Cunchillos y Juan Pablo Vita, Introducción a la lectura crítica de documentos antiguos. Textos semíticos noroccidentales del II y I milenio a. C. Madrid 1998.