Historia del Diccionario del Español de México

por Luis Fernando Lara

Cuando se trata de un diccionario, su historia no se puede desimbricar de la historia de sus autores. María Moliner, Paul Robert –iniciador de la gran tradición lexicográfica francesa de los diccionarios “Robert”– o Sir James Murray –quien dedicó toda su vida al Oxford English Dictionary– han dejado testimonios de la manera en que la elaboración de sus diccionarios determinó sus propias historias y del modo en que sus propias historias dejaron huella en los diccionarios. La historia del Diccionario del español de México tampoco puede separarse de la vida de sus autores y particularmente de la mía. Por eso le pido al lector que disculpe el entrelazamiento de historia personal e historia del diccionario que advertirá al comienzo de estas páginas. Corro el riesgo de que piense que tienen una finalidad autocelebratoria, pero espero que lo que cuento lo convenza de que, lejos de eso, mi objetivo es explicar no sólo la manera en que hicimos este diccionario, sino también sus avatares.   

Hay veces en que la fortuna, que es una diosa, se junta con la generosidad, que es una virtud. Cuando eso sucede, hay algunos que reciben, inmerecidamente, sus dones. Este es mi caso y este es el origen del Diccionario del español de México (DEM).

En algún momento de comienzos del año de 1972, don Antonio Carrillo Flores, antiguo secretario de Relaciones Exteriores, de Hacienda, embajador de México en Washington y, en ese entonces, director del Fondo de Cultura Económica, se encontró con el presidente de El Colegio de México, don Víctor L. Urquidi, y le expuso su inquietud, basada en su propia experiencia internacionalista, de que México no tuviera un diccionario propio, que correspondiera a su historia y a su cultura, como sí lo tenía Estados Unidos de América en la tradición de los diccionarios de Noah Webster, ese patriota de la época de fundación de su país, continuada por la casa Merriam-Webster, de Massachussets. Don Antonio Carrillo Flores notaba, como muchos mexicanos, hispanoamericanos e incluso españoles, que los diccionarios de la Academia Española no correspondían ni al estado actual de la lengua, ni mucho menos a la manera en que había evolucionado en cada región hispanohablante, arraigándose en sus propias experiencias históricas. De ahí que le preguntara si El Colegio de México sería capaz de emprender la elaboración de un diccionario que, a la larga, se convirtiera en un “Webster mexicano”. Don Víctor, cuya visión del futuro y cuya capacidad para imaginar nuevos ámbitos de investigación impulsó tantos estudios nuevos en El Colegio, pasó la pregunta a nuestro director del Centro de Estudios Lingüísticos y Literarios, mi maestro Antonio Alatorre.

Una tarde pasó Antonio por mi cubículo y me contó la inquietud de don Antonio Carrillo Flores y la pregunta de don Víctor Urquidi: “Dijo Carrillo Flores que si alguno de los ‘genios’ de El Colegio sería capaz de escribir ese diccionario. ¿Tú crees que puedas?”. Me quedé sorprendido, asustado y halagado y, quizá en pocos segundos, con una audacia temeraria, le contesté que creía que sí. Entonces me pidió que escribiera un dictamen, de unas cuantas páginas, acerca de la posibilidad de escribir el diccionario.

La fortuna me había dado cinco profesores que me habían formado y que me habían llevado a tener unas cuantas ideas acerca de la lengua española contemporánea y de su carácter mexicano: Antonio Alatorre y Margit Frenk, cuya concepción abierta y rica de la lengua española y cuya flexibilidad normativa se nos habían transmitido como estudiantes; Juan M. Lope Blanch, hispanista pero no españolista, quien había iniciado los estudios de geografía lingüística y dialectología en México; Klaus Heger, teórico de la semántica y de los primeros en tomar en serio el papel de la cuantificación y de la computación electrónica en lingüística; y Kurt Baldinger, antiguo colaborador de Walther von Wartburg en la elaboración del gran y todavía insuperado diccionario etimológico del francés Französisch Etymologisches Wörterbuch. Nunca imaginé, cuando cursaba con ellos materias y seminarios, que algún día podría conjuntar sus enseñanzas en la construcción de un nuevo diccionario.

El caso es que escribí el dictamen “Sobre la justificación de un diccionario de la lengua española hablada en México”, exclusivamente como un documento para Antonio Alatorre, don Víctor y don Antonio Carrillo Flores. Pocas semanas después, supe que don Antonio había presentado mi dictamen a la Junta de gobierno del Fondo de Cultura Económica y que invitaba a Antonio, a Lope Blanch y a mí, a desayunar en su casa. En el desayuno Lope Blanch sostuvo que un diccionario mexicano era irrealizable, pues había que tomar en cuenta que la Academia Española después de 250 años, era incapaz de ofrecernos un diccionario de la calidad del Webster, como lo deseaba Carrillo Flores. Antonio, cuidadosa y gallardamente, sostuvo en su intervención que Lope tenía muy buenos argumentos, pero que se trataba de comenzar una empresa de esa clase y que alguien tendría que hacerlo alguna vez. Finalmente me cedieron la palabra y defendí mi dictamen, temeroso de la reacción de Lope Blanch; también agregué que me era imposible saber cuánto nos tardaríamos, pues la historia de la lexicografía demuestra que todos los autores de diccionarios se han equivocado en sus cálculos. Don Antonio concluyó el desayuno ofreciéndonos hablar con el presidente de la república para que financiara el proyecto y agregó: “Por mis largos años de experiencia en el gobierno mexicano, le aseguro que ningún gobierno se atreverá a interrumpir el financiamiento de un trabajo como este”. El proyecto se dio a conocer hasta que se publicó en La Gaceta del Fondo de Cultura Económica en su número 19 de 1972, páginas 1 a 6. Las paredes oyen.

El presidente Echeverría nos concedió un fideicomiso con capital para cuatro años de trabajo. El Colegio alquiló un departamento enfrente de su edificio, en la calle de Guanajuato, y me dediqué a buscar colaboradores necesarios. Así se integraron Luz Fernández Gordillo y Carmen Delia Valadez, ambas egresadas también de El Colegio. Se agregaron a ellas dos alumnas del Centro: María Ángeles Soler y Paulette Levy. Invertimos parte del dinero en formar una biblioteca de obras de consulta y de libros y revistas especializados que nos pudieran ayudar a planear bien la investigación y la redacción del diccionario, también sirvió para que viajara yo a consultarlo con Kurt Baldinger, Paul Imbs (Director del Trésor de la langue française), Bernard Quemada (Director del Centro de Estudios del Vocabulario Francés, de Besançon), Alain Rey y Josette Rey-Debove (Director y redactora en jefe de los diccionarios Le Robert) y Jean Dubois (Director de lexicografía de la casa Larousse).

Al comienzo teníamos dos problemas centrales: cómo saber cuál era el vocabulario usado en el español de México y cómo reunirlo. La tradición lexicográfica mexicana de García Icazbalceta, Feliz Ramos i Duarte, Francisco J. Santamaría, Marcos E. Becerra y varios más era regionalista y prescriptivista. Es decir, sus diccionarios recogían sólo voces que se considerasen “indigenismos”, “vicios”, “barbarismos” y “solecismos” que se usaran en México y no en España o en otras regiones del mundo hispánico. Günther Haensch es el autor de la distinción entre “lexicografía diferencial”, la de la tradición de los regionalismos, y “lexicografía integral”, la de la tradición académica, hasta entonces sólo practicada por la Academia misma en España y con clara delimitación metropolitana. Lo que nosotros queríamos era, precisamente, un diccionario integral del español, basado en el uso mexicano, para corresponder a una lengua que, en México, está en el origen de nuestra nacionalidad y de nuestra cultura, sin negar la siempre deseada unidad del español y también sin menospreciar la rica actualidad de las lenguas indígenas.   

Diccionario del español de México. Vols. 1 y 2Así que teníamos que construir una base de datos que nos permitiera conocer el uso del vocabulario del español de México. Una base que registrara nuestra manera de hablar, que comparte con España e Hispanoamérica un gran porcentaje de vocablos, pero que tiene sus diferencias en el significado y en el uso, aun en vocablos muy comunes, para darle el reconocimiento que se merece. Lo mejor sería reunir una gran cantidad de textos y grabaciones para sacar de ellos imparcial y objetivamente, el vocabulario buscado. Pero ¿cuántos, cuáles y cómo? Sería imposible ponernos a leer nosotros mismos todo lo publicado y asequible e ir entresacando de ellos todos sus vocablos, pues entonces de veras 250 años no nos habrían bastado. En cambio, el uso de la computadora electrónica nos podía permitir “leer” grandes cantidades de textos sin intervención de nuestros juicios, registrar todas las palabras contenidas en ellos, contar cuántas veces aparecía cada una de ellas y elaborarles una ficha con los contextos en que se presentaran.

Al comenzar el trabajo se formó un Consejo de redacción del diccionario, integrado por Antonio Alatorre, Raúl Ávila, Margit Frenk, Beatriz Garza, Juan M. Lope Blanch y Tomás Segovia, del Centro de Estudios Lingüísticos y Literarios, y Jaime García Terrés, Andrés Henestrosa, Carlos Monsiváis, Tito Monterroso y Gabriel Zaid. La función de este Consejo consistió en ayudarnos a determinar el tratamiento que recibirían los vocablos, seleccionar una muestra de obras literarias y revisar las primeras redacciones que se fueran produciendo.

Para seleccionar los textos que habrían de conformar el Corpus del español mexicano contemporáneo (CEMC), siguiendo las enseñanzas relatadas y de acuerdo con los métodos de la estadística lingüística, era necesario reunir muestras de toda clase de géneros textuales y hablados, de autor o emisor mexicano, y crear con ellas varias agrupaciones distintas, que permitieran calcular la difusión del uso de cada vocablo (dispersión, técnicamente hablando) junto con su frecuencia de aparición. Decidimos tomar en cuenta textos escritos desde 1921 a 1974. En seguida pasamos a diseñar la clasificación de textos y grabaciones que conformarían el Corpus. El CEMC quedó formado por 996 “textos” de dos mil palabras gráficas cada uno, dividido en 14 géneros. Esos “textos” están compuestos por párrafos aleatoriamente entresacados de las fuentes, por dos razones: la primera, contrarrestar el predominio del estilo de cada autor, que tendería a privilegiar unos vocablos sobre otros; la segunda, aumentar el número de palabras diferentes que se encontraran. El CEMC conserva las palabras en su contexto, lo que es necesario para poder hacer posteriormente el análisis semántico de cada vocablo. Se puede conocer pormenorizadamente la conformación del CEMC si se lee el libro conjunto de Isabel García Hidalgo, Roberto Ham y yo, Investigaciones lingüísticas en lexicografía, El Colegio de México, 1980.   

En 1973 era todavía raro utilizar la computadora electrónica en la investigación lingüística. La máquina se utilizaba sobre todo para hacer comparaciones entre listas de palabras, lo que nos planteaba la cuestión de la lista que habría de servirnos de referencia para el reconocimiento de las palabras del corpus. La práctica de esa época en Francia, en Italia, en Estados Unidos de América consistía en tomar un diccionario y cotejar con él las palabras de los corpus. En nuestro caso eso habría significado tomar el DRAE como referencia y reconocer nuestro vocabulario en relación con él. ¿Qué pasaría con vocablos nuestros que el DRAE no contuviera? Que no los reconocería y, además, significaba seguir tomando como marco de referencia el diccionario académico. Por eso opté por hacer nuestro propio sistema de análisis automático de las palabras basado en sus propiedades morfológicas y de distribución sintáctica en los textos. Pasamos cerca de un año elaborando el Analizador gramatical automático del DEM, que resultó ser el primer trabajo de esta clase en lengua española y el único basado en reglas morfológicas y sintácticas. El Analizador significó para la matemática Isabel García Hidalgo el premio Dr. Arturo Rosenblueth a Sistemas de Cómputo en 1981.

Para finales de 1976 nuestro Corpus estaba analizado. Habíamos obtenido 1 891 045 palabras gráficas, que se redujeron a 64 183 diferentes. El CEMC fue el primer corpus de datos lingüísticos de la lengua española elaborado con la ayuda de una computadora electrónica. Junto con el Analizador, fue una primicia en la investigación contemporánea del español.

Al reconocimiento automático de las palabras agregamos un sistema de cálculo de la frecuencia de aparición de cada palabra, tanto en cada género como en todo el CEMC; a partir de esos datos, calculamos la dispersión del uso entre todos los géneros, con lo cual podemos reconocer qué palabras son las más usadas en el Corpus mediante un índice que correlaciona el tamaño de cada género, la frecuencia de aparición de cada palabra y su dispersión. Ha sido este índice el que nos guía en la incorporación de vocablos al diccionario. Fue el estadígrafo Roberto Ham Chande el autor de ese sistema de análisis cuantitativo que, hasta la fecha, no ha sido superado internacionalmente.

Comenzamos el análisis de los vocablos que nos proporcionó el CEMC entre 1976 y 77. Cuando El Colegio de México se mudó al Pedregal de Santa Teresa, el equipo de trabajo ya había comenzado la tarea. Una parte del equipo se concentró en la documentación de los vocablos, junto con los resultados cuantitativos y las concordancias: la materia prima. Tomamos en cuenta todos los estudios particulares y todos los diccionarios mexicanos de regionalismos que pudimos encontrar. Formamos un grupo de “diccionarios testigo”, a base de trece obras –presididas por el DRAE– tanto integrales como de regionalismos que nos sirvieron para verificar ortografías y acepciones, fundamentalmente, pero también para contrastar sus definiciones con las que nosotros mismos íbamos redactando. Otra parte del grupo se dedicó al análisis y redacción.

El DEM es un diccionario original; es decir, no refunde textos de obras anteriores sino que se basa en análisis nuevos e independientes de cada vocablo y sus significados. Para lograrlo seguimos el siguiente procedimiento: cada lexicógrafo debe analizar el vocablo sin tomar en cuenta estudios y diccionarios anteriores, basándose exclusivamente en los datos del CEMC y su propio conocimiento de la lengua; el primer producto de ese análisis es un borrador de la estructura de cada artículo lexicográfico (es decir, de cada texto presidido por una entrada en el diccionario, seguido por las abreviaturas de categoría gramatical, flexión y conjugación, y una serie de acepciones ordenadas, seguidas la mayor parte de las veces por ejemplos sacados de los textos del CEMC y por ejemplos de los usos habituales de las palabras, colocaciones, técnicamente hablando). Una vez escrito ese borrador, se enriquece con la lectura de obras especializadas de los temas en que suele utilizarse la palabra y después se contrasta con los “diccionarios testigo”, se corrige y se refina. Terminada esa primera redacción, pasa a un revisor, que repite el procedimiento como si el primero no hubiera existido y luego confronta su trabajo con el anterior.

En 1980 el país se acercaba al final del gobierno de José López Portillo, a la gran crisis económica. El Presidente de la república formó la “Comisión Nacional para la Defensa del Idioma Español” y muy pronto el Secretario de educación, Fernando Solana, nos pidió que colaboráramos con ella, dándole, en el plazo de un año, un pequeño diccionario para uso de la escuela elemental.

Como todos los diccionarios, nosotros habíamos comenzado por el principio del abecedario: de la letra A pasaríamos a la B y así sucesivamente. Para poder entregar en un año un pequeño diccionario con esas características teníamos que suspender ese orden y, sobre todo, seleccionar los vocablos que debieran constituir el Diccionario fundamental del español de México. Así que opté por tomar el vocabulario fundamental, que habíamos sacado de nuestro estudio cuantitativo, y agregarle el vocabulario temático de los libros de texto gratuito vigentes en esa época. Para reunir este último vocabulario, el equipo se dedicó a leer esos libros y entresacar el vocabulario, pues no podíamos esperar a que todos ellos pasaran por el proceso de perforación de tarjetas. Es decir que, después de seguir un proceso lineal en la redacción, pasamos a otro de ampliación concéntrica, en que se recorría el abecedario de la A a la Z dentro de unos límites fijados cada vez por el estudio cuantitativo. La Comisión del español, con el Fondo de Cultura Económica, publicó ese mínimo diccionario a mediados de 1982.

Como decía al principio, todos los autores de diccionarios se han equivocado al calcular el tiempo que les toma terminar un diccionario. En ocho años de trabajo habíamos completado una investigación muy valiosa del español de México, tanto para nosotros como, en general, para la lingüística hispánica; habíamos construido con éxito el primer sistema de análisis automático del español; habíamos ideado un sistema de cálculo cuantitativo que eliminaba la subjetividad en la selección de vocablos para el diccionario; pero habíamos terminado solamente un pequeño diccionario de 2500 artículos. Sin embargo, al ver plasmados en el Diccionario fundamental una idea clara del diccionario que queríamos hacer, un estilo de redacción y un resultado que se comentó críticamente, me pareció que era más conveniente abandonar el proceso lineal de redacción y que continuáramos con procesos de ampliación concéntrica de nuestros diccionarios, que nos permitieran ofrecer novedades al público y a nuestras autoridades en plazos menores. Así fue como compusimos el Diccionario Básico del español de México, publicado en 1986, a base del diccionario anterior y el vocabulario utilizado en la educación secundaria. Así llegamos a 7000 vocablos. Uno y otro de esos dos primeros y pequeños diccionarios pasaron por la revisión del Consejo Nacional Técnico de la Educación, que hizo comentarios sobre su contenido y nos solicitó adecuar varios de sus textos a las necesidades del alumno de escuela primaria y secundaria.

El siguiente paso, a partir de 1986, consistió en prolongar el procedimiento de ampliación concéntrica de la redacción, tomando como nuevo objetivo terminar un Diccionario del español usual en México (DEUM 1), formado por todos los vocablos que tuvieran una frecuencia mínima de diez apariciones en el CEMC. El DEUM 1 se publicó en 1996 y fue muy bien recibido tanto en México como en el extranjero. Finalmente habíamos ofrecido un pequeño diccionario con las características que debía tener, de acuerdo con el proyecto y el compromiso inicial: la selección de vocablos garantiza que se trata de voces realmente utilizadas en el español nacional de México; se orientan hacia la tradición culta de la lengua, pero corresponden a los usos más extendidos de una lengua común, en las que las voces coloquiales y populares, con las que tan fácilmente se identifican los mexicanos a sí mismos, aparecen bien explicadas y tratadas sin sospecha de incorrección , ni de “conciencia del desvío”. He definido el DEUM como un diccionario para el ciudadano medio, que lee periódicos y desea poder comprender la mayor parte de lo que se dice en el ámbito nacional, sobre la base de su propio sentimiento d la lengua. Buscamos develar para ese ciudadano una lengua rica y arraigada a la experiencia mexicana. En vista del éxito del DEUM 1 y para poder seguir ofreciendo, sobre todo a los estudiantes, un diccionario en un solo tomo y relativamente fácil de manejar, pusimos en circulación una segunda edición, corregida y aumentada con vocablos cuya frecuencia mínima en el CEMC fuera de ocho apariciones; ese es el DEUM 2, que ahora circula.

Una enseñanza notable de nuestro estudio cuantitativo, que se hizo patente al reflexionar acerca de los vocablos cuya frecuencia fue menor de diez y mayor o igual a ocho en el CEMC es que existe un núcleo léxico de nuestro español cercano a los 15000 vocablos, que es el que constituye el “español mexicano nacional”, es decir, el que se utiliza en todo el país, sin distinción de regiones y de correlaciones exclusivas con grupos sociales determinados. Podemos garantizar que todo el vocabulario contenido en las dos versiones del DEUM se usa o se ha usado en el español mexicano del siglo XX y principios del XXI. No incluye todo el vocabulario del español de México, pero los faltantes no obedecen  a ninguna exclusión normativa o prescriptiva, como nos tenía acostumbrados la tradición lexicográfica española. Es decir, la ausencia de un vocablo en el diccionario no quiere decir, ni que “no exista”, ni que “no lo aceptemos”.

Este diccionario es el comienzo de una empresa que debe perdurar. Estamos lejos de haber creado un diccionario semejante, en tamaño, a los afamados Merriam-Webster, pero creemos que hemos echado los cimientos y el primer piso de una gran construcción.        

 

Sitios de interés:

http://dem.colmex.mx

http://www.corpus.unam.mx:8080/cemc/