Seminario del área de Tecnologías del Lenguaje

Sesiones

Séptima sesión. 25 de marzo de 2025
MEXICA: un generador de narrativas con 25 años de historia: Rafael Pérez y Pérez
(UAM-Cuajimalpa)

En esta sesión se abordará el sistema denominado MEXICA, un modelo computacional del proceso creativo desarrollado por el autor. MEXICA es capaz de generar argumentos para cuentos enfocados en la cultura mexica y se fundamenta en teorías acerca de cómo los seres humanos producen narrativas. Durante la presentación se expondrán los conceptos fundamentales que sirvieron de base para la creación del modelo, así como sus características principales. Se pondrá especial énfasis en cómo el sistema utiliza estructuras que representan relaciones emocionales y conflictos entre personajes para elaborar narrativas coherentes.

Asimismo, se presentará un ejemplo detallado del funcionamiento paso a paso del sistema durante la generación de una historia. Posteriormente, se describirán brevemente algunos desarrollos derivados del sistema original, tales como la capacidad de MEXICA para evaluar sus propias narrativas, generar narrativas en colaboración con otro agente, participar en la composición automática de canciones, ilustrar cuentos generados por sí mismo y colaborar con artistas humanos en la creación de piezas multimedia.

Finalmente, se hará una breve referencia a los dos últimos libros del autor: Story Machines, publicado por la editorial Routledge, y An Introduction to Narrative Generators, publicado por Oxford University Press. 

Palabras clave: MEXICA, generador de narrativas.

Sexta sesión. 27 de febrero de 2025
Diversidad lingüística (y de otros tipos): el gran reto de la IA generativa: Ximena Gutiérrez Vásques
(Centro de Investigaciones Interdisciplinarias de Ciencias y Humanidades)

Resumen: Se analizó la evolución del Procesamiento del Lenguaje Natural, desde los enfoques basados en reglas y estadísticos hasta las redes neuronales artificiales. Particularmente, se identificaron las limitaciones de los grandes modelos del lenguaje (LLMs) en cuanto a la variación lingüística, la relevancia cultural y otros tipos de diversidad. Para abordar estas limitaciones, se propusieron algunas estrategias que combinan el conocimiento lingüístico, la computación y las ultimas técnicas de aprendizaje profundo. 
Quinta sesión. 30 de enero de 2025
Introducción a operaciones con modelos extensos del lenguaje (LLMOps): Shervin Le Du

Resumen: Se abordaron las mejores prácticas para una gestión de proyectos de IA generativa basados en modelos de lenguaje extensos (LLMOps). Se trataron conceptos como DevOps y MLOps, además de los retos específicos que tienen los proyectos basados en LLMs. El invitado mostró también cómo tener una estrategia de datos robusta, cómo automatizar procesos y realizar evaluaciones continuas. La sesión ofrece una perspectiva integral para tener éxito en los proyectos de IA generativa. 
 
Palabras clave: Inteligencia artificial generativa, Modelos extensos del lenguaje (LLMs), DevOps, MLOps, LLMOps

https://www.youtube.com/live/t21e-ApiyRo 


Cuarta sesión. 28 de noviembre de 2024
Más allá del formato: procesamiento automático de referencias bibliográficas en múltiples idiomas:  Rodrigo Cuéllar Hidalgo
(Biblioteca Daniel Cosío Villegas)

Resumen: Rodrigo Cuéllar explica su investigación sobre el procesamiento automático de referencias bibliográficas en distintos idiomas, destacando las técnicas de aprendizaje automático para mejorar la precisión y eficiencia en la segmentación de referencias. Nos explica ampliamente su metodología y compara diferentes enfoques y arquitecturas, entre ellas, redes neuronales recurrentes y transformadores, para determinar cuál es la más eficaz en diversas pruebas. También, se discuten los desafíos y oportunidades para la minería de referencias en bibliotecas y otros contextos académicos. 

Palabras clave: referencias bibliográficas, minería de referencias, aprendizaje automático, redes neuronales recurrentes, transformadores. 

https://www.youtube.com/live/gJhIJOzY6W8 
Tercera sesión. 31 de octubre de 2024
Futuro de la ingeniería lingüística en México: Gerardo Sierra Martínez y Gemma Bel Enguix
(Grupo de Ingeniería Lingüística-UNAM)

Resumen: La Dra. Gemma Bel-Enguix y el Dr. Gerardo Sierra abordan la evolución y los desafíos de la ingeniería lingüística en México, destacando la importancia de la colaboración interdisciplinaria en el uso de los modelos estadísticos de lenguaje y la inteligencia artificial. Se explican algunas aplicaciones prácticas, como la minería de textos, la recuperación de información y la detección de lenguaje de odio. Se subraya la importancia de crear y preservar recursos lingüísticos propios y se reflexiona sobre los retos éticos y sociales que plantean el uso de estas tecnologías. 
 
Palabras clave: ingeniería lingüística, recursos lingüísticos, modelos de lenguaje, inteligencia artificial. 

https://www.youtube.com/live/nGUsuh510OI
Segunda sesión. 26 de septiembre de 2024
Parte I: "Generative AI for office automation":  Josep Carmona.
Parte II: "Generative AI for office automation: Technical details" Lluís Padró.
(Universitat Politècnica de Catalunya)

Resumen: En la primera parte, Josep Carmona ofrece una charla divulgativa sobre el uso de la inteligencia artificial generativa para automatizar tareas rutinarias en el entorno          laboral e incluye una demostración de la herramienta que desarrollaron. En la segunda parte, Lluís Padró explica los principales aspectos técnicos de la herramienta, basados en el ajuste fino de modelos extensos del lenguaje y comprensión del lenguaje natural.

Palabras clave: Inteligencia artificial generativa, Modelos extensos del lenguaje, Ajuste fino, Asistentes inteligentes, Ofimática 

https://www.youtube.com/live/0rYktPsXVTo
Primera sesión. 29 de agosto de 2024
La personalidad a través del lenguaje y pensamiento: Gabriela Ramírez de la Rosa.

Resumen: La doctora Gabriela Ramírez presentó los resultados de su investigación sobre detección de personalidad a través del lenguaje. En la presentación, la doctora Gabriela define las teorías utilizadas en su trabajo: la disponibilidad léxica y el modelo psicológico de los cinco grandes. La investigación busca utilizar el análisis del léxico disponible para identificar la personalidad. La ponente mostró el método propuesto que clasifica las muestras del lenguaje en función de los rasgos de personalidad. Este método se basa en un esquema de aprendizaje automático que permite representar las muestras de lenguaje y clasificarlas según los polos de personalidad. Además, la ponente compartió la metodología para crear su corpus y las conclusiones a las que llegó.

https://www.youtube.com/live/rfiBA7vlGpQ