Seminario del área de Tecnologías del Lenguaje
Sesiones
Décima sesión. 26 de junio de 2025
Retos de la traducción automática de lenguas originarios de México: Iván Vladimir Meza Ruiz (Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas-UNAM)
Resumen: En recientes años ha habido un interés creciente de la creación de traductores automáticos para las lenguas originarias de México, en nuestro laboratorio hemos trabajado en esta dirección con Wixarika, Jñatrjo, Ayuuk y Nahuatl. En nuestra experiencia creando estos sistemas hemos enfrentado e identificado una serie de retos que expondremos en esta presentación. Por ejemplo, la oralidad de los lenguajes, la falta del registro lingüístico masivo de las lenguas, una discriminación sistemática de las lenguas, entre varios. Además de los retos presentaremos una ruta de cómo hemos resuelto algunos de los retos y como planeamos enfrentarlos.
https://www.youtube.com/live/cuJJceGI1
Novena sesión. 29 de mayo de 2025
La traducción en la era de los modelos de lenguaje de gran tamaño: Daniel Rojas Plata (CELL-El Colegio de México)
Resumen: La traducción automática ha ganado un lugar destacado no sólo como recurso especializado, sino también como práctica recurrente en la sociedad actual. Desde sus inicios en proyectos específicos hasta el impulso que le han brindado los nuevos modelos de lenguaje de gran tamaño, el potencial uso que ha demostrado para atender los grandes volúmenes de traducciones que se requieren actualmente hace necesario replantear el proceso mismo de la traducción, sus retos y perspectivas a futuro. Esta presentación atiende un doble propósito. En primer lugar, intenta ayudar a entender cuáles han sido las principales tecnologías que se han implementado dentro de la traducción automática, cuáles son sus postulados y de qué manera obtiene sus resultados. En segundo lugar, intenta ahondar en el impacto que esta práctica ha tenido dentro del campo de la traducción en general, los nuevos paradigmas que inaugura y el papel del traductor. El objetivo es proponer un panorama informado sobre la traducción automática desde el punto de vista de su conformación, su uso y sus implicaciones.
Palabras clave: historia de la traducción automática, traducción estadística y neuronal, modelos de lenguaje, paradigmas de la traducción, rol del traductor.
https://www.youtube.com/live/CMZv1AJU8tk?si=f-2YL8NUUC3q344n
Octava sesión. 24 de abril de 2025
Gobernanza de la IA y su integración en ecosistemas de aprendizaje: Vladimir Cortés Roshdestvensky (Director de Campañas y Alianzas para América Latina en Digital Action)
Retos de la traducción automática de lenguas originarios de México: Iván Vladimir Meza Ruiz (Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas-UNAM)
Resumen: En recientes años ha habido un interés creciente de la creación de traductores automáticos para las lenguas originarias de México, en nuestro laboratorio hemos trabajado en esta dirección con Wixarika, Jñatrjo, Ayuuk y Nahuatl. En nuestra experiencia creando estos sistemas hemos enfrentado e identificado una serie de retos que expondremos en esta presentación. Por ejemplo, la oralidad de los lenguajes, la falta del registro lingüístico masivo de las lenguas, una discriminación sistemática de las lenguas, entre varios. Además de los retos presentaremos una ruta de cómo hemos resuelto algunos de los retos y como planeamos enfrentarlos.
https://www.youtube.com/live/cuJJceGI1
La traducción en la era de los modelos de lenguaje de gran tamaño: Daniel Rojas Plata (CELL-El Colegio de México)
Resumen: La traducción automática ha ganado un lugar destacado no sólo como recurso especializado, sino también como práctica recurrente en la sociedad actual. Desde sus inicios en proyectos específicos hasta el impulso que le han brindado los nuevos modelos de lenguaje de gran tamaño, el potencial uso que ha demostrado para atender los grandes volúmenes de traducciones que se requieren actualmente hace necesario replantear el proceso mismo de la traducción, sus retos y perspectivas a futuro. Esta presentación atiende un doble propósito. En primer lugar, intenta ayudar a entender cuáles han sido las principales tecnologías que se han implementado dentro de la traducción automática, cuáles son sus postulados y de qué manera obtiene sus resultados. En segundo lugar, intenta ahondar en el impacto que esta práctica ha tenido dentro del campo de la traducción en general, los nuevos paradigmas que inaugura y el papel del traductor. El objetivo es proponer un panorama informado sobre la traducción automática desde el punto de vista de su conformación, su uso y sus implicaciones.
Palabras clave: historia de la traducción automática, traducción estadística y neuronal, modelos de lenguaje, paradigmas de la traducción, rol del traductor.
https://www.youtube.com/live/CMZv1AJU8tk?si=f-2YL8NUUC3q344n
Gobernanza de la IA y su integración en ecosistemas de aprendizaje: Vladimir Cortés Roshdestvensky (Director de Campañas y Alianzas para América Latina en Digital Action)
Resumen: Este seminario explorará la intersección entre la gobernanza de la IA y su integración en los ecosistemas de aprendizaje, analizando cómo aprovechar su potencial innovador mientras se protegen los derechos humanos y se promueve la equidad. Haremos un recorrido por las regulaciones más relevantes a nivel global – desde el ambicioso marco europeo hasta las estrategias adoptadas por Estados Unidos y China – con un enfoque especial en el panorama latinoamericano, donde la discusión comienza a tomar forma con países pioneros como Brasil, Chile y Uruguay. Examinaremos las implicaciones éticas y prácticas del uso de la IA en la educación, desde su capacidad para personalizar el aprendizaje hasta los desafíos que plantea en términos de sesgos y autonomía intelectual.
Palabras clave: inteligencia artificial, educación, enseñanza y aprendizaje, regulación, derechos humanos
Palabras clave: inteligencia artificial, educación, enseñanza y aprendizaje, regulación, derechos humanos
https://www.youtube.com/live/uq6wbUQEVQE
MEXICA: un generador de narrativas con 25 años de historia: Rafael Pérez y Pérez (UAM-Cuajimalpa)
Resumen: En esta sesión se aborda el sistema denominado MEXICA, un modelo computacional del proceso creativo desarrollado por el autor. MEXICA es capaz de generar argumentos para cuentos enfocados en la cultura mexica y se fundamenta en teorías acerca de cómo los seres humanos producen narrativas. Durante la presentación se exponen los conceptos fundamentales que sirvieron de base para la creación del modelo, así como sus características principales. Se pone especial énfasis en cómo el sistema utiliza estructuras que representan relaciones emocionales y conflictos entre personajes para elaborar narrativas coherentes. Asimismo, se presenta un ejemplo detallado del funcionamiento paso a paso del sistema durante la generación de una historia. Posteriormente, se describen brevemente algunos desarrollos derivados del sistema original, tales como la capacidad de MEXICA para evaluar sus propias narrativas, generar narrativas en colaboración con otro agente, participar en la composición automática de canciones, ilustrar cuentos generados por sí mismo y colaborar con artistas humanos en la creación de piezas multimedia. Finalmente, se hace una breve referencia a los dos últimos libros del autor: Story Machines, publicado por la editorial Routledge, y An Introduction to Narrative Generators, publicado por Oxford University Press.
Palabras clave: MEXICA, generador de narrativas.
https://www.youtube.com/watch?v=YEZdaF6-3fA
Sexta sesión. 27 de febrero de 2025
Diversidad lingüística (y de otros tipos): el gran reto de la IA generativa: Ximena Gutiérrez Vásques (Centro de Investigaciones Interdisciplinarias de Ciencias y Humanidades)
Resumen: Se analizó la evolución del Procesamiento del Lenguaje Natural, desde los enfoques basados en reglas y estadísticos hasta las redes neuronales artificiales. Particularmente, se identificaron las limitaciones de los grandes modelos del lenguaje (LLMs) en cuanto a la variación lingüística, la relevancia cultural y otros tipos de diversidad. Para abordar estas limitaciones, se propusieron algunas estrategias que combinan el conocimiento lingüístico, la computación y las ultimas técnicas de aprendizaje profundo.
https://www.youtube.com/watch?v=YEZdaF6-3fA
Diversidad lingüística (y de otros tipos): el gran reto de la IA generativa: Ximena Gutiérrez Vásques (Centro de Investigaciones Interdisciplinarias de Ciencias y Humanidades)
Resumen: Se analizó la evolución del Procesamiento del Lenguaje Natural, desde los enfoques basados en reglas y estadísticos hasta las redes neuronales artificiales. Particularmente, se identificaron las limitaciones de los grandes modelos del lenguaje (LLMs) en cuanto a la variación lingüística, la relevancia cultural y otros tipos de diversidad. Para abordar estas limitaciones, se propusieron algunas estrategias que combinan el conocimiento lingüístico, la computación y las ultimas técnicas de aprendizaje profundo.
Plabras clave: procesamiento del Lenguaje Natural, LLMs, variación lingüística, relevancia cultural, aprendizaje profundo, conocimiento lingüístico.
https://www.youtube.com/live/fSU4j4thv6g
Quinta sesión. 30 de enero de 2025
Introducción a operaciones con modelos extensos del lenguaje (LLMOps): Shervin Le Du
Resumen: Se abordaron las mejores prácticas para una gestión de proyectos de IA generativa basados en modelos de lenguaje extensos (LLMOps). Se trataron conceptos como DevOps y MLOps, además de los retos específicos que tienen los proyectos basados en LLMs. El invitado mostró también cómo tener una estrategia de datos robusta, cómo automatizar procesos y realizar evaluaciones continuas. La sesión ofrece una perspectiva integral para tener éxito en los proyectos de IA generativa.
https://www.youtube.com/live/fSU4j4thv6g
Introducción a operaciones con modelos extensos del lenguaje (LLMOps): Shervin Le Du
Resumen: Se abordaron las mejores prácticas para una gestión de proyectos de IA generativa basados en modelos de lenguaje extensos (LLMOps). Se trataron conceptos como DevOps y MLOps, además de los retos específicos que tienen los proyectos basados en LLMs. El invitado mostró también cómo tener una estrategia de datos robusta, cómo automatizar procesos y realizar evaluaciones continuas. La sesión ofrece una perspectiva integral para tener éxito en los proyectos de IA generativa.
Palabras clave: Inteligencia artificial generativa, Modelos extensos del lenguaje (LLMs), DevOps, MLOps, LLMOps
https://www.youtube.com/live/t21e-ApiyRo
Cuarta sesión. 28 de noviembre de 2024
Más allá del formato: procesamiento automático de referencias bibliográficas en múltiples idiomas: Rodrigo Cuéllar Hidalgo (Biblioteca Daniel Cosío Villegas)
Resumen: Rodrigo Cuéllar explica su investigación sobre el procesamiento automático de referencias bibliográficas en distintos idiomas, destacando las técnicas de aprendizaje automático para mejorar la precisión y eficiencia en la segmentación de referencias. Nos explica ampliamente su metodología y compara diferentes enfoques y arquitecturas, entre ellas, redes neuronales recurrentes y transformadores, para determinar cuál es la más eficaz en diversas pruebas. También, se discuten los desafíos y oportunidades para la minería de referencias en bibliotecas y otros contextos académicos.
https://www.youtube.com/live/t21e-ApiyRo
Más allá del formato: procesamiento automático de referencias bibliográficas en múltiples idiomas: Rodrigo Cuéllar Hidalgo (Biblioteca Daniel Cosío Villegas)
Resumen: Rodrigo Cuéllar explica su investigación sobre el procesamiento automático de referencias bibliográficas en distintos idiomas, destacando las técnicas de aprendizaje automático para mejorar la precisión y eficiencia en la segmentación de referencias. Nos explica ampliamente su metodología y compara diferentes enfoques y arquitecturas, entre ellas, redes neuronales recurrentes y transformadores, para determinar cuál es la más eficaz en diversas pruebas. También, se discuten los desafíos y oportunidades para la minería de referencias en bibliotecas y otros contextos académicos.
Palabras clave: referencias bibliográficas, minería de referencias, aprendizaje automático, redes neuronales recurrentes, transformadores.
https://www.youtube.com/live/gJhIJOzY6W8
Futuro de la ingeniería lingüística en México: Gerardo Sierra Martínez y Gemma Bel Enguix (Grupo de Ingeniería Lingüística-UNAM)
Resumen: La Dra. Gemma Bel-Enguix y el Dr. Gerardo Sierra abordan la evolución y los desafíos de la ingeniería lingüística en México, destacando la importancia de la colaboración interdisciplinaria en el uso de los modelos estadísticos de lenguaje y la inteligencia artificial. Se explican algunas aplicaciones prácticas, como la minería de textos, la recuperación de información y la detección de lenguaje de odio. Se subraya la importancia de crear y preservar recursos lingüísticos propios y se reflexiona sobre los retos éticos y sociales que plantean el uso de estas tecnologías.
Palabras clave: ingeniería lingüística, recursos lingüísticos, modelos de lenguaje, inteligencia artificial.
https://www.youtube.com/live/nGUsuh510OI
Parte I: "Generative AI for office automation": Josep Carmona (Universitat Politècnica de Catalunya)
Parte II: "Generative AI for office automation: Technical details" Lluís Padró (Universitat Politècnica de Catalunya)
Resumen: En la primera parte, Josep Carmona ofrece una charla divulgativa sobre el uso de la inteligencia artificial generativa para automatizar tareas rutinarias en el entorno laboral e incluye una demostración de la herramienta que desarrollaron. En la segunda parte, Lluís Padró explica los principales aspectos técnicos de la herramienta, basados en el ajuste fino de modelos extensos del lenguaje y comprensión del lenguaje natural.
Palabras clave: Inteligencia artificial generativa, Modelos extensos del lenguaje, Ajuste fino, Asistentes inteligentes, Ofimática
https://www.youtube.com/live/0rYktPsXVTo
La personalidad a través del lenguaje y pensamiento: Gabriela Ramírez de la Rosa
Resumen: La doctora Gabriela Ramírez presentó los resultados de su investigación sobre detección de personalidad a través del lenguaje. En la presentación, la doctora Gabriela define las teorías utilizadas en su trabajo: la disponibilidad léxica y el modelo psicológico de los cinco grandes. La investigación busca utilizar el análisis del léxico disponible para identificar la personalidad. La ponente mostró el método propuesto que clasifica las muestras del lenguaje en función de los rasgos de personalidad. Este método se basa en un esquema de aprendizaje automático que permite representar las muestras de lenguaje y clasificarlas según los polos de personalidad. Además, la ponente compartió la metodología para crear su corpus y las conclusiones a las que llegó.
Palabras clave: lenguaje, disponibilidad léxica, modelo de los cinco grandes, aprendizaje automático, corpus.
https://www.youtube.com/live/rfiBA7vlGpQ