Profesorado
Dr. Felipe Hasler
Universidad de Chile
Dr. Luis París
CONICET y Universidad de Cuyo, Argentina
Dr. Fernando Carranza
Universidad de Buenos Aires
Calendario
Sesiones online síncronas de 18.00 a 20.00 horas los días 16, 17, 18, 19, 20, 25, 26, 27 y 30 de septiembre y 1, 2, 3, 4, 7, 8, 9, 10, 11, 14 y 15 de octubre.
Descripción y objetivo
El procesamiento de grandes cantidades de información es desde hace décadas una actividad primordial y cotidiana. Un corpus lingüístico es una estructura de información generalmente masiva en tamaño y compleja en el sentido de que, como todo objeto lingüístico, admite análisis de distintos niveles de profundidad. Su procesamiento constituye un desafío cognitivo importante y de aquí que desde hace tiempo se realizan esfuerzos en distintas direcciones para facilitar la extracción de información por medios computacionales.
Este es, si bien no el único, uno de los objetivos prácticos que ha fomentado el desarrollo de la anotación de corpus. Se trata de analizar manual o automáticamente un conjunto masivo de información lingüística para proceder a su rotulación de tal manera que el corpus sea procesable computacionalmente mediante el análisis de rótulos; o de forma que el dataset etiquetado manualmente sirva para el aprendizaje automático, en el que se basan los grandes modelos de lenguaje.
En este curso nos proponemos enseñar y entrenar a los estudiantes en la aplicación del sistema AGCE (Anotación Gramatical de Corpus del Español), un sistema que incorpora conocimientos aportados tanto por WordNet como por FrameNet pero enriquecidos y estructurados de distinto modo.
El objetivo es que AGCE registre múltiples capas de información gramatical de los datos mediante estructuras de rasgos que sean reutilizables en una gama de dominios cognitivos, géneros y contextos. El uso eficiente de AGCE demanda ciertos conocimientos de gramática, entendida como el sistema que resulta de la integración sistemática de los subsistemas fonológico, morfosintáctico y semántico/pragmático.
El curso ofrecerá aquellos conocimientos de estos subsistemas gramaticales tanto como de su integración sistemática que resulten indispensables para la anotación. En tal sentido abordaremos características esenciales del lenguaje que tienen un impacto directo en el procesamiento como la polisemia léxica, la vaguedad y la ambigüedad.
Contenidos
- Estructuras de rasgos y procesamiento de corpus.
- Semántica léxica y descomposición en rasgos.
- Plantillas para la formación de palabras y oraciones.
- Enlace entre funciones sintácticas y estructura argumental.
- Anotación con AGCE de oraciones y textos narrativos y expositivos.
Metodología
La metodología del curso es práctica. No son necesarios conocimientos previos. Las exposiciones y resolución de problemas de análisis pretenden que los estudiantes apliquen un sistema de anotación gramatical que les permita exponer la estructura gramatical (morfosintáctica y semántica) de un texto en español. Las actividades formativas están también dirigidas a que los estudiantes identifiquen los fenómenos gramaticales relevados por la rotulación gramatical. Se fomentará la participación y la reflexión crítica, de manera que los estudiantes eventualmente puedan contribuir al sistema de anotación.
Inscripción
Para participar en este curso, hay que realizar la inscripción.
Se atenderá según orden de llegada hasta cubrir las plazas ofertadas.
Fin de plazo de inscripción/matrícula: 12/09/2024
La actividad podrá ser cancelada en el caso de no alcanzar un número mínimo de inscripciones, a determinar por la organización, en cuyo caso se devolverá el importe de la matrícula íntegro.
No se harán devoluciones de matrícula salvo por causas imputables a la organización.
Duración y organización
El curso consta de 40 horas.
Cada clase tendrá componentes teóricos y prácticos.
Matrícula
Matrícula ordinaria: 250 €
Estudiantes que estén cursando un Grado, un Máster o un Programa de Doctorado en la Universidad de La Rioja: 125€
Estudiantes de ediciones anteriores del Máster de Procesamiento del Lenguaje e Inteligencia Artificial (Universidad de La Rioja): 125€
Segunda o sucesivas matriculaciones en los cursos formativos de especialización, dentro del marco del Proyecto ‘Economía Digital del Lenguaje e Inteligencia Artificial’: 125€
Personal Docente e Investigador de la Universidad de La Rioja: 125€
Certificado
Se emitirá un certificado de realización del curso a las personas que hayan asistido con aprovechamiento al menos al 75% de las sesiones. La obtención del certificado estará sujeta a la participación activa en las sesiones y la realización de los ejercicios planteados por el profesorado del curso.
El profesorado podrá requerir la conexión al aula virtual por vídeo.
Acceso a las sesiones en modalidad asíncrona
El alumnado podrá acceder a las grabaciones de las sesiones a través del aula virtual del curso. Para el cumplimiento del requisito de asistencia y participación será necesario asistir a las sesiones de manera síncrona. No se certificarán cursos en los que más del 25% de las sesiones del curso se haya realizado en modalidad asíncrona.
Coordinadores académicos
Javier Martín Arista
Raquel Vea Escarza
Universidad de La Rioja
ecodigleng@unirioja.es
Plan de Transformación
Economía Digital del Lenguaje e Inteligencia Artificial
Universidad de La Rioja
Etiquetas
Categorías
Noticias relacionadas
“Con la Inteligencia Artificial entramos en una nueva era, como cuando empezó Internet. Esto es una nueva imprenta"
El rector de la UR afirma que Dialnet será una “palanca para el desarrollo de La Rioja, España y Latinoamérica”
Actividades relacionadas