Buscar
Cerrar este cuadro de búsqueda.

Actividades

Filtrar por categoría

curso sistemas anotacion morfosintactica

Curso de especialización. AGCE: Sistema de anotación morfosintáctica y semántica para procesamiento del español

16 Sep 2024 - 15 Oct 2024
16 Sep 2024 – 15 Oct 2024

De 18.00 a 20.00 horas
Modalidad online síncrona

Profesorado

Dr. Felipe Hasler
Universidad de Chile

Dr. Luis París
CONICET y Universidad de Cuyo, Argentina

Dr. Fernando Carranza
Universidad de Buenos Aires

Calendario

Sesiones online síncronas de 18.00 a 20.00 horas los días 16, 17, 18, 19, 20, 25, 26, 27 y 30 de septiembre y 1, 2, 3, 4, 7, 8, 9, 10, 11, 14 y 15 de octubre.

Descripción y objetivo

El procesamiento de grandes cantidades de información es desde hace décadas una actividad primordial y cotidiana. Un corpus lingüístico es una estructura de información generalmente masiva en tamaño y compleja en el sentido de que, como todo objeto lingüístico, admite análisis de distintos niveles de profundidad. Su procesamiento constituye un desafío cognitivo importante y de aquí que desde hace tiempo se realizan esfuerzos en distintas direcciones para facilitar la extracción de información por medios computacionales.

Este es, si bien no el único, uno de los objetivos prácticos que ha fomentado el desarrollo de la anotación de corpus. Se trata de analizar manual o automáticamente un conjunto masivo de información lingüística para proceder a su rotulación de tal manera que el corpus sea procesable computacionalmente mediante el análisis de rótulos; o de forma que el dataset etiquetado manualmente sirva para el aprendizaje automático, en el que se basan los grandes modelos de lenguaje.

En este curso nos proponemos enseñar y entrenar a los estudiantes en la aplicación del sistema AGCE (Anotación Gramatical de Corpus del Español), un sistema que incorpora conocimientos aportados tanto por WordNet como por FrameNet pero enriquecidos y estructurados de distinto modo.

El objetivo es que AGCE registre múltiples capas de información gramatical de los datos mediante estructuras de rasgos que sean reutilizables en una gama de dominios cognitivos, géneros y contextos. El uso eficiente de AGCE demanda ciertos conocimientos de gramática, entendida como el sistema que resulta de la integración sistemática de los subsistemas fonológico, morfosintáctico y semántico/pragmático.

El curso ofrecerá aquellos conocimientos de estos subsistemas gramaticales tanto como de su integración sistemática que resulten indispensables para la anotación. En tal sentido abordaremos características esenciales del lenguaje que tienen un impacto directo en el procesamiento como la polisemia léxica, la vaguedad y la ambigüedad.

Contenidos

  1. Estructuras de rasgos y procesamiento de corpus.
  2. Semántica léxica y descomposición en rasgos.
  3. Plantillas para la formación de palabras y oraciones.
  4. Enlace entre funciones sintácticas y estructura argumental.
  5. Anotación con AGCE de oraciones y textos narrativos y expositivos.

Metodología

La metodología del curso es práctica. No son necesarios conocimientos previos. Las exposiciones y resolución de problemas de análisis pretenden que los estudiantes apliquen un sistema de anotación gramatical que les permita exponer la estructura gramatical (morfosintáctica y semántica) de un texto en español. Las actividades formativas están también dirigidas a que los estudiantes identifiquen los fenómenos gramaticales relevados por la rotulación gramatical. Se fomentará la participación y la reflexión crítica, de manera que los estudiantes eventualmente puedan contribuir al sistema de anotación.

Inscripción

Para participar en este curso, hay que realizar la inscripción.

Se atenderá según orden de llegada hasta cubrir las plazas ofertadas.

Fin de plazo de inscripción/matrícula: 12/09/2024

La actividad podrá ser cancelada en el caso de no alcanzar un número mínimo de inscripciones, a determinar por la organización, en cuyo caso se devolverá el importe de la matrícula íntegro.

No se harán devoluciones de matrícula salvo por causas imputables a la organización.

Duración y organización

El curso consta de 40 horas.

Cada clase tendrá componentes teóricos y prácticos.

Matrícula

Matrícula ordinaria: 250 €

Estudiantes que estén cursando un Grado, un Máster o un Programa de Doctorado en la Universidad de La Rioja: 125€

Estudiantes de ediciones anteriores del Máster de Procesamiento del Lenguaje e Inteligencia Artificial (Universidad de La Rioja): 125

Segunda o sucesivas matriculaciones en los cursos formativos de especialización, dentro del marco del Proyecto ‘Economía Digital del Lenguaje e Inteligencia Artificial’: 125

Personal Docente e Investigador de la Universidad de La Rioja: 125

Certificado

Se emitirá un certificado de realización del curso a las personas que hayan asistido con aprovechamiento al menos al 75% de las sesiones. La obtención del certificado estará sujeta a la participación activa en las sesiones y la realización de los ejercicios planteados por el profesorado del curso.

El profesorado podrá requerir la conexión al aula virtual por vídeo.

Acceso a las sesiones en modalidad asíncrona

El alumnado podrá acceder a las grabaciones de las sesiones a través del aula virtual del curso. Para el cumplimiento del requisito de asistencia y participación será necesario asistir a las sesiones de manera síncrona. No se certificarán cursos en los que más del 25% de las sesiones del curso se haya realizado en modalidad asíncrona.

Coordinadores académicos

Javier Martín Arista
Raquel Vea Escarza
Universidad de La Rioja
ecodigleng@unirioja.es

Plan de Transformación
Economía Digital del Lenguaje e Inteligencia Artificial
Universidad de La Rioja

Buscar actividades

Próximas actividades