Buscar
Cerrar este cuadro de búsqueda.

Actividades

Filtrar por categoría

Seminario Informatica Mirian Andres

Seminario de Informática ‘Mirian Andrés’. Charlas sobre Procesamiento de Lenguaje Natural

20 Sep 2024
20 Sep 2024

10.00 horas
Seminario Mirian Andrés
Complejo Científico-Tecnológico (CCT)
Entrada libre

Programa


10.00 horas

Evaluación automática y manual de un chatbot para proporcionar información sobre suicidio en castellano

Pablo Ascorbe Fernández
Grupo PSYCOTRIP
Universidad de La Rioja

Resumen

Los chatbots tienen un gran potencial en campos delicados como la salud mental, pero para asegurar su correcto funcionamiento es necesaria una evaluación cuidadosa, ya sea por métodos manuales o por métodos automáticos.

En este trabajo se presenta una librería para evaluar automáticamente chatbots en castellano de Generación Mejorada por Recuperación (en inglés Retrieval Augmented Generation o RAG) utilizando grandes modelos de lenguaje (en inglés, LLMs). A continuación, se realiza una evaluación exhaustiva de varios modelos candidatos a ser utilizados en un sistema RAG para proporcionar información sobre la prevención del suicidio, utilizando una evaluación manual, una automática basada en métricas y una automática basada en LLMs. Todos los métodos coinciden al escoger el mejor modelo, pero presentan sutiles diferencias.

Los métodos automáticos basados en métricas se correlacionan en precisión y exhaustividad con la evaluación humana, pero no en fidelidad; y algunos métodos automáticos basados en LLMs no detectan algunos errores, como respuestas no relacionadas con la pregunta; o pueden pasar por alto respuestas inseguras. Como conclusión, podemos decir que los métodos automáticos pueden reducir el esfuerzo de evaluación manual, no obstante, ésta sigue siendo esencial, sobre todo en contextos sensibles como los relacionados con la salud mental.


10.30 horas

¿Es el ASR la herramienta adecuada para la construcción de Corpus Lingüísticos Orales en castellano?

Miren Mirari San Martín Lacunza
Grupo PSYCOTRIP
Universidad de La Rioja

Resumen

Los corpus orales son un recurso muy valioso para explorar el discurso que ocurre de manera natural. Sin embargo, grandes partes de estos corpus permanecen sin transcribir debido al alto coste de transcribir manualmente ficheros de audio; y, por lo tanto, el acceso a estos recursos es limitado. Este problema podría ser abordado mediante herramientas de Reconocimiento Automático del Habla (ASR, por sus siglas en inglés), que han demostrado su potencial para transcribir automáticamente ficheros de audio.

En este trabajo, estudiamos dos familias de modelos ASR (Whisper y Seamless) para transcribir automáticamente archivos del corpus COSER (sigla formada a partir de Corpus Oral y Sonoro del Español Rural). Nuestros resultados muestran que los modelos de ASR pueden producir transcripciones precisas independientemente del dialecto de los hablantes y su velocidad de habla; especialmente con la versión large v3 de Whisper, que es el modelo que produce los mejores resultados (WER promedio de 0.292).

Sin embargo, en algunos casos, las transcripciones no se alinean perfectamente con las producidas por humanos, ya que los transcriptores humanos reflejan matices introducidos por los hablantes que no son capturados con los modelos ASR. Esto muestra que las herramientas ASR pueden reducir la carga de transcribir manualmente horas de audio de los corpus orales, pero aún se necesita supervisión humana.

Seminario Mirian Andrés

El Seminario se lleva celebrando en la Universidad de La Rioja desde el año 2008 con el nombre de Seminario Mirian Andrés, y desde el año 2001 como Seminario de Informática. Generalmente las charlas tienen lugar en el Complejo Científico-Tecnológico (CCT) de la UR  y en horario de mañana.

Listado de charlas del Seminario Mirian Andrés

Mirian Andrés (1979-2008) fue compañera y participante en este Seminario durante el tiempo que trabajó en la Universidad de La Rioja.

Para quién

Público en general.
Entrada libre hasta completar el aforo.

Contacto

Jónathan Heras Vicente
Departamento de Matemáticas y Computación
Universidad de La Rioja

Dirección

Jónathan Heras Vicente
jonathan.heras@unirioja.es
Beatriz Pérez Valle
beatriz.perez@unirioja.es
Departamento de Matemáticas y Computación
Universidad de La Rioja

© Imagen destacada de Agefis.

Etiquetas

Categorías

Noticias relacionadas

Inspira STEAM se consolida en La Rioja con más de 150 participantes de Educación Primaria

Inspira STEAM se consolida en La Rioja con más de 150 participantes de Educación Primaria

El Colegio Divino Maestro acoge una sesión del proyecto Inspira STEAM de fomento de vocaciones científico-tecnológicas entre las chicas, que…
La UR desarrollará junto con Plena inclusión herramientas informáticas para la creación de documentos en lectura fácil

La UR desarrollará junto con Plena inclusión herramientas informáticas para la creación de documentos en lectura fácil

La Universidad de La Rioja y Plena inclusión La Rioja suscriben un convenio de colaboración para desarrollar herramientas de 'software'…

Actividades relacionadas

Buscar actividades

Próximas actividades