Lingüistica y Tecnologías por la UCM y la UPM

Máster. Curso 2025/2026.

IDENTIFICACIÓN DE LOCUTORES - 610715

Curso Académico 2025-26

Datos Generales

SINOPSIS

COMPETENCIAS

Específicas
Resultados de aprendizaje
RA10 - Aplicar los métodos experimentales de carácter cualitativo y cuantitativo básicos en el ámbito de la Lingüística para analizar problemas y buscar soluciones. TIPO: Habilidades o destrezas
RA11 - Utilizar los recursos y tecnologías para el análisis de muestras de habla y de texto escrito. TIPO: Habilidades o destrezas
RA12 - Diseñar recursos lingüísticos (corpus textuales y de voz, bases de datos o bases de conocimiento lingüístico) para su
utilización en Lingüística computacional, peritaje lingüístico o enseñanza de lenguas. TIPO: Habilidades o destrezas
RA14-LF - Aplicar los métodos y las herramientas pertinentes para el análisis de muestras orales y escritas en el contexto forense y judicial. TIPO: Habilidades o destrezas
RA17 - Evaluar teorías, resultados y desarrollos, identificando lagunas, implementando soluciones y planificando la adquisición de nuevos conocimientos y habilidades. TIPO: Competencias
RA6 - Identificar las características del lenguaje humano que hacen difícil el tratamiento automático de la producción lingüística en los ámbitos computacional, forense y de enseñanza de lenguas. TIPO: Conocimientos o contenidos
RA8-LF - Explicar las características de las metodologías y los procedimientos lingüísticos, técnicos, tecnológicos y estadísticos utilizados para abordar casos forenses y peritajes lingüísticos en el marco del ordenamiento jurídico actual. TIPO: Conocimientos o contenidos



Otras

• Reconocer, analizar e interpretar las principales características lingüísticas que contribuyen a caracterizar e identificar hablantes.
• Utilizar tecnologías y aplicar procedimientos metodológicos adecuados para el análisis forense de muestras de habla y de texto.
• Explicar y diferenciar las principales tareas que se realizan en el ámbito de la lingüística forense: perfiles lingüísticos de hablantes desconocidos, identificación de locutores, determinación del contenido y autentificación de grabaciones, ruedas de reconocimiento de voces, determinación/atribución de autoría, detección de plagio, entre otras.

ACTIVIDADES DOCENTES

Clases teóricas
12,5 h
Clases prácticas
31,5 h
Otras actividades
Trabajo individual 31 h
TOTAL
75 h

No presenciales

3

Semestre

2

Breve descriptor:

En el ámbito de la Tecnología del Habla, la identificación de locutores aborda específicamente el estudio de los aspectos científico-tecnológicos relativos al desarrollo de soluciones para el reconocimiento o identificación de locutores mediante su voz. Esta disciplina combina varios campos como el procesamiento de audio, la biometría y el aprendizaje automático, y tiene una gran variedad de aplicaciones desde sistemas de control acceso hasta informes periciales en análisis forenses.
La asignatura está organizada en 4 partes principales:

1) En la primera parte se abordan los dos primeros objetivos didácticos. Después de hacer una introducción al problema de la identificación de locutores, se abordan las principales herramientas para el análisis forense de la señal de voz. Adicionalmente, se describen los principales métodos de parametrización y extracción de características acústicas utilizadas para la identificación y verificación de locutores.
Esta parte incluye también un ejercicio práctico en el que los estudiantes abordan el uso de varias de estas herramientas para extraer características relevantes de la señal de voz.

 2) En la segunda parte, se abordan las principales estrategias y algoritmos de aprendizaje automático para la identificación y verificación de locutores. A continuación, se describen las diferentes estrategias de toma de decisiones, como la basada en la razón de verosimilitud (LR).
El ejercicio práctico tiene como objetivo el análisis de un sistema de identificación de locutores utilizando aprendizaje automático y el estudio de su comportamiento según se van modificando varios de sus parámetros.

 3) En la tercera parte, se abordan las principales estrategias y algoritmos de aprendizaje profundo aplicadas a la identificación y verificación de locutores, y se presentan las formulaciones y métricas más utilizadas en la identificación y verificación de locutores.
En esta tercera parte también hay un ejercicio práctico que tiene como objetivo el análisis de un sistema de identificación de locutores utilizando algoritmos de aprendizaje profundo y el estudio de su comportamiento.

4) En la última semana, de forma presencial, los estudiantes abordan un trabajo, reto o competición entre diferentes grupos de estudiantes. El objetivo es obtener el mejor sistema de identificación de locutores para unas métricas y bases de datos definidas por los profesores.
La asignatura tiene un carácter práctico, pero con un contenido teórico que fundamenta la práctica. Los estudiantes irán realizando varias prácticas asociadas a cada uno de los bloques y finalmente, abordarán un trabajo, reto o competición que permita a los estudiantes aplicar y profundizar los conocimientos aprendidos a lo largo de las diferentes prácticas y clases teóricas.


Profesores encargados del curso:

Rubén San-Segundo Hernández (Procesamiento de Señales de Voz y Movimiento, UPM)

Fernando Fernández Martínez (Procesamiento de Señales de Voz y Movimiento, UPM)

Luis Fernando D’Haro Enríquez (Procesamiento de Señales de Voz y Movimiento, UPM)

Requisitos

Los generales de acceso al máster.

Conocimientos y/o destrezas previas recomendadas
• Conocimientos a nivel de usuario avanzado de informática e internet.
• Procesamiento del Habla.
• Conocimientos básicos en Python.
• Lectura de textos en inglés.
• Autoaprendizaje y planificación.
• Trabajo en equipo.
• Pensamiento crítico.
• Aprender del error.

Asignaturas del Máster directamente relacionadas:
• Fonética Forense: caracterización y producción de la voz.
• Procesamiento del Habla (caracterización y procesamiento de señales de voz).

Contenido

1. Introducción y extracción de características.

2. Identificación de locutores de forma automática.

3. Aprendizaje profundo para identificación de locutores.

4. Preparación de la competición o trabajos de los estudiantes.

Evaluación

La asignatura se evalúa a partir de las actividades siguientes:
- Memoria de cada una de las prácticas: 30%, se dedicará un 10% a cada una de las 3 prácticas.
-Competición o trabajos entre grupos de estudiantes y presentación de resultados: 20% de la nota final.
- Examen final: 50% de la nota final. Es imprescindible aprobar el examen final presencial para aprobar la asignatura.
En la convocatoria extraordinaria, los estudiantes deben realizar un examen final (50% de la nota final). Adicionalmente, se deben presentar las prácticas (30%) y los trabajos/competiciones realizados a los largo del curso (20%), si no se han presentado y aprobado durante el curso.

Bibliografía

• Mak, M. W., & Chien, J. T. (2020). Machine learning for speaker recognition. Cambridge University Press, 334 pages. ISBN: 978-1108428125.
• Beigi, H. (2011). Speaker recognition. In Fundamentals of Speaker Recognition (pp. 543-559). Springer, Boston, MA. 1005 pages. ISBN: 978-0-387-77591-3.
• Rose, P. (2002). Forensic speaker identification. CRC Press, 384 pages. ISBN: 978-0415271820.

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo T02/02/2026 - 08/05/2026JUEVES 17:00 - 19:00AULA VIRTUAL 3MARIANELA FERNANDEZ TRINIDAD