ESTUDIANTES

Sarah Bohnensteffen, primer premio en la prestigiosa competición EMOS Master Thesis

Sarah Bohnensteffen, primer premio en la prestigiosa competición EMOS Master Thesis

Texto: Jaime Fernández - 9 dic 2020 13:29 CET

La alumna del máster EMOS (Máster Europeo de Estadística Oficial) de la UCM, Sarah Bohnensteffen ha obtenido el primer premio en EMOS Master Thesis competition 2020, la competición europea organizada por la oficina europea de estadística, Eurostat. El galardón lo ha conseguido con su TFM "Selective data editing of continuous variables with random forests in official statistics (Edición selectiva de datos de variables continuas con bosques aleatorios en estadísticas oficiales)”, con el que ha quedado por delante de trabajos de dos universidades alemanas, las de Múnich y Bamberg, y de otras dos estudiantes de la Universidad de Rennes, que es la que forma a los estadísticos oficiales del INE francés.

 

Sarah Bohnensteffen se encuentra ahora mismo en Wiesbaden, a unos 30 minutos de Frankurt, donde ha empezado a trabajar en la Oficina Federal de Estadística de Alemania (Destatis), y reconoce que ahora tienen “mucho trabajo porque se están haciendo análisis relacionados con la crisis de la COVID-19”.

 

Antes de cursar el EMOS en la Complutense estudió Sociología en Heidelberger, con parte teórica y empírica, tanto los métodos cualitativos como los cuantitativos, y allí se dio cuenta de que lo que más le gusta, y además se le da bien, son los métodos cualitativos. Buscó, por tanto, un máster que fuese de análisis de datos, pero que también tuviese relación con preguntas socioeconómicas, lo que no resultó fácil, porque “hay muchos másteres de big data, de análisis de datos, de estadística, y también de sociología, pero no es fácil encontrar una combinación que tenga las dos partes”. Por suerte dio con el máster EMOS de Estadísticas Oficiales, que se imparte en más de treinta universidades de Europa, donde “no sólo se estudian métodos y estadística, sino también la relación con preguntas sobre la sociedad”.

 

Alba María Franco, coordinadora del máster, asegura que Bohnensteffen venía con muy buena formación, porque “uno de los puntos débiles del máster es que no se consigue a estudiantes con un perfil más científico, y parece ser que por ejemplo los sociólogos no tienen una formación, al menos en España, tan matemática y científica, aunque ella sí venía con esa formación y se involucró muy bien en las prácticas y de ahí el premio que ha conseguido”.

 

El máster

La coordinadora del máster, que comenzó en el curso 2016-2017, informa de que no hay ningún otro en España que lleve el sello EMOS. Explica que “este máster, además de cumplir con la peritación nacional, tiene un sello de calidad europeo, que es el sello EMOS. Anualmente hay que presentar una memoria, y cada cuatro años se renueva el sello, algo que ha ocurrido recientemente, con unos criterios referidos al plan de estudios del máster, con un número de créditos mínimos dedicados al TFM y un número mínimo de prácticas en instituciones públicas que trabajan en la producción de estadísticas oficiales”.

 

Las prácticas, por tanto, se hacen en el INE (Instituto Nacional de Estadística), pero también en otras instituciones productoras de estadísticas oficiales como el Banco de España, el ministerio de Trabajo y Asuntos Sociales, la AEMET, el Instituto de la Mujer, el Instituto de Estudios Fiscales, el Ministerio de Educación y el ICEX. Añade Franco que se contacta anualmente con esas instituciones para ver si ofrecen prácticas ese año o no, y ellas mandan las características del estudiante que están buscando, luego desde el máster se hace un pequeño filtro y se reúnen con cada uno de los alumnos a los que “se les deja elegir, aunque con cierta orientación, para que vean que es un proceso transparente, pero no una rifa, sino que su expediente es una ventaja para el trabajo a realizar en cada centro”.

 

El tutor de la ganadora, profesor del máster y personal del INE, David Salgado, asegura que Bohnensteffen tenía “interés en aprender a utilizar las técnicas relacionadas con los big data, técnicas de machine learning e inteligencia artificial, que es lo que se investiga en el departamento de Metodología del INE”, y allí realizó las prácticas tanto con él como con Elena Rosa, también del INE y de la Facultad. Mientras la profesora está en una unidad productora del INE, Salgado está en una unidad horizontal, donde se piensan los métodos que luego se van a aplicar en la producción.

 

La estudiante, que venía ya con un alto nivel de español, tras un Erasmus en Salamanca y una formación previa en Alemania, se apuntó al máster de la Complutense con una cierta incertidumbre sobre si el español le iba a suponer una barrera, pero no fue así. “Ha sido una experiencia muy buena, porque hay gente de diferentes universidades, países y carreras. Eso es un reto para el máster porque cada uno entra con un nivel diferente, y aunque hay un cuatrimestre de nivelación es muy difícil poner a todos en el mismo nivel, aunque en lugar de un problema es algo enriquecedor porque cada uno tiene experiencias muy distintas y ese es un punto a favor, así como, por supuesto, el hacer las prácticas en un órgano oficial de estadística”, asegura Bohnensteffen.

 

Añade la coordinadora que este es un máster multidisciplinar que quizás no encaja de manera exacta en algunos grados, como Matemáticas, porque los egresados se pueden sentir un poco alejados al ver ahí indicadores socioeconómicos ajenos a su formación, a pesar de eso, cuenta con estudiantes, sobre todo, de Económicas, seguidos de Sociología, Matemáticas y Estadística y les gustaría “llegar también a ingenieros e informáticos, que son perfiles que se necesitan en Eurostat”. De acuerdo con Salgado, en el máster hay alumnos de otros muchos países, no sólo europeos como Bohnensteffen, sino también de América Latina, y “eso da una dimensión internacional, digna de destacar, a los estudios de la Complutense”.

 

Para recibirles y formarles durante dos años, hay profesores de ocho facultades de la UCM: Geografía e Historia, Derecho, Informática, Matemáticas, Económicas, EstadísticaSociología y Psicología. Para Alba María Franco, “los dos años de duración están muy bien a nivel formación, porque entre otras cosas las prácticas son tres meses, lo que es una buena oportunidad tanto para la institución como para el estudiante. Aunque es cierto que la duración puede parecerle larga a los estudiantes que se colocan muy bien nada más titularse”.

 

Bohnensteffen recuerda, de todos modos que “en el segundo año hay la opción de elegir entre diferentes asignaturas y así existe la posibilidad de enfocarse un poco más en un lado u otro, así que cada uno es responsable de buscarse su hueco”. Ella no duda en que recomendaría el máster, y esos dos años se le han pasado muy rápido, algo que depende de “si te gusta lo que estás haciendo, y si notas que profesores como David Salgado y Elena Rosa te enseñan algo útil para el mercado laboral, no sólo algo teórico”. Reconoce que en su trabajo actual todavía utiliza cosas que ha aprendido en el máster, algunos apuntes o pequeños códigos que ha programado, y eso le da la sensación de que “ha merecido la pena invertir ese tiempo, y dos años no son nada en comparación con la larga vida laboral que tenemos por delante”.

 

El premio

El TFM ganador del EMOS Master Thesis competition 2020 lo hizo con datos reales obtenidos en el INE, “que no son fáciles de conseguir para investigar con ellos”. Tiene claro su tutor que “una de las prioridades del sistema estadístico europeo es la modernización de la producción basándose en las nuevas técnicas de aprendizaje estadístico y big data, y la originalidad y el rigor del trabajo de Bohnensteffen es lo que se ha valorado, pero también ha sido muy importante que haya utilizado datos reales del INE”. Aclara Salgado que, por supuesto, cuando se empiezan las prácticas, los becarios tienen que firmar un tratamiento de confidencialidad y secretos estadísticos, y eso les permite acceder a los datos que se manejan para la producción de estadística pública y poder comprobar las ideas, programando con ellas.

 

El trabajo de la estudiante, realizado en el Departamento de Metodología del INE, consistió en encontrar un método para mejorar la depuración de datos, que en la actualidad es algo que se hace de manera manual, y para eso hay expertos que revisan y recontactan con las empresas para verificar esos datos. Su TFM ha consistido en “aplicar un random forest, que es una técnica de aprendizaje automático, para crear una ordenación de todas las observaciones para encontrar las que más influyen en los resultados y que más probabilidad tienen de ser erróneos. Si se consigue un algoritmo que sepa diferenciar las observaciones que influyen en los resultados se puede disminuir el trabajo manual, ya que se puede poner el enfoque en esas observaciones”.

 

Reconoce Salgado que tradicionalmente la depuración de datos comporta una cantidad de recursos importantes en los organismos públicos, ya que “hay que revisar muchísima información, así que la automatización permitirá ahorrar recursos, pero manteniendo la calidad. Bohnensteffen ha sido capaz de implementar esos random forests a la variable de cifra de negocios de esta encuesta para ver que, si eso se llevase a producción, ahorraría algo de recursos, y eso es un avance importante que le han reconocido en Europa”. La estudiante explica que el trabajo lo hizo para variables continuas, pero “en teoría se podría hacer también para variables categóricas y aplicarlo a diferentes tipos de encuestas”.

 

Bohnensteffen, que no se esperaba el premio, a pesar de que sí sabía que tenía entre manos una buena idea, se alegra mucho de poder presentar su trabajo en la conferencia NTTS, que se celebrará probablemente on line en marzo de 2021. Explica su tutor que cada universidad con el sello EMOS puede presentar hasta tres TFM de su elección al concurso. De la Complutense se presentaron dos, con el consentimiento de sus estudiantes, que compitieron con todas las demás de Europa, y el premio consiste en que los tres primeros finalistas hacen una presentación de su trabajo en una conferencia que organiza Eurostat cada dos años en Bruselas. Eurostat, de acuerdo con Salgado, organiza dos conferencias muy importantes en años alternativos, una es la NTTS, en los años impares, y otra que es la Q, los años pares. Esas son “las dos conferencias más importantes para la estadística oficial en Europa, y que te acepten un trabajo en estas conferencias, especialmente en la NTTS, donde presentará Bohnensteffen, es muy difícil, porque la competencia es muy alta”.

 

Este premio “para la Universidad Complutense es un hito, no sólo técnico, sino que además demuestra que nuestra universidad ha dado un paso para acercarse a la estadística oficial, lo que es una anomalía aquí en España”. Explica Salgado que en otros países europeos hay una gran colaboración entre el mundo académico y el mundo de la estadística oficial, porque “hay problemas abiertos que van surgiendo, y ahora la Complutense, con la reciente creación de este máster, ha dado un gran paso, acercándose a la estadística oficial”. Coincide la coordinadora del máster en que “el premio es un orgullo total, es un éxito de todos, porque es un reconocimiento y además nos sirve para darnos a conocer y que se vea la utilidad del máster”. Informa de que el trabajo ya está disponible en el repositorio institucional, porque “servirá de ejemplo, o al menos de modelo para que se sepa que ese es el objetivo para estar a la altura de Eurostat”.

 

El empleo

Sarah Bohnensteffen asevera que le gustó mucho hacer las prácticas en el INE, lo que ahora le permite comparar con el trabajo en la Oficina Federal de Estadística de Alemania. No descarta ir a otros países para seguir con esa comparación entre sistemas estadísticos, aunque de momento se quedará en Alemania ya que le han hecho un contrato de dos años, que “es lo habitual en el país para los trabajadores científicos que vienen de fuera, para luego pasar a ofrecer puestos indefinidos a la gente que ya está dentro. La probabilidad de que ocurra, si están contentos con tu trabajo y quieres seguir, es muy alta, y también hay posibilidades de cambiarse dentro o incluso pasar al Eurostat y hacer un trabajo un poco más internacional”.

 

Explica Bohnensteffen que “los ecosistemas de España y Alemania son muy extensos y hay algunas diferencias relacionadas con cómo trabaja la gente. En el INE, por ejemplo, hay mucha comunicación directa y a veces eso es muy bueno porque agiliza los procesos. En Destatis, sin embargo, hay un poco más de burocracia que a veces ayuda, pero otras es un obstáculo”.

 

El trabajo actual lo consiguió antes de conocer el resultado del concurso, pero tiene claro que el TFM le ha ayudado en el sentido de que aprendió mucho a lo largo del proyecto, tanto sobre la programación como sobre el ecosistema de un instituto nacional de estadística. También entiende Salgado que “la experiencia de Bohnensteffen en el máster, el hecho de estar en la punta de la lanza de la innovación ha debido de ser importante en su contratación en Destatis”.

 

Bohnensteffen ya echa de menos España, nuestra cultura y la dinámica de la vida diaria, y espera que se pase esta pandemia para volver pronto, aunque sea como turista.