BIOGRAFÍA
David Gómez-Ullate Oteiza (Madrid, 1973) es profesor titular en excedencia por la Universidad Complutense de Madrid y miembro del Instituto de Ciencias Matemáticas. Su trayectoria investigadora abarca múltiples áreas de la física matemática y la matemática aplicada: modelización de sistemas complejos, dinámica no lineal, teoría de la aproximación y aprendizaje estadístico. En la actualidad ocupa un puesto de investigador distinguido en la Universidad de Cádiz, centrando su trabajo en transferencia de las matemáticas y la inteligencia artificial al sector industrial.
PROYECTO
El proyecto desarrolla técnicas de inteligencia artificial y ciencia de datos para hacer frente al fraude en pagos con tarjeta de crédito. Durante el proyecto se han analizado más de 150 millones de transacciones electrónicas realizadas durante un periodo de un año. Utilizando técnicas de inteligencia artificial, se estudian cuáles son las trazas estadísticas y los patrones que siguen las transacciones que sabemos que han sido fraudulentas, para así poder predecir en tiempo real si una nueva transacción ha de ser bloqueada, o no, por parte de la entidad. La investigación aplica ideas matemáticas, estadísticas y de programación avanzadas a problemas reales. Las universidades aún no han desarrollado programas formativos en ciencia de datos, pero existe una fuerte demanda de estos perfiles profesionales en el mercado. Por este motivo, el proyecto incluye entre sus fines la formación de investigadores en aprendizaje estadístico y ciencia de datos.
RESULTADOS
Este problema tiene varias peculiaridades que lo hace especial, a pesar de ser un campo muy estudiado en machine learning: clases muy desequilibradas (aprox. 1 fraudulenta cada 6000 legítimas), ausencia de estacionariedad (los defraudadores evolucionan al ser conscientes de la mejora en las técnicas de detección), y la modelización de la utilidad planteada como un problema de toma de decisión para la entidad con muchos factores a considerar. Se han abordado todas estas cuestiones, mejorando y desarrollando nuevos algoritmos y obteniendo una mejora sustancial en la eficiencia de los modelos en uso al comienzo del proyecto. Las características del problema lo hacen susceptible de ser estudiado como un problema adversario, modelizando también el proceso de decisión y la utilidad del defraudador.
Sin embargo, la dificultad principal estriba en la ausencia de datasets públicos para investigación, que por su carácter sensible son difíciles de obtener de las entidades bancarias. La presencia de bases de datos benchmark para este problema, puede potenciar la investigación en este campo, al permitir la comparación entre diferentes algoritmos desarrollados por distintos grupos de investigación. Por su evidente valor comercial, la investigación sigue estando confinada al seno de las entidades, que protegen los resultados como secreto industrial.
En los aspectos formativos del proyecto, se han incorporado tres investigadores en formación, que actualmente trabajan en adversarial machine learning en el ICMAT.