Esta es una publicación de invitado coescrita con Mutisya Ndunda de Trumid.
Como muchas industrias, el mercado de bonos corporativos no se presta a un enfoque único para todos. Es enorme, la liquidez está fragmentada y los clientes institucionales exigen soluciones adaptadas a sus necesidades específicas. Los avances en IA y aprendizaje automático (ML) se pueden aprovechar para mejorar la experiencia del cliente, aumentar la eficiencia y la precisión de los flujos de trabajo operativos y aumentar el rendimiento al respaldar múltiples aspectos del proceso comercial.
Trumid es una empresa de tecnología financiera que construye la red de comercio de crédito del mañana: un mercado para el comercio eficiente, la difusión de información y la ejecución entre los participantes del mercado de bonos corporativos. Trumid agiliza la experiencia de negociación de crédito al combinar principios de tecnología y diseño de productos de vanguardia con una profunda experiencia en el mercado. El resultado es una solución comercial integrada que proporciona un ecosistema completo de protocolos y herramientas de ejecución dentro de una plataforma intuitiva.
El mercado de negociación de bonos implica tradicionalmente procesos de comparación de compradores/vendedores fuera de línea respaldados por tecnología basada en reglas. Trumid ha lanzado una iniciativa para transformar esa experiencia. A través de su plataforma de negociación electrónica, los comerciantes pueden acceder a miles de bonos para comprar o vender, una comunidad de usuarios dedicados para interactuar y una variedad de protocolos de negociación y soluciones de ejecución. Con una red de usuarios en crecimiento, el equipo de estrategia de datos e inteligencia artificial de Trumid se asoció con el laboratorio de soluciones de aprendizaje automático de AWS. El objetivo era desarrollar sistemas ML que pudieran proporcionar una experiencia comercial más personalizada al modelar el interés y las preferencias de los usuarios por los bonos disponibles en Trumid.
Estos modelos de ML se pueden usar para reducir el tiempo de comprensión y acción al personalizar la forma en que se presenta la información a cada usuario, asegurando que la información más relevante y procesable que le importa a un comerciante podría ser priorizada y accesible.
Para resolver este desafío, Trumid y ML Solutions Lab desarrollaron un proceso integral de preparación de datos, entrenamiento de modelos e inferencia basado en un modelo de red neuronal profunda integrado con Deep Graph Library for Knowledge Embedding (DGL-KE). . También se proporcionó una solución integral con Amazon SageMaker.
Beneficios del aprendizaje automático gráfico
Los datos del mundo real son complejos e interconectados y, a menudo, incluyen estructuras de red. Los ejemplos incluyen moléculas en la naturaleza, redes sociales, Internet, calles y plataformas de comercio financiero.
Los diagramas proporcionan una forma natural de modelar esta complejidad al extraer información rica e importante incrustada en las relaciones entre entidades.
Los algoritmos de ML tradicionales requieren que los datos se organicen como tablas o secuencias. Esto generalmente funciona bien, pero algunos dominios se representan de manera más natural y efectiva mediante diagramas (por ejemplo, una red de objetos que están relacionados entre sí, como se ilustra más adelante en esta publicación). En lugar de forzar estos registros de gráfico en tablas o secuencias, puede usar algoritmos de ML de gráficos para representar y aprender de los datos en su forma de gráfico, incluida la información sobre los nodos constituyentes, los bordes y otras características.
Dado que el comercio de bonos es inherentemente una red de interacciones entre compradores y vendedores que involucran diferentes tipos de instrumentos de bonos, una solución efectiva debe aprovechar los efectos de red de las comunidades comerciales que participan en el mercado. Veamos cómo aprovechamos los efectos de la red comercial e implementamos esa visión aquí.
solución
La negociación de bonos se caracteriza por varios factores, incluido el tamaño de la negociación, el plazo, el emisor, el precio, los valores de los cupones, el precio de oferta/demanda y el tipo de protocolo de negociación involucrado. Además de las órdenes y operaciones, Trumid también registra indicaciones de interés (IOI). Los datos históricos de interacción representan el comportamiento comercial y la evolución de las condiciones del mercado a lo largo del tiempo. Usamos estos datos para crear un gráfico de interacciones con marca de tiempo entre comerciantes, bonos y emisores y usamos Graph ML para predecir futuras interacciones.
La solución de recomendación implicó cuatro pasos principales:
- Preparación de los datos comerciales como un registro de datos gráficos
- Entrenar un modelo para incrustar gráficos de conocimiento
- Predicción de nuevas operaciones
- Empaquetar la solución como un flujo de trabajo escalable
En las siguientes secciones, analizamos cada paso en detalle.
Preparación de los datos comerciales como un conjunto de datos gráficos
Hay muchas formas de representar los datos comerciales como un gráfico. Una forma es representar los datos completamente con nodos, bordes y propiedades: comerciantes como nodos con propiedades (por ejemplo, empleador o tenencia), bonos como nodos con propiedades (emisor, monto pendiente, vencimiento, precio, valor de cupón) y transacciones como bordes con propiedades (fecha, tipo, tamaño). Otra posibilidad es simplificar los datos y usar solo nodos y relaciones (las relaciones se escriben como aristas como negociadas o emitidas por). Este último enfoque funcionó mejor en nuestro caso, y usamos el gráfico que se muestra en la figura a continuación.

Diagrama de relaciones entre intermediarios, bonos y emisores de bonos
Además, eliminamos algunas de las ventajas que se consideraban obsoletas: si un comerciante interactuaba con más de 100 bonos diferentes, solo conservamos los últimos 100 bonos.
Finalmente, guardamos el conjunto de datos del gráfico como una lista de bordes en formato TSV:
Entrenar un modelo para incrustar gráficos de conocimiento
Para los gráficos que consisten solo en nodos y relaciones (a menudo denominados gráficos de conocimiento), el equipo de DGL desarrolló Knowledge Graph Embedding Framework DGL-KE. KE significa Knowledge Embedding, por lo que la idea es representar nodos y relaciones (conocimiento) por medio de coordenadas (embeddings) y optimizar (entrenar) las coordenadas de tal manera que la estructura gráfica original pueda restaurarse a partir de las coordenadas. En la lista de modelos de incrustación disponibles, seleccionamos TransE (incrustación traslacional). TransE entrena incrustaciones con el objetivo de aproximar la siguiente igualdad:
Incrustación de nodo de origen + incrustación de relación = incrustación de nodo de destino (1)
Entrenamos al modelo llamando al dglke_train
Dominio. El resultado del entrenamiento es una carpeta modelo que contiene las incrustaciones entrenadas.
Para obtener más detalles sobre TransE, consulte Traducir incrustaciones para modelar datos multirelacionales.
Predicción de nuevas operaciones
Para predecir nuevas operaciones de un operador con nuestro modelo, usamos la igualdad (1): agregue la inserción del operador a la inserción reciente de la operación y busque los bonos más cercanos a la inserción resultante.
Esto lo hicimos en dos pasos:
- Calcule las puntuaciones para todas las relaciones comerciales posibles
dglke_predict
. - Calcule las 100 mejores puntuaciones para cada comerciante.
Para obtener instrucciones detalladas sobre el uso de la función ODE, consulte Incrustaciones de gráficos de conocimiento escalados con la biblioteca de gráficos profundos y la documentación de la función ODE.
Empaquetar la solución como un flujo de trabajo escalable
Usamos cuadernos de SageMaker para desarrollar y depurar nuestro código. Para la producción, queríamos invocar el modelo como una simple llamada a la API. Descubrimos que no necesitábamos separar la preparación de datos, el entrenamiento de modelos y la predicción, y era conveniente envolver toda la canalización en un solo script y usar el procesamiento de SageMaker. El procesamiento de SageMaker le permite ejecutar un script de forma remota en un tipo de instancia seleccionado y una imagen de Docker sin preocuparse por la asignación de recursos y la transferencia de datos. Esto fue fácil y económico para nosotros, ya que la instancia de GPU solo se usa y se paga durante los 15 minutos que tarda en ejecutarse el script.
Para obtener instrucciones detalladas sobre el uso del procesamiento de SageMaker, consulte Procesamiento de Amazon SageMaker: procesamiento de datos totalmente administrado y evaluación y procesamiento de modelos.
Resultados
Nuestro modelo de gráfico personalizado funcionó muy bien en comparación con otros métodos: el rendimiento mejoró en un 80 %, con resultados más estables en todos los tipos de operadores. Medimos el rendimiento utilizando el recuerdo medio (porcentaje de operaciones reales predichas por el recomendador promediado entre todos los operadores). Para otras métricas estándar, la mejora osciló entre el 50 y el 130 %.
Este desempeño nos permitió alinear mejor a los comerciantes y los bonos, lo que indica una mejor experiencia del comerciante dentro del modelo, con el aprendizaje automático como un gran paso adelante sobre las reglas codificadas que pueden ser difíciles de escalar.
Conclusión
Trumid se centra en proporcionar productos innovadores y flujos de trabajo más eficientes para su comunidad de usuarios. La creación de la red de comercio de crédito del mañana requiere una colaboración continua con colegas y expertos de la industria como AWS ML Solutions Lab, que está diseñado para ayudarlo a innovar más rápido.
Para obtener más información, consulte los siguientes recursos:
Sobre los autores
Marc van Oudheusden es científico de datos sénior en el equipo de Amazon ML Solutions Lab en Amazon Web Services. Trabaja con clientes de AWS para resolver problemas comerciales utilizando inteligencia artificial y aprendizaje automático. Fuera del trabajo, puede encontrarlo en la playa, jugando con sus hijos, surfeando o haciendo kitesurf.
Mutisya Ndunda es Jefe de Estrategia de Datos e IA en Trumid. Es un experimentado profesional de las finanzas con más de 20 años de amplia experiencia institucional en los sectores de los mercados de capitales, el comercio y la tecnología financiera. Mutisya tiene una sólida formación cuantitativa y analítica con más de una década de experiencia en inteligencia artificial, aprendizaje automático y análisis de big data. Antes de Trumid, fue director ejecutivo de Alpha Vertex, una empresa de tecnología financiera que brinda a las instituciones financieras soluciones de análisis impulsadas por algoritmos de inteligencia artificial patentados. Mutisya tiene una licenciatura en ingeniería eléctrica de la Universidad de Cornell y una maestría en ingeniería financiera de la Universidad de Cornell.
Isaac Privitera es un científico de datos sénior en Amazon Machine Learning Solutions Lab, donde desarrolla soluciones personalizadas de aprendizaje automático y aprendizaje profundo para abordar los problemas comerciales de los clientes. Trabajando principalmente en el espacio de la visión por computadora, se enfoca en habilitar la capacitación distribuida y el aprendizaje activo para los clientes de AWS.