Un nuevo estudio de Arcada Labs revela que los modelos de inteligencia artificial de frontera pierden hasta un 30% al operar en plataformas como Kalshi y Polymarket, aunque los investigadores ven potencial a futuro.
Los mercados de predicción como Kalshi y Polymarket han ganado popularidad, atrayendo la atención de reguladores y políticos, así como de usuarios en redes sociales que afirman obtener grandes ganancias usando modelos de inteligencia artificial. Sin embargo, un nuevo estudio publicado en el repositorio arXiv de la Universidad de Cornell sugiere que no es tan sencillo.
Investigadores de Arcada Labs, a través de su benchmark Prediction Arena, probaron seis modelos de inteligencia artificial de frontera asignando a cada uno 10.000 dólares para operar en mercados de predicción durante 57 días a principios de este año. El objetivo era evaluar cómo manejaban la información en tiempo real y la toma de decisiones en plataformas como Kalshi.
“Queríamos la evaluación más realista posible sobre si los modelos podían tomar decisiones en tiempo real”, explicó Grace Li, cofundadora de Arcada Labs y coautora del estudio. Los resultados mostraron que todos los modelos perdieron dinero, entre un 16% y un 30,8% en Kalshi, aunque las pérdidas fueron menores en un período más corto en Polymarket.
Li atribuye esta diferencia a la libertad de los modelos para elegir mercados en Polymarket, frente a un conjunto limitado de 26 en Kalshi. “En retrospectiva, no nos dimos cuenta de cuánto impacto tendría permitir que los modelos eligieran libremente en qué mercados operar”, señaló.
A pesar de las pérdidas, Li considera que las publicaciones en redes sociales sobre grandes retornos no son necesariamente exageradas, y menciona que en Polymarket “el trading con modelos de lenguaje sí está cumpliendo con las expectativas” en ejecuciones recientes. No obstante, aclara que estos éxitos no representan esquemas para hacerse rico rápidamente, sino una muestra del potencial de modelos cada vez más autónomos.
“Imaginamos que los modelos mejorarán de manera constante con el tiempo, superando la línea base humana, hasta que los fondos de cobertura impulsados por IA se vuelvan algo habitual”, afirmó Li. Sin embargo, su interés principal no es la ganancia económica, sino “qué significa para la humanidad esta unidad adicional de inteligencia”.
