cs artículos | Gist.Science

BoxMind: Closed-loop AI strategy optimization for elite boxing validated in the 2024 Olympics

El artículo presenta BoxMind, un sistema de IA de bucle cerrado que transforma datos de video no estructurados en inteligencia estratégica mediante un modelo predictivo basado en grafos, el cual fue validado durante los Juegos Olímpicos de París 2024 y contribuyó directamente al éxito histórico del equipo nacional chino de boxeo.

Kaiwen Wang, Kaili Zheng, Rongrong Deng, Qingmin Fan, Milin Zhang, Zongrui Li, Xuesi Zhou, Bo Han, Liren Chen, Chenyi Guo, Ji Wu2026-03-10💻 cs

Multifaceted Scenario-Aware Hypergraph Learning for Next POI Recommendation

El artículo presenta MSAHG, un marco de aprendizaje en hipergrafos que mejora la recomendación de puntos de interés futuros al dividir los datos en escenarios específicos para capturar patrones de movilidad distintos y resolver conflictos entre ellos mediante un mecanismo de división de parámetros.

Yuxi Lin, Yongkang Li, Jie Xing, Zipei Fan2026-03-10💻 cs

S2DiT: Sandwich Diffusion Transformer for Mobile Streaming Video Generation

El artículo presenta S2DiT, un modelo de Transformador de Difusión en sándwich optimizado para generar video de alta fidelidad en tiempo real en dispositivos móviles mediante mecanismos de atención eficientes y un marco de destilación, logrando más de 10 FPS en un iPhone con calidad comparable a los modelos de servidor más avanzados.

Lin Zhao, Yushu Wu, Aleksei Lebedev, Dishani Lahiri, Meng Dong, Arpit Sahni, Michael Vasilkovsky, Hao Chen, Ju Hu, Aliaksandr Siarohin, Sergey Tulyakov, Yanzhi Wang, Anil Kag, Yanyu Li2026-03-10💻 cs

Equal-Pay Contracts

Este artículo estudia el diseño de contratos de pago igualitario para equipos de agentes, proporcionando algoritmos de aproximación y resultados de dureza para diversas funciones de recompensa, resolviendo problemas abiertos en contratos sin restricciones y cuantificando el costo de la equidad mediante un precio de igualdad de $\Theta(\log n/ \log \log n)$ .

Michal Feldman, Yoav Gal-Tzur, Tomasz Ponitka, Maya Schlesinger2026-03-10💻 cs

ReViP: Mitigating False Completion in Vision-Language-Action Models with Vision-Proprioception Rebalance

El artículo presenta ReViP, un marco de modelos de visión-idioma-acción que mitiga las "completaciones falsas" mediante un reequilibrio entre visión y propiocepción, utilizando señales visuales conscientes del progreso para mejorar la robustez y el rendimiento en tareas de manipulación robótica.

Zhuohao Li, Yinghao Li, Jian-Jian Jiang, Lang Zhou, Tianyu Zhang, Jiadong Yin, Mu Lin, Yi-Kin Wei, Wei-Shi Zheng2026-03-10💻 cs

ScenePilot-Bench: A Large-Scale Dataset and Benchmark for Evaluation of Vision-Language Models in Autonomous Driving

Este artículo presenta ScenePilot-Bench, un nuevo benchmark a gran escala basado en el dataset ScenePilot-4K diseñado para evaluar y analizar las capacidades de los modelos de visión-linguaje en la comprensión, percepción espacial y planificación de movimiento para la conducción autónoma.

Yujin Wang, Yutong Zheng, Wenxian Fan, Tianyi Wang, Hongqing Chu, Li Zhang, Bingzhao Gao, Daxin Tian, Jianqiang Wang, Hong Chen2026-03-10💻 cs

Query-Guided Spatial-Temporal-Frequency Interaction for Music Audio-Visual Question Answering

Este trabajo presenta QSTar, un nuevo método de interacción espacial-temporal-frecuencial guiado por consultas que integra información textual desde etapas tempranas y explota las características de frecuencia del audio para superar las limitaciones de los enfoques existentes en la respuesta a preguntas audiovisuales (AVQA), logrando mejoras significativas en diversos benchmarks.

Kun Li, Michael Ying Yang, Sami Sebastian Brandt2026-03-10💻 cs

Dynamic framework for edge-connectivity maintenance of simple graphs

Este trabajo presenta un marco dinámico que mantiene la k-conectividad por aristas de un grafo simple mediante la inserción y eliminación de aristas, combinando certificados dispersos de Nagamochi-Ibaraki con árboles de enlace-corte para actualizaciones eficientes y un cálculo de flujo máximo para la restauración tras eliminaciones críticas.

Blazej Wrobel2026-03-10💻 cs

BioAgent Bench: An AI Agent Evaluation Suite for Bioinformatics

El artículo presenta BioAgent Bench, una suite de evaluación y conjunto de datos diseñado para medir el rendimiento y la robustez de agentes de IA en tareas bioinformáticas, revelando que, aunque los modelos avanzados pueden ejecutar pipelines complejos, sufiere fallos bajo perturbaciones y plantea dilemas de privacidad que favorecen el uso de modelos de pesos abiertos en entornos sensibles.

Dionizije Fa, Marko Čuljak, Bruno Pandža, Mateo Čupic2026-03-10💻 cs

Real-Time Aligned Reward Model beyond Semantics

Este trabajo presenta R2M, un marco de aprendizaje por refuerzo a partir de retroalimentación humana (RLHF) innovador que supera las limitaciones de la sobreoptimización de recompensas al alinear el modelo de recompensa con los cambios de distribución en tiempo real de la política mediante el uso de sus estados ocultos evolutivos, en lugar de depender únicamente de representaciones semánticas superficiales.

Zixuan Huang, Xin Xia, Yuxi Ren, Jianbin Zheng, Xuefeng Xiao, Hongyan Xie, Li Huaqiu, Songshi Liang, Zhongxiang Dai, Fuzhen Zhuang, Jianxin Li, Yikun Ban, Deqing Wang2026-03-10💻 cs

Impact of LLMs news Sentiment Analysis on Stock Price Movement Prediction

Este estudio evalúa el impacto del análisis de sentimiento de noticias basado en LLMs (DeBERTa, RoBERTa y FinBERT) en la predicción de movimientos del precio de las acciones, demostrando que DeBERTa supera a los otros modelos individuales y que un enfoque de ensamble alcanza una precisión del 80%, mejorando ligeramente el rendimiento de diversos arquitecturas de predicción.

Walid Siala (SnT, University of Luxembourg, Luxembourg), Ahmed Khanfir (RIADI, ENSI, University of Manouba, Tunisia, SnT, University of Luxembourg, Luxembourg), Mike Papadakis (SnT, University of Luxembourg, Luxembourg)2026-03-10💻 cs

From Performers to Creators: Understanding Retired Women's Perceptions of Technology-Enhanced Dance Performance

Este artículo presenta un enfoque de diseño sensible a la edad que, mediante talleres de co-diseño con tecnologías interactivas e IA, permite a las mujeres jubiladas en China transformar su papel de meras intérpretes a creadoras activas de performances de danza al reducir las barreras técnicas y fomentar su autoría.

Danlin Zheng, Xiaoying Wei, Chao Liu, Quanyu Zhang, Jingling Zhang, Shihui Guo, Mingming Fan2026-03-10💻 cs

Cognitive-Flexible Control via Latent Model Reorganization with Predictive Safety Guarantees

Este artículo presenta un marco de control cognitivamente flexible que adapta en línea las representaciones latentes de un modelo estocástico profundo bajo un índice de flexibilidad acotado, integrándolo en un esquema de control predictivo basado en modelos bayesianos para garantizar la seguridad, la viabilidad recursiva y la estabilidad en sistemas ciberfísicos no estacionarios.

Thanana Nuchkrua, Sudchai Boonto2026-03-10💻 cs

Green-VLA: Staged Vision-Language-Action Model for Generalist Robots

El artículo presenta Green-VLA, un marco de modelo de visión-lenguaje-acción con un currículo de cinco etapas y un pipeline de datos escalable que permite un despliegue seguro y generalizable en el robot humanoide Green y otros embodiments mediante adaptación específica y alineación con aprendizaje por refuerzo.

I. Apanasevich, M. Artemyev, R. Babakyan, P. Fedotova, D. Grankin, E. Kupryashin, A. Misailidi, D. Nerus, A. Nutalapati, G. Sidorov, I. Efremov, M. Gerasyov, D. Pikurov, Y. Senchenko, S. Davidenko, D. Kulikov, M. Sultankin, K. Askarbek, O. Shamanin, D. Statovoy, E. Zalyaev, I. Zorin, A. Letkin, E. Rusakov, A. Silchenko, V. Vorobyov, S. Sobolnikov, A. Postnikov2026-03-10💻 cs

Vulnerability-Amplifying Interaction Loops: a systematic failure mode in AI chatbot mental-health interactions

El estudio presenta SIM-VAIL, un marco de auditoría que revela cómo las interacciones entre usuarios vulnerables y chatbots de IA pueden generar bucles de amplificación de vulnerabilidades (VAILs) que acumulan riesgos clínicos a lo largo del tiempo, subrayando la necesidad de evaluaciones de seguridad multidimensionales y escalables.

Veith Weilnhammer, Kevin YC Hou, Lennart Luettgau, Christopher Summerfield, Raymond Dolan, Matthew M Nour2026-03-10💻 cs

AgenticLab: A Real-World Robot Agent Platform that Can See, Think, and Act

AgenticLab es una plataforma y benchmark de código abierto para agentes robóticos que, mediante un bucle cerrado de percepción y razonamiento en entornos reales no estructurados, expone limitaciones críticas de los modelos visión-lenguaje actuales que las evaluaciones estáticas no logran capturar.

Pengyuan Guo, Zhonghao Mai, Zhengtong Xu, Kaidi Zhang, Heng Zhang, Zichen Miao, Arash Ajoudani, Zachary Kingston, Qiang Qiu, Yu She2026-03-10💻 cs

Six Times to Spare: Characterizing GPU-Accelerated 5G LDPC Decoding for Edge-RSU Communications

Este artículo demuestra que la aceleración mediante GPU en plataformas de borde heterogéneas mejora significativamente el rendimiento y reduce la latencia de la decodificación LDPC para comunicaciones vehiculares 5G, liberando recursos de CPU críticos para cumplir con los estrictos requisitos de tiempo y potencia de las unidades RSU.

Ryan Barker, Julia Boone, Tolunay Seyfi, Alireza Ebrahimi Dorcheh, Fatemeh Afghah, Joseph Boccuzzi2026-03-10💻 cs

Extracting Recurring Vulnerabilities from Black-Box LLM-Generated Software

Este artículo presenta FSTab, un marco de ataque en caja negra que demuestra cómo las vulnerabilidades recurrentes en software generado por LLMs pueden predecirse a partir de características observables y evalúa la consistencia de estas fallas en modelos de última generación como GPT-5.2, Claude-4.5 Opus y Gemini-3 Pro, revelando un riesgo de seguridad significativo y transferible entre dominios.

Tomer Kordonsky, Maayan Yamin, Noam Benzimra, Amit LeVi, Avi Mendelson2026-03-10💻 cs

LMMRec: LLM-driven Motivation-aware Multimodal Recommendation

El artículo presenta LMMRec, un marco de recomendación multimodal impulsado por modelos de lenguaje grande que utiliza técnicas de razonamiento y aprendizaje contrastivo para extraer y alinear motivaciones finas de usuarios y artículos a partir de texto y datos de interacción, logrando mejoras significativas en el rendimiento.

Yicheng Di, Zhanjie Zhang, Yun Wang, Jinren Liu, Jiaqi Yan, Jiyu Wei, Xiangyu Chen, Yuan Liu2026-03-10💻 cs

Assessing Problem-Solving in HR Contexts: A Comparison Between Game-Based and Self-Report Measures

Este estudio demuestra que no existe una convergencia significativa entre las medidas de resolución de problemas basadas en juegos y las autoevaluadas, lo que respalda la necesidad de integrar ambos enfoques complementarios en los procesos de selección de personal para obtener una visión más completa de las competencias.

Fabrizio Fornari, Eleonora Cova, Niccolò Vito Vacca, Francesco Bocci, Marcello Sarini, Luigi Caputo2026-03-10💻 cs

← Anterior Siguiente →