cs.AI artículos | Gist.Science

Exploiting Spatiotemporal Properties for Efficient Event-Driven Human Pose Estimation

Este trabajo propone un marco basado en nubes de puntos que explota las propiedades espacio-temporales de las cámaras de eventos mediante módulos de convolución y secuenciación, mejorando la estimación de la postura humana con mayor eficiencia computacional y precisión en comparación con los métodos tradicionales.

Haoxian Zhou, Chuanzhi Xu, Langyi Chen, Pengfei Ye, Haodong Chen, Yuk Ying Chung, Qiang Qu2026-03-09🤖 cs.AI

A-3PO: Accelerating Asynchronous LLM Training with Staleness-aware Proximal Policy Approximation

El artículo presenta A-3PO, un método que acelera el entrenamiento asíncrono de modelos de lenguaje grandes al aproximar la política proximal mediante interpolación simple en lugar de calcularla explícitamente, logrando una aceleración de 1.8x sin comprometer el rendimiento.

Xiaocan Li, Shiliang Wu, Zheng Shen2026-03-09🤖 cs.AI

Data-Driven Global Sensitivity Analysis for Engineering Design Based on Individual Conditional Expectations

Este artículo propone un nuevo método de análisis de sensibilidad global basado en las curvas de Expectación Condicional Individual (ICE) para superar las limitaciones de los Gráficos de Dependencia Parcial (PDP) en la presencia de interacciones fuertes, demostrando mediante pruebas matemáticas y casos de estudio en ingeniería que esta aproximación ofrece una visión más rica y precisa de la importancia de las características en modelos de aprendizaje automático.

Pramudita Satria Palar, Paul Saves, Rommel G. Regis, Koji Shimoyama, Shigeru Obayashi, Nicolas Verstaevel, Joseph Morlier2026-03-09🤖 cs.AI

Understanding and Improving Hyperbolic Deep Reinforcement Learning

Este artículo presenta Hyper++, un agente de aprendizaje por refuerzo profundo en geometría hiperbólica que supera los desafíos de optimización mediante regularización de características, una función de pérdida categórica y capas mejoradas, logrando un entrenamiento estable y un rendimiento superior en entornos como ProcGen y Atari-5.

Timo Klein, Thomas Lang, Andrii Shkabrii, Alexander Sturm, Kevin Sidak, Lukas Miklautz, Claudia Plant, Yllka Velaj, Sebastian Tschiatschek2026-03-09🤖 cs.AI

Agent Tools Orchestration Leaks More: Dataset, Benchmark, and Mitigation

Este trabajo presenta el primer estudio sistemático del riesgo de privacidad en la orquestación de herramientas de agentes impulsados por LLMs, definiendo el marco TOP-R, creando el benchmark TOP-Bench para evaluar la fuga de información sensible a través de la inferencia compuesta, e identificando causas raíz y estrategias de mitigación que mejoran significativamente la seguridad sin comprometer la utilidad.

Yuxuan Qiao, Dongqin Liu, Hongchang Yang, Wei Zhou, Songlin Hu2026-03-09🤖 cs.AI

CASA: Cross-Attention over Self-Attention for Efficient Vision-Language Fusion

El artículo presenta CASA, un enfoque que reinvestiga y demuestra la eficacia de la atención cruzada para la fusión visión-lenguaje, logrando un rendimiento competitivo con los métodos de inserción de tokens mientras reduce significativamente el costo computacional y la latencia en aplicaciones de video en tiempo real.

Moritz Böhle, Amélie Royer, Juliette Marrie, Edouard Grave, Patrick Pérez2026-03-09🤖 cs.AI

CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

El artículo presenta CARE, un marco de post-entrenamiento centrado en el fracaso para el razonamiento multimodal que transforma errores en señales de supervisión mediante un objetivo de contraste anclado y una re-muestreo guiado por reflexión, logrando mejoras significativas en precisión y suavidad de entrenamiento en comparación con métodos existentes como GRPO.

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

Este artículo presenta LLMTM, un benchmark integral para evaluar y optimizar el rendimiento de los modelos de lenguaje grandes (LLM) en el análisis de motivos temporales en grafos dinámicos, proponiendo un agente aumentado con herramientas y un distribuidor consciente de la estructura que equilibra la alta precisión con la reducción de costos computacionales.

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Window-based Membership Inference Attacks Against Fine-tuned Large Language Models

El artículo presenta WBC, un nuevo método de ataque de inferencia de membresía para modelos de lenguaje grandes ajustados que supera a las técnicas existentes al analizar señales de memorización localizadas mediante una comparación basada en ventanas deslizantes, en lugar de depender de promedios globales.

Yuetian Chen, Yuntao Du, Kaiyuan Zhang, Ashish Kundu, Charles Fleming, Bruno Ribeiro, Ninghui Li2026-03-09🤖 cs.AI

Classroom AI: Large Language Models as Grade-Specific Teachers

Este artículo presenta un marco de trabajo que ajusta los modelos de lenguaje grandes para generar contenido educativo apropiado para diferentes niveles escolares, logrando una mejora significativa en la alineación con el grado sin sacrificar la precisión factual.

Jio Oh, Steven Euijong Whang, James Evans, Jindong Wang2026-03-09🤖 cs.AI

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

Este trabajo propone un marco de reconocimiento de habla audiovisual (AVSR) robusto y sin máscaras que integra un módulo de fusión basado en Conformer para refinar implícitamente las características de audio ruidosas mediante asistencia visual, preservando la integridad semántica y superando a los métodos basados en máscaras en el benchmark LRS3.

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI

PepEDiff: Zero-Shot Peptide Binder Design via Protein Embedding Diffusion

El artículo presenta PepEDiff, un generador novedoso de péptidos unidores que diseña secuencias de unión directamente en un espacio latente continuo derivado de incrustaciones de proteínas preentrenadas, eliminando la dependencia de la predicción de estructuras y superando a los métodos actuales en la generación de péptidos diversos y novedosos, como se demuestra en el caso de estudio del objetivo TIGIT.

Po-Yu Liang, Tibo Duran, Jun Bai2026-03-09🤖 cs.AI

SpatialMem: Metric-Aligned Long-Horizon Video Memory for Language Grounding and QA

SpatialMem es un sistema basado en memoria que utiliza una estructura espacial métrica 3D derivada de video egocéntrico RGB para habilitar la recuperación y el razonamiento de preguntas y respuestas de largo alcance en interiores, permitiendo consultas lingüísticas interpretables sobre relaciones espaciales sin necesidad de sensores especializados.

Xinyi Zheng, Yunze Liu, Chi-Hao Wu, Fan Zhang, Hao Zheng, Wenqi Zhou, Walterio W. Mayol-Cuevas, Junxiao Shen2026-03-09🤖 cs.AI

Neural Signals Generate Clinical Notes in the Wild

Este artículo presenta CELM, el primer modelo fundacional de EEG a lenguaje que genera informes clínicos automatizados a partir de grabaciones de EEG de larga duración, logrando mejoras significativas en métricas de generación al integrar modelos de EEG preentrenados con modelos de lenguaje.

Jathurshan Pradeepkumar, Zheng Chen, Jimeng Sun2026-03-09🤖 cs.AI

Localizing and Correcting Errors for LLM-based Planners

Este artículo presenta Localized In-Context Learning (L-ICL), una técnica que mejora significativamente la capacidad de los modelos de lenguaje grandes para generar planes válidos en tareas de planificación simbólica al inyectar correcciones dirigidas a los primeros pasos que violan las restricciones, superando así a los métodos tradicionales de aprendizaje en contexto.

Aditya Kumar, William W. Cohen2026-03-09🤖 cs.AI

Accelerating Scientific Research with Gemini: Case Studies and Common Techniques

Este artículo presenta una serie de estudios de caso y técnicas comunes que demuestran cómo la colaboración interactiva con modelos avanzados de Gemini, como Gemini Deep Think, acelera el descubrimiento científico al resolver problemas abiertos, refutar conjeturas y generar nuevas pruebas en campos como la informática teórica, la economía y la física.

David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, Jieming Mao, Song Zuo, MohammadHossein Bateni, Simina Branzei, Michael P. Brenner, Lin Chen, Ying Feng, Lance Fortnow, Gang Fu, Ziyi Guan, Zahra Hadizadeh, Mohammad T. Hajiaghayi, Mahdi JafariRaviz, Adel Javanmard, Karthik C. S., Ken-ichi Kawarabayashi, Ravi Kumar, Silvio Lattanzi, Euiwoong Lee, Yi Li, Ioannis Panageas, Dimitris Paparas, Benjamin Przybocki, Bernardo Subercaseaux, Ola Svensson, Shayan Taherijam, Xuan Wu, Eylon Yogev, Morteza Zadimoghaddam, Samson Zhou, Yossi Matias, James Manyika, Vahab Mirrokni2026-03-09🤖 cs.AI

Uncertainty Quantification in LLM Agents: Foundations, Emerging Challenges, and Opportunities

Este artículo propone un marco principista para la cuantificación de incertidumbre en agentes de modelos de lenguaje, estableciendo sus fundamentos teóricos, identificando cuatro desafíos técnicos clave en entornos interactivos y delineando direcciones futuras para mejorar la seguridad en aplicaciones complejas.

Changdae Oh, Seongheon Park, To Eun Kim, Jiatong Li, Wendi Li, Samuel Yeh, Xuefeng Du, Hamed Hassani, Paul Bogdan, Dawn Song, Sharon Li2026-03-09🤖 cs.AI

From Features to Actions: Explainability in Traditional and Agentic AI Systems

Este artículo demuestra que, a diferencia de los métodos de atribución efectivos en sistemas de IA estáticos, la explicabilidad basada en trazas es esencial para diagnosticar fallos en sistemas de IA agénticos, revelando que la inconsistencia en el seguimiento de estados es una causa principal de fracaso en sus trayectorias de decisión.

Sindhuja Chaduvula, Jessee Ho, Kina Kim, Aravind Narayanan, Mahshid Alinoori, Muskan Garg, Dhanesh Ramachandram, Shaina Raza2026-03-09🤖 cs.AI

Towards Autonomous Mathematics Research

El artículo presenta a Aletheia, un agente de investigación matemática autónomo que, potenciado por modelos avanzados de razonamiento y herramientas especializadas, demuestra capacidades que van desde la resolución de problemas olímpicos hasta la generación de artículos de investigación y la solución de problemas abiertos, marcando hitos significativos en la colaboración humano-IA en matemáticas.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

MERIT Feedback Elicits Better Bargaining in LLM Negotiators

El artículo presenta un marco centrado en la retroalimentación de utilidad que incluye el nuevo benchmark AgoraBench, métricas alineadas con la teoría económica y una metodología de aprendizaje basada en preferencias humanas, logrando mejorar significativamente la capacidad de negociación estratégica y la adaptación a factores humanos de los modelos de lenguaje grande.

Jihwan Oh, Murad Aghazada, Yooju Shin, Se-Young Yun, Taehyeon Kim2026-03-09🤖 cs.AI

← Anterior Siguiente →