MARRS: Masked Autoregressive Unit-based Reaction Synthesis

El trabajo presenta MARRS, un marco novedoso que genera reacciones humanas coordinadas y detalladas mediante representaciones continuas, utilizando un VAE dividido por unidades corporales, fusión condicionada por acciones, modulación adaptativa entre unidades y un modelo de difusión con predictores MLP independientes para superar las limitaciones de los enfoques autoregresivos basados en cuantización vectorial.

Yabiao Wang, Shuo Wang, Jiangning Zhang, Jiafu Wu, Qingdong He, Yong Liu2026-03-11💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

Este estudio evalúa empíricamente la eficacia de modelos de lenguaje preentrenados y grandes modelos de lenguaje en la detección de vulnerabilidades multilingües a nivel de función y línea, demostrando que los grandes modelos de lenguaje, especialmente GPT-4o, superan significativamente a los enfoques anteriores al identificar con mayor precisión vulnerabilidades críticas en múltiples lenguajes de programación.

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka Kamei2026-03-11💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

El artículo presenta SpikeSMOKE, una arquitectura de redes neuronales de espigas para la detección 3D de objetos monocular que, mediante un nuevo mecanismo de codificación de compuertas de escala cruzada y bloques residuales ligeros, logra una alta precisión en conjuntos de datos como KITTI y NuScenes mientras reduce significativamente el consumo energético y la complejidad computacional en comparación con métodos tradicionales.

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen Huang2026-03-11💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

Este artículo presenta un conjunto de datos a gran escala y longitudinal que abarca una década (2013-2022) de interacciones en el foro de noticias del periódico austriaco DerStandard, incluyendo más de 75 millones de comentarios y 400 millones de votos anonimizados y representados mediante vectores para preservar la privacidad, facilitando así investigaciones sobre dinámicas de discusión y análisis semántico en alemán.

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max Pellert2026-03-11💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

El artículo presenta FieldLVLM, un marco innovador que mejora la comprensión de los Grandes Modelos Visuales-Lingüísticos sobre datos de campos científicos mediante una estrategia de generación de lenguaje específica del dominio y un ajuste de modelos multimodales con compresión de datos, logrando un rendimiento superior en tareas de investigación científica.

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang Zhang2026-03-11💻 cs

CoRe-GS: Coarse-to-Refined Gaussian Splatting with Semantic Object Focus

El artículo presenta CoRe-GS, un marco de dispersión gaussiana de lo grueso a lo fino que optimiza selectivamente solo los objetos de interés en una escena, logrando una reconstrucción 3D más rápida y de mayor calidad al reducir los costos computacionales innecesarios para aplicaciones robóticas.

Hannah Schieber, Dominik Frischmann, Victor Schaack, Simon Boche, Angela Schoellig, Stefan Leutenegger, Daniel Roth2026-03-11💻 cs

Floating-Point Usage on GitHub: A Large-Scale Study of Statically Typed Languages

Este estudio presenta el primer análisis a gran escala del uso de aritmética de punto flotante en repositorios públicos de GitHub para lenguajes estáticamente tipados, revelando que, aunque algunos benchmarks existentes son representativos, el código real presenta matices que requieren nuevas evaluaciones y proporcionando un conjunto de datos de 10 millones de funciones para guiar el desarrollo futuro de técnicas de razonamiento.

Andrea Gilot, Tobias Wrigstad, Eva Darulova2026-03-11💻 cs

VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

El artículo presenta VocSegMRI, un marco de aprendizaje multimodal que integra señales visuales, acústicas y fonológicas mediante fusión por atención cruzada y aprendizaje contrastivo para lograr una segmentación precisa y robusta del tracto vocal en imágenes de resonancia magnética en tiempo real, superando a los métodos unimodales existentes.

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-Toro2026-03-11💻 cs

Multi-Quadruped Cooperative Object Transport: Learning Decentralized Pinch-Lift-Move

Este artículo presenta un enfoque de aprendizaje descentralizado que permite a equipos de robots cuadrúpedos cooperar mediante contacto físico para transportar objetos no manipulables, utilizando una arquitectura jerárquica y un diseño de recompensas que fomenta un comportamiento de agarre rígido sin necesidad de comunicación ni acoplamiento mecánico.

Bikram Pandit, Aayam Kumar Shrestha, Alan Fern2026-03-11💻 cs

Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS)

Este artículo presenta el Sistema de Cámara de Imágenes de Desove y Larvas de Coral (CSLICS), una solución automatizada de bajo costo que utiliza visión por computadora para contar desoves de coral con precisión, reduciendo drásticamente el trabajo manual y facilitando la restauración de arrecifes a gran escala.

Dorian Tsai, Christopher A. Brunner, Riki Lamont, F. Mikaela Nordborg, Andrea Severati, Java Terry, Karen Jackel, Matthew Dunbabin, Tobias Fischer, Scarlett Raine2026-03-11💻 cs

Learning Encoding-Decoding Direction Pairs to Unveil Concepts of Influence in Deep Vision Networks

Este trabajo propone un método no supervisado para recuperar los mecanismos de codificación y decodificación de conceptos en redes neuronales profundas mediante la identificación de pares de direcciones latentes, lo que permite desvelar conceptos interpretables, explicar predicciones y corregir errores sin depender de la reconstrucción de características.

Alexandros Doumanoglou, Kurt Driessens, Dimitrios Zarpalas2026-03-11💻 cs

Connectivity Maintenance and Recovery for Multi-Robot Motion Planning

Los autores proponen un algoritmo de planificación de movimiento en tiempo real basado en curvas Bézier y funciones de barrera y Lyapunov (MPC-CLF-CBF) que garantiza la conectividad y mejora la navegación de flotas de robots en entornos cluttered, permitiendo la recuperación ante pérdidas de conexión y validándose mediante simulaciones y experimentos físicos con ocho cuadricópteros Crazyflie.

Yutong Wang, Lishuo Pan, Yichun Qu, Tengxiang Wang, Nora Ayanian2026-03-11💻 cs

LARA-Gen: Enabling Continuous Emotion Control for Music Generation Models via Latent Affective Representation Alignment

El artículo presenta LARA-Gen, un marco que habilita el control continuo y fino de las emociones en la generación de música mediante la alineación de representaciones latentes afectivas y un módulo basado en el espacio valencia-activación, superando las limitaciones de los enfoques basados en texto y logrando un rendimiento superior en adherencia emocional y calidad musical.

Jiahao Mei, Xuenan Xu, Zeyu Xie, Zihao Zheng, Ye Tao, Yue Ding, Mengyue Wu2026-03-11💻 cs