REVISION:Reflective Intent Mining and Online Reasoning Auxiliary for E-commerce Visual Search System Optimization

El marco REVISION optimiza la búsqueda visual en el comercio electrónico de Taobao integrando la minería de intenciones implícitas mediante modelos grandes en una fase offline con la ejecución de decisiones adaptativas en línea, logrando así reducir significativamente la tasa de solicitudes sin clics al resolver la discrepancia entre las intenciones del usuario y la respuesta del sistema.

Yiwen Tang, Qiuyu Zhao, Zenghui Sun + 3 more2026-03-05🤖 cs.AI

Key and Value Weights Are Probably All You Need: On the Necessity of the Query, Key, Value weight Triplet in Self-Attention Transformers

Este artículo demuestra teórica y empíricamente que en los transformadores se pueden eliminar las matrices de pesos de las consultas (Query) o claves (Key) reemplazándolas por matrices identidad, lo que reduce los parámetros de atención en un 25% y simplifica la optimización sin sacrificar el rendimiento.

Marko Karbevski, Antonij Mijoski2026-03-05🤖 cs.AI

MuSaG: A Multimodal German Sarcasm Dataset with Full-Modal Annotations

Este artículo presenta MuSaG, el primer conjunto de datos multimodal en alemán para la detección de sarcasmo, que incluye anotaciones humanas alineadas de texto, audio y video, y revela una brecha significativa entre el rendimiento de los modelos actuales (que dependen principalmente del texto) y el de los humanos (que se basan fuertemente en el audio), motivando así el desarrollo de sistemas más robustos para escenarios realistas.

Aaron Scott, Maike Züfle, Jan Niehues2026-03-05🤖 cs.AI

Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents

Este trabajo presenta el Protocolo de Datos de Agentes (ADP), un lenguaje de representación ligero que unifica conjuntos de datos fragmentados en un formato estandarizado, permitiendo el ajuste fino efectivo de modelos de lenguaje para agentes y logrando un rendimiento superior en diversas tareas sin necesidad de optimización específica por dominio.

Yueqi Song, Ketan Ramaneti, Zaid Sheikh + 18 more2026-03-05🤖 cs.AI

Implicit Bias of Per-sample Adam on Separable Data: Departure from the Full-batch Regime

Este trabajo demuestra que el sesgo implícito del algoritmo Adam con actualizaciones por muestra individual en datos separables puede desviarse del régimen de lote completo, convergiendo en algunos casos hacia clasificadores de margen máximo 2\ell_2 en lugar de \ell_\infty, mientras que el algoritmo Signum mantiene una convergencia invariable hacia el margen máximo \ell_\infty independientemente del tamaño del lote.

Beomhan Baek, Minhak Song, Chulhee Yun2026-03-05🤖 cs.AI

Cognition Envelopes for Bounded Decision Making in Autonomous UAS Operations

Este artículo presenta los "sobres cognitivos", un marco que establece límites de razonamiento para restringir las decisiones erróneas de modelos de IA en sistemas ciberfísicos, validando su eficacia mediante un pipeline de análisis de pistas en misiones de búsqueda y rescate con drones autónomos y abordando los desafíos de ingeniería de software para su implementación.

Pedro Antonio Alarcon Granadeno, Arturo Miguel Bernal Russell, Sofia Nelson + 5 more2026-03-05🤖 cs.AI

CareMedEval dataset: Evaluating Critical Appraisal and Reasoning in the Biomedical Field

El artículo presenta CareMedEval, un nuevo conjunto de datos derivado de exámenes médicos franceses diseñado para evaluar la capacidad de razonamiento crítico y la comprensión de artículos científicos en modelos de lenguaje, revelando que, aunque el razonamiento intermedio mejora el rendimiento, los modelos actuales aún tienen dificultades significativas en tareas especializadas de evaluación biomédica.

Doria Bonzi, Alexandre Guiggi, Frédéric Béchet + 2 more2026-03-05🤖 cs.AI

DecNefSimulator: A Modular, Interpretable Framework for Decoded Neurofeedback Simulation Using Generative Models

El artículo presenta DecNefSimulator, un marco de simulación modular e interpretable que utiliza modelos generativos para formalizar el neurofeedback decodificado como un problema de aprendizaje automático, permitiendo a los investigadores analizar sus dinámicas, reproducir fenómenos empíricos y optimizar protocolos de forma virtual antes de su implementación en humanos.

Alexander Olza, Roberto Santana, David Soto2026-03-05🤖 cs.AI