cs.LG artículos | Gist.Science

Benchmark Leakage Trap: Can We Trust LLM-based Recommendation?

Este artículo identifica y demuestra que la filtración de datos en conjuntos de benchmark durante el preentrenamiento o ajuste fino de modelos de lenguaje grandes (LLM) genera métricas de rendimiento artificialmente infladas o degradadas en sistemas de recomendación, comprometiendo así la fiabilidad de las evaluaciones actuales.

Mingqiao Zhang, Qiyao Peng, Yumeng Wang, Chunyuan Liu, Hongtao Liu2026-03-10🤖 cs.LG

Mean Flow Policy with Instantaneous Velocity Constraint for One-step Action Generation

Este trabajo presenta la Política de Velocidad Media (MVP), un nuevo método de política generativa que, mediante una restricción de velocidad instantánea, logra la generación de acciones en un solo paso con alta expresividad y velocidad, superando el estado del arte en tareas de manipulación robótica.

Guojian Zhan, Letian Tao, Pengcheng Wang, Yixiao Wang, Yiheng Li, Yuxin Chen, Hongyang Li, Masayoshi Tomizuka, Shengbo Eben Li2026-03-10🤖 cs.LG

Pawsterior: Variational Flow Matching for Structured Simulation-Based Inference

El artículo presenta Pawsterior, un marco de coincidencia de flujos variacionales que mejora la inferencia basada en simulación al incorporar directamente la geometría de dominios estructurados y permitir la inferencia de variables latentes discretas, superando así las limitaciones de los métodos de flujo convencionales.

Jorge Carrasco-Pollo, Floor Eijkelboom, Jan-Willem van de Meent2026-03-10🤖 cs.LG

Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning

Este artículo propone una jerarquía de cinco niveles de aprendibilidad basada en la estructura de la información para explicar por qué la generación de código escala de manera predecible gracias a su retroalimentación densa y verificable, mientras que el aprendizaje por refuerzo enfrenta límites fundamentales que no se resuelven simplemente aumentando el tamaño de los modelos.

Zhimin Zhao2026-03-10🤖 cs.LG

LongAudio-RAG: Event-Grounded Question Answering over Multi-Hour Long Audio

El artículo presenta LongAudio-RAG, un marco híbrido que mejora la respuesta a preguntas sobre audios de larga duración al fundamentar las respuestas de los modelos de lenguaje en eventos acústicos recuperados de una base de datos SQL, permitiendo un despliegue eficiente en entornos edge-cloud con alta precisión y baja alucinación.

Naveen Vakada, Kartik Hegde, Arvind Krishna Sridhar, Yinyi Guo, Erik Visser2026-03-10🤖 cs.LG

Accelerated Predictive Coding Networks via Direct Kolen-Pollack Feedback Alignment

El artículo presenta DKP-PC, un algoritmo de codificación predictiva que utiliza conexiones de retroalimentación directa aprendibles para eliminar la dependencia de la profundidad en la propagación de errores y mitigar el desvanecimiento de las actualizaciones, logrando así una mayor eficiencia y rendimiento sin sacrificar la localidad de las actualizaciones.

Davide Casnici, Martin Lefebvre, Justin Dauwels, Charlotte Frenkel2026-03-10🤖 cs.LG

On the Power of Source Screening for Learning Shared Feature Extractors

Este artículo demuestra que, en el aprendizaje de extractores de características compartidos, la selección cuidadosa de un subconjunto de fuentes de datos informativas puede lograr la optimalidad minimax en la estimación del subespacio, incluso descartando una parte sustancial de los datos, y propone algoritmos y heurísticas prácticas para identificar dichas fuentes.

Leo Muxing Wang, Connor Mclaughlin, Lili Su2026-03-10🤖 cs.LG

Emotion Collider: Dual Hyperbolic Mirror Manifolds for Sentiment Recovery via Anti Emotion Reflection

El artículo presenta EC-Net, un marco de hipergrafos hiperbólicos que utiliza incrustaciones en la bola de Poincaré y aprendizaje contrastivo para mejorar la recuperación de sentimientos y la comprensión multimodal de emociones, logrando mayor precisión y robustez ante ruido o datos faltantes.

Rong Fu, Ziming Wang, Shuo Yin, Haiyun Wei, Kun Liu, Xianda Li, Zeli Su, Simon Fong2026-03-10🤖 cs.LG

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

El artículo presenta ModalImmune, un marco de entrenamiento que fortalece la inmunidad de los sistemas multimodales ante la pérdida o corrupción de canales de entrada mediante el colapso controlado de información modal durante el entrenamiento, logrando así representaciones conjuntas más robustas sin comprometer la estabilidad de la convergencia ni la capacidad de reconstrucción.

Rong Fu, Jia Yee Tan, Zijian Zhang, Ziming Wang, Zhaolu Kang, Muge Qi, Shuning Zhang, Simon Fong2026-03-10🤖 cs.LG

Whole-Brain Connectomic Graph Model Enables Whole-Body Locomotion Control in Fruit Fly

Este trabajo presenta el modelo FlyGM, que utiliza la arquitectura exacta del conectoma cerebral de una mosca de la fruta para controlar el movimiento corporal completo mediante aprendizaje por refuerzo, demostrando una mayor eficiencia y rendimiento en comparación con arquitecturas neuronales aleatorias o estándar.

Zehao Jin, Yaoye Zhu, Chen Zhang, Yanan Sui2026-03-10🤖 cs.LG

Conformal Tradeoffs: Guarantees Beyond Coverage

Este artículo propone un marco para la certificación operativa de predictores conformales que, más allá de garantizar la cobertura marginal, utiliza correcciones de muestra pequeña y conjuntos de auditoría independientes para cuantificar y gestionar las compensaciones finitas entre la frecuencia de compromiso, las deferencias y la exposición al error en despliegues reales.

Petrus H. Zwart2026-03-10🤖 cs.LG

Latent Equivariant Operators for Robust Object Recognition: Promise and Challenges

Este artículo presenta arquitecturas que aprenden operadores equivariantes en un espacio latente para mejorar el reconocimiento de objetos ante transformaciones simétricas no vistas durante el entrenamiento, demostrando su eficacia en conjuntos de datos simples como MNIST ruidoso y rotado, aunque advierte sobre los desafíos de escalar estas soluciones a conjuntos de datos más complejos.

Minh Dinh, Stéphane Deny2026-03-10🤖 cs.LG

Characterizing MARL for Energy Control: A Multi-KPI Benchmark on the CityLearn Environment

Este artículo establece un nuevo estándar de evaluación para el Aprendizaje por Refuerzo Multiagente (MARL) en la gestión energética urbana mediante el entorno CityLearn, demostrando que los enfoques de entrenamiento descentralizado superan a los centralizados y proponiendo nuevas métricas clave que revelan la resiliencia y sostenibilidad de las políticas aprendidas.

Aymen Khouja, Imen Jendoubi, Oumayma Mahjoub, Oussama Mahfoudhi, Ruan De Kock, Siddarth Singh, Claude Formanek2026-03-10🤖 cs.LG

RAmmStein: Regime Adaptation in Mean-reverting Markets with Stein Thresholds -- Optimal Impulse Control in Concentrated AMMs

El artículo presenta RAmmStein, un método de aprendizaje por refuerzo profundo que resuelve el problema de control óptimo en la provisión de liquidez concentrada mediante la adaptación a la dinámica de reversión a la media del mercado, logrando una mayor eficiencia de capital y rentabilidad neta al reducir drásticamente la frecuencia de rebalanceo y los costos operativos en comparación con las estrategias heurísticas existentes.

Pranay Anchuri2026-03-10🤖 cs.LG

Benchmarking GNN Models on Molecular Regression Tasks with CKA-Based Representation Analysis

Este estudio realiza una evaluación sistemática de cuatro arquitecturas de redes neuronales gráficas (GNN) en tareas de regresión molecular, demostrando que un marco de fusión jerárquica que combina GNN con huellas dactilares moleculares supera consistentemente a los modelos individuales y revelando mediante el análisis de alineación de núcleo centrado (CKA) que las representaciones de GNN y huellas dactilares ocupan espacios latentes altamente independientes.

Rajan, Ishaan Gupta2026-03-10🤖 cs.LG

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

El artículo presenta MrBERT, una familia de codificadores multilingües modernos optimizados mediante adaptación de vocabulario, dominio y dimensión que logran resultados de vanguardia en tareas específicas de catalán y español, así como en dominios especializados como el biomédico y legal, al tiempo que incorporan aprendizaje de representaciones matryoshka para reducir costos de inferencia y almacenamiento.

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta Villegas2026-03-10🤖 cs.LG

Autoregressive Visual Decoding from EEG Signals

El artículo presenta AVDE, un marco ligero y eficiente que utiliza un modelo autoregresivo y aprendizaje contrastivo para decodificar señales EEG en imágenes con alta fidelidad, superando a los métodos anteriores en rendimiento y reduciendo significativamente la complejidad computacional.

Sicheng Dai, Hongwang Xiao, Shan Yu, Qiwei Ye2026-03-10🤖 cs.LG

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

El artículo presenta CeRA, un adaptador paralelo que supera las limitaciones lineales de LoRA en tareas de razonamiento complejo mediante la expansión de variedades y el uso de puertas SiLU, logrando una eficiencia espectral superior y evitando el colapso de rango.

Hung-Hsuan Chen2026-03-10🤖 cs.LG

Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments

Este artículo presenta un enfoque para mejorar la relevancia de la búsqueda en la App Store mediante el uso de un modelo de lenguaje grande (LLM) especializado y ajustado para generar millones de etiquetas de relevancia textual, lo que permitió optimizar simultáneamente la relevancia conductual y textual, resultando en un aumento estadísticamente significativo del 0,24% en la tasa de conversión global y mejoras notables en consultas de cola.

Evangelia Christakopoulou, Vivekkumar Patel, Hemanth Velaga, Sandip Gaikwad, Sean Suchter, Venkat Sundaranatha2026-03-10🤖 cs.LG

End-to-end Differentiable Calibration and Reconstruction for Optical Particle Detectors

Este artículo presenta el primer simulador de detectores de partículas ópticas totalmente diferenciable, que unifica la simulación, la calibración y la reconstrucción en un único marco basado en gradientes, logrando una mayor precisión y eficiencia computacional mientras simplifica los pipelines de análisis tradicionales.

Omar Alterkait, César Jesús-Valls, Ryo Matsumoto, Patrick de Perio, Kazuhiro Terao2026-03-10🤖 cs.LG

← Anterior Siguiente →