cs.LG artículos | Gist.Science

$P^2$ GNN: Two Prototype Sets to boost GNN Performance

El artículo presenta $P^2$ GNN, una técnica plug-and-play que utiliza dos conjuntos de prototipos para enriquecer el contexto global y mitigar el ruido en los vecindarios locales, logrando así un rendimiento superior en tareas de recomendación y clasificación de nodos en comparación con los modelos de producción existentes.

Arihant Jain, Gundeep Arora, Anoop Saladi, Chaosheng Dong2026-03-11🤖 cs.LG

The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness

El artículo "The Reasoning Trap" advierte que las mejoras en el razonamiento lógico de los modelos de lenguaje podrían desencadenar inadvertidamente una conciencia situacional peligrosa mediante mecanismos de inferencia deductiva, reconocimiento inductivo y modelado abductivo, proponiendo a su vez nuevos marcos de seguridad para mitigar este riesgo.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-11🤖 cs.AI

The Radio-Frequency Transformer for Signal Separation

Este artículo presenta un separador de señales totalmente basado en datos que utiliza un tokenizador discreto modificado y un transformador entrenado con pérdida de entropía cruzada para estimar eficazmente una señal de interés contaminada por interferencias no gaussianas, logrando una reducción significativa en la tasa de error de bits y demostrando generalización cero-shot en mezclas de radiofrecuencia.

Egor Lifar, Semyon Savkin, Rachana Madhukara, Tejas Jayashankar, Yury Polyanskiy, Gregory W. Wornell2026-03-11🤖 cs.LG

Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing

Este trabajo demuestra que el tono emocional es un factor latente que altera la geometría de la atención en los modelos de lenguaje, proponiendo el dataset AURA-QA y un marco de regularización emocional que mejora la comprensión lectora y el rendimiento en tareas de preguntas y respuestas bajo diversas distribuciones.

Benjamin Reichman, Adar Avasian, Samuel Webster, Larry Heck2026-03-11🤖 cs.AI

MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data

El artículo presenta MM-Zero, el primer marco basado en aprendizaje por refuerzo que permite la autoevolución de modelos de visión y lenguaje desde cero sin datos, mediante un sistema de tres roles especializados (propuestor, codificador y solucionador) que generan conceptos visuales abstractos, crean imágenes ejecutables y realizan razonamiento multimodal.

Zongxia Li, Hongyang Du, Chengsong Huang, Xiyang Wu, Lantao Yu, Yicheng He, Jing Xie, Xiaomin Wu, Zhichao Liu, Jiarui Zhang, Fuxiao Liu2026-03-11🤖 cs.LG

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Este artículo presenta \texttt{RQRE-OVI}, un algoritmo de iteración de valor optimista con aproximación de funciones lineales que calcula de manera eficiente y robusta el Equilibrio de Respuesta Cuantitativa Sensible al Riesgo (RQRE) en juegos de Markov de suma general, logrando un equilibrio único y estable que supera la fragilidad del equilibrio de Nash mediante un compromiso cuantificable entre rendimiento y robustez.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. Ratliff2026-03-11🤖 cs.LG

Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control

Este trabajo presenta la capa Test-Time Control (TTC), un componente arquitectónico basado en control óptimo y un solver LQR eficiente en hardware que, al integrarse en modelos de lenguaje preentrenados, mejora significativamente la capacidad de razonamiento matemático sin depender de entrenamiento en tiempo de prueba.

Peihao Wang, Shan Yang, Xijun Wang, Tesi Xiao, Xin Liu, Changlong Yu, Yu Lou, Pan Li, Zhangyang Wang, Ming Lin, René Vidal2026-03-11🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

Este artículo presenta un marco unificado de muestreo generativo basado en la reversibilidad temporal y la discrepancia máxima de media (MMD) que permite muestrear distribuciones complejas en espacios continuos, discretos o mixtos sin requerir funciones de puntuación ni relajaciones continuas, utilizando únicamente evaluaciones de energía.

Lei Li, Zhen Wang, Lishuo Zhang2026-03-11🤖 cs.LG

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

Este artículo propone un enfoque de entrenamiento exclusivo que integra un prior de atención sensible a la longitud y un controlador de ganancia adaptable para mejorar el razonamiento eficiente en modelos Transformer sin incrementar los costos de tiempo de prueba.

Rian Atri2026-03-11🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Este trabajo establece nuevos límites de generalización transductiva basados en transporte óptimo para la clasificación de nodos en grafos, demostrando que son computacionalmente eficientes, se correlacionan fuertemente con el rendimiento empírico y revelan cómo la profundidad de las GNN afecta la generalización mediante un equilibrio entre la concentración intraclase y la separación interclase.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo Kim2026-03-11🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

El artículo presenta DendroNN, una red neuronal bioinspirada que utiliza mecanismos de detección de secuencias en dendritas y un proceso de reconfiguración sin gradientes para clasificar datos basados en eventos con alta eficiencia energética, superando a las arquitecturas neuromórficas actuales en tareas de series temporales.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen Becker2026-03-11🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Este artículo establece nuevos límites de arrepentimiento para el muestreo de Thompson con procesos gaussianos (GP-TS), incluyendo una cota inferior, una cota superior para el segundo momento del arrepentimiento acumulado, límites de arrepentimiento "leniente" esperados y una cota superior mejorada para el horizonte temporal, cerrando así brechas analíticas existentes frente al método GP-UCB.

Shion Takeno, Shogo Iwazaki2026-03-11🤖 cs.LG

Proxy-Guided Measurement Calibration

Este artículo propone un marco basado en variables proxy y autoencoders variacionales para identificar y corregir errores de medición sistemáticos en variables de resultado, separando los factores latentes del contenido real de los que inducen sesgo.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan Liu2026-03-11🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Este artículo presenta un teorema de comparación no asintótico basado en el teorema de Gordon para analizar la dinámica de entrenamiento de algoritmos de aprendizaje automático bajo modelos de mezcla gaussiana, demostrando la validez de las expresiones de campo medio dinámico en escenarios asintóticos y proponiendo un esquema de refinamiento iterativo para mejorar la precisión en dominios no asintóticos.

Ashkan Panahi2026-03-11🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

El artículo presenta CLoE, un marco de aprendizaje de consistencia que mejora la segmentación de imágenes médicas multimodales con modalidades faltantes al controlar la concordancia entre expertos a nivel de decisión y región, asignando pesos de fiabilidad dinámicos para lograr una fusión robusta y generalizable.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao Li2026-03-11🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

El artículo presenta Reward-Zero, un mecanismo de recompensa implícita general que utiliza incrustaciones de lenguaje para convertir descripciones de tareas en señales de progreso densas y semánticamente alineadas, acelerando la exploración y mejorando la generalización en el aprendizaje por refuerzo sin necesidad de ingeniería de recompensas específica.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu She2026-03-11🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

El artículo presenta TA-GGAD, un modelo gráfico adaptativo de tiempo de prueba que aborda el problema de la disortividad de anomalías ( $\mathcal{AD}$ ) para lograr una detección generalista de anomalías con alto rendimiento en múltiples dominios tras una única fase de entrenamiento.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

Este artículo presenta un marco de trabajo basado en datos que combina un modelo de red neuronal con generación sintética de datos y una interfaz web interactiva para predecir y visualizar en 3D la rugosidad superficial en la fabricación aditiva por extrusión de material, permitiendo una planificación de procesos optimizada antes de la impresión.

Engin Deniz Erkan, Elif Surer, Ulas Yaman2026-03-11🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Este artículo presenta un marco de optimización de orden cero con privacidad diferencial que extiende la condensación de datos a modelos clínicos no diferenciables, permitiendo compartir conjuntos de datos sintéticos compactos que preservan la utilidad predictiva sin exponer información sensible de los pacientes.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. Clifton2026-03-11🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

El artículo presenta CAHC, un método de aprendizaje contrastivo de extremo a extremo para el agrupamiento de hipergrafos atribuidos que optimiza simultáneamente la representación de nodos y la asignación de clústeres mediante objetivos a nivel de nodo e hiperborde, superando a los métodos existentes en múltiples conjuntos de datos.

Li Ni, Shuaikang Zeng, Lin Mu, Longlong Lin2026-03-11🤖 cs.LG

← Anterior Siguiente →

cs.LG

P2P^2P2GNN: Two Prototype Sets to boost GNN Performance