cs.LG artículos | Gist.Science

Synthetic Monitoring Environments for Reinforcement Learning

Este artículo presenta los Entornos de Monitoreo Sintético (SMEs), una suite infinita de tareas de control continuo con políticas óptimas conocidas que permiten diagnósticos precisos y evaluaciones rigurosas de algoritmos de Aprendizaje por Refuerzo, transformando la evaluación empírica en un análisis científico estandarizado.

Leonard Pleiss, Carolin Schmidt, Maximilian Schiffer2026-03-09🤖 cs.LG

Robust support vector model based on bounded asymmetric elastic net loss for binary classification

Este artículo propone el modelo BAEN-SVM, que utiliza una nueva función de pérdida elástica asimétrica acotada para lograr una clasificación binaria robusta frente al ruido y con propiedades geométricas y teóricas mejoradas, resolviendo su optimización no convexa mediante un algoritmo eficiente.

Haiyan Du, Hu Yang2026-03-09🤖 cs.LG

Learning to Solve Orienteering Problem with Time Windows and Variable Profits

Este artículo presenta DeCoST, un enfoque de aprendizaje basado en dos etapas que desacopla las variables discretas y continuas del problema de orientación con ventanas de tiempo y beneficios variables, logrando una calidad de solución superior y una aceleración de inferencia de hasta 6,6 veces en comparación con los métodos existentes.

Songqun Gao, Zanxi Ruan, Patrick Floor, Marco Roveri, Luigi Palopoli, Daniele Fontanelli2026-03-09🤖 cs.AI

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

El estudio demuestra que los pipelines de razonamiento con recuperación aumentada por agentes mejoran la robustez y el consenso entre diversos modelos de lenguaje en preguntas de radiología, aunque advierte que la precisión y el acuerdo por sí solos no son suficientes para evaluar la fiabilidad clínica de estos sistemas.

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

Looking Through Glass Box

Este artículo presenta una implementación neuronal del mapa cognitivo difuso (FHM) que utiliza dinámicas de Langevin para aprender patrones de causalidad, resolver inversamente los valores de los nodos de salida y generar criterios de modificación, todo ello validado mediante evaluaciones en diversos conjuntos de datos.

Alexis Kafantaris2026-03-09🤖 cs.AI

Stem: Rethinking Causal Information Flow in Sparse Attention

El artículo presenta Stem, un módulo de dispersión plug-and-play que reorganiza el flujo de información en la atención causal mediante estrategias dependientes de la posición y métricas conscientes de la salida para reducir la complejidad computacional y la latencia en modelos de lenguaje grandes sin sacrificar la precisión.

Lin Niu, Xin Luo, Linchuan Xie, Yifu Sun, Guanghua Yu, Jianchen Zhu, S Kevin Zhou2026-03-09🤖 cs.AI

Learning Where the Physics Is: Probabilistic Adaptive Sampling for Stiff PDEs

El artículo presenta GMM-PIELM, un marco probabilístico que mejora la precisión y velocidad de los PIELMs para resolver EDPs rígidas con gradientes agudos, aprendiendo automáticamente una distribución de probabilidad para concentrar las funciones de base radial en regiones de alto error numérico sin necesidad de optimización basada en gradientes.

Akshay Govind Srinivasan, Balaji Srinivasan2026-03-09🤖 cs.AI

3D CBCT Artefact Removal Using Perpendicular Score-Based Diffusion Models

Este artículo propone un método de eliminación de artefactos en imágenes 3D de CBCT dental mediante modelos de difusión basados en puntuación perpendicular que operan en el dominio de las proyecciones para preservar las correlaciones tridimensionales y mejorar la calidad de la imagen.

Susanne Schaub, Florentin Bieder, Matheus L. Oliveira, Yulan Wang, Dorothea Dagassan-Berndt, Michael M. Bornstein, Philippe C. Cattin2026-03-09🤖 cs.LG

Polarized Direct Cross-Attention Message Passing in GNNs for Machinery Fault Diagnosis

Este artículo presenta PolaDCA, un nuevo marco de aprendizaje relacional basado en atención cruzada directa polarizada que supera las limitaciones de las redes neuronales gráficas convencionales mediante la construcción dinámica de grafos y el uso de características nodales semánticamente distintas, logrando así un diagnóstico de fallos en maquinaria rotativa más robusto y preciso en entornos industriales ruidosos.

Zongyu Shi, Laibin Zhang, Maoyin Chen2026-03-09🤖 cs.LG

From Entropy to Calibrated Uncertainty: Training Language Models to Reason About Uncertainty

El artículo propone un pipeline de tres etapas que entrena modelos de lenguaje para generar estimaciones de incertidumbre calibradas e interpretables de manera eficiente mediante el cálculo de entropía, la calibración con escalado de Platt y el ajuste fino con aprendizaje por refuerzo, superando así las limitaciones computacionales y de precisión de los métodos posteriores al entrenamiento.

Azza Jenane, Nassim Walha, Lukas Kuhn, Florian Buettner2026-03-09🤖 cs.AI

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

El artículo presenta SAHOO, un marco práctico que utiliza tres mecanismos de seguridad para monitorear y controlar la deriva de alineación durante la auto-mejora recursiva de sistemas de IA, logrando mejoras significativas en tareas de código y razonamiento sin comprometer la seguridad ni la veracidad.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

El estudio presenta AIRT, un marco de aprendizaje profundo de extremo a extremo capaz de generar planes de radioterapia VMAT para próstata en menos de un segundo con una calidad no inferior a los planes estándar, lo que representa un avance significativo hacia la estandarización y aceleración de los flujos de trabajo clínicos.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

MoEless: Efficient MoE LLM Serving via Serverless Computing

El artículo presenta MoEless, el primer marco de servicio de modelos de lenguaje grandes tipo Mezcla de Expertos (MoE) basado en computación sin servidor, que utiliza predictores de carga y estrategias de escalado optimizadas para mitigar el desequilibrio de expertos, reduciendo la latencia de inferencia en un 43% y los costos en un 84% en comparación con soluciones existentes.

Hanfei Yu, Bei Ouyang, Shwai He, Ang Li, Hao Wang2026-03-09🤖 cs.AI

Dynamic Chunking Diffusion Transformer

El artículo presenta el DC-DiT, un modelo de transformador de difusión que mejora la eficiencia y la calidad de la generación de imágenes mediante un mecanismo de fragmentación dinámica que adapta la cantidad de tokens procesados según la complejidad visual de las regiones de la imagen y la etapa del proceso de denoising.

Akash Haridas, Utkarsh Saxena, Parsa Ashrafi Fashi, Mehdi Rezagholizadeh, Vikram Appia, Emad Barsoum2026-03-09🤖 cs.AI

Frequency-Separable Hamiltonian Neural Network for Multi-Timescale Dynamics

Este trabajo presenta la Frequency-Separable Hamiltonian Neural Network (FS-HNN), un modelo que descompone la función hamiltoniana en modos rápidos y lentos mediante múltiples redes neuronales entrenadas a distintas escalas temporales para superar las limitaciones de los métodos anteriores y mejorar la extrapolación a largo plazo en sistemas dinámicos complejos gobernados por EDOs y EDPs.

Yaojun Li, Yulong Yang, Christine Allen-Blanchette2026-03-09🤖 cs.LG

Tiny, Hardware-Independent, Compression-based Classification

Este trabajo presenta un modelo de clasificación basado en la distancia de compresión normalizada que, a pesar de no ser una métrica formal, logra una precisión comparable o superior a los métodos actuales con un bajo costo computacional y pocos datos, permitiendo su ejecución eficiente en dispositivos cliente para preservar la privacidad.

Charles Meyers, Aaron MacSween, Erik Elmroth, Tommy Löfstedt2026-03-09🤖 cs.LG

CLAIRE: Compressed Latent Autoencoder for Industrial Representation and Evaluation -- A Deep Learning Framework for Smart Manufacturing

El artículo presenta CLAIRE, un marco de aprendizaje profundo híbrido que combina autoencoders no supervisados y clasificación supervisada para mejorar la detección de fallos en la fabricación inteligente mediante la reducción de dimensionalidad y la interpretabilidad de las características.

Mohammadhossein Ghahramani, Mengchu Zhou2026-03-09🤖 cs.AI

Adaptive Lipschitz-Free Conditional Gradient Methods for Stochastic Composite Nonconvex Optimization

Este trabajo presenta ALFCG, el primer marco de gradiente condicional adaptativo y libre de proyecciones para la minimización estocástica no convexa que estima la suavidad local sin requerir constantes globales ni búsqueda de línea, logrando tasas de convergencia óptimas y superando a los métodos actuales en experimentos de clasificación multiclase.

Ganzhao Yuan2026-03-09🤖 cs.LG

Kinetic-based regularization: Learning spatial derivatives and PDE applications

Este artículo extiende la regularización basada en cinética (KBR) para estimar derivadas espaciales con precisión de segundo orden mediante esquemas explícitos e implícitos, demostrando su eficacia en la captura estable de choques en ecuaciones diferenciales parciales hiperbólicas unidimensionales y su potencial para resolver PDEs en nubes de puntos irregulares.

Abhisek Ganguly, Santosh Ansumali, Sauro Succi2026-03-09🤖 cs.AI

Talk Freely, Execute Strictly: Schema-Gated Agentic AI for Flexible and Reproducible Scientific Workflows

El artículo propone una arquitectura de orquestación "gated" por esquemas que separa la flexibilidad conversacional de la ejecución determinista en flujos de trabajo científicos, validando que esta aproximación resuelve la tensión entre adaptabilidad y reproducibilidad mediante un marco de evaluación basado en múltiples modelos de lenguaje.

Joel Strickland, Arjun Vijeta, Chris Moores, Oliwia Bodek, Bogdan Nenchev, Thomas Whitehead, Charles Phillips, Karl Tassenberg, Gareth Conduit, Ben Pellegrini2026-03-09🤖 cs.AI

← Anterior Siguiente →