cs.LG artículos | Gist.Science

Chart Deep Research in LVLMs via Parallel Relative Policy Optimization

Este artículo presenta PRPO, un método de optimización de políticas paralelas que resuelve conflictos en el entrenamiento de modelos visuales para el análisis profundo de gráficos, junto con MCDR-Bench, una nueva plataforma de evaluación objetiva que supera las limitaciones de las técnicas actuales al medir capacidades de razonamiento analítico avanzado.

Jiajin Tang, Gaoyang, Wenjie Wang, Sibei Yang, Xing Chen2026-03-10🤖 cs.LG

One step further with Monte-Carlo sampler to guide diffusion better

Este artículo propone una estrategia plug-and-play que combina un paso de desruido inverso adicional con muestreo Monte-Carlo para reducir errores de estimación y mejorar la calidad de la generación guiada en modelos de difusión basados en ecuaciones diferenciales estocásticas.

Minsi Ren, Wenhao Deng, Ruiqi Feng, Tailin Wu2026-03-10🤖 cs.LG

High-Resolution Image Reconstruction with Unsupervised Learning and Noisy Data Applied to Ion-Beam Dynamics for Particle Accelerators

Este trabajo presenta un marco de aprendizaje no supervisado que utiliza filtrado convolucional y redes neuronales para reconstruir imágenes de haces de iones con alta fidelidad y eliminar el ruido en condiciones de baja relación señal-ruido, permitiendo la detección de estructuras de halo más allá de siete desviaciones estándar sin necesidad de conjuntos de datos de entrenamiento.

Francis Osswald (IPHC), Mohammed Chahbaoui (UNISTRA), Xinyi Liang (SU)2026-03-10🤖 cs.LG

Soft Equivariance Regularization for Invariant Self-Supervised Learning

El artículo propone la Regularización de Equivarianza Suave (SER), un método que desacopla la invariancia y la equivarianza en diferentes capas de la red para mejorar el aprendizaje auto-supervisado, logrando así un rendimiento superior en tareas de clasificación, robustez ante perturbaciones y detección de objetos sin requerir cabezas de predicción auxiliares ni aumentar significativamente el costo computacional.

Joohyung Lee, Changhun Kim, Hyunsu Kim, Kwanhyung Lee, Juho Lee2026-03-10🤖 cs.LG

On the Generalization Capacities of MLLMs for Spatial Intelligence

Este artículo propone un marco de MLLM consciente de la cámara que, al inyectar parámetros intrínsecos, aplicar aumentación de datos específica y destilar priores geométricos, supera las limitaciones de generalización de los enfoques basados únicamente en RGB para lograr una inteligencia espacial robusta y transferible entre diferentes cámaras.

Gongjie Zhang, Wenhao Li, Quanhao Qian, Jiuniu Wang, Deli Zhao, Shijian Lu, Ran Xu2026-03-10🤖 cs.LG

Uncertainty-Aware Solar Flare Regression

Este estudio demuestra que la regresión cuantílica conformalizada mejora la fiabilidad de las predicciones de erupciones solares al proporcionar intervalos de confianza con mayor cobertura y longitudes más favorables en comparación con otros métodos de aprendizaje profundo.

Jinsu Hong, Chetraj Pandey, Berkay Aydin2026-03-10🔭 astro-ph

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

El artículo presenta ATLAS, un marco de ajuste fino con refuerzo que permite a los modelos de lenguaje pequeños operar eficazmente en grandes ecosistemas de herramientas mediante el aprendizaje de decisiones de control de contexto y estructura de ejecución, superando las limitaciones de los enfoques genéricos y acercándose al rendimiento de agentes avanzados con recursos limitados.

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

From Statistical Fidelity to Clinical Consistency: Scalable Generation and Auditing of Synthetic Patient Trajectories

Este estudio presenta una pipeline integrada que combina generación de alta fidelidad y auditoría automatizada con modelos de lenguaje para crear historiales clínicos sintéticos escalables y consistentes, los cuales preservan la privacidad y mejoran el rendimiento de los modelos downstream al eliminar inconsistencias clínicas que los métodos estadísticos tradicionales no detectan.

Guanglin Zhou, Armin Catic, Motahare Shabestari, Matthew Young, Chaiquan Li, Katrina Poppe, Sebastiano Barbieri2026-03-10🤖 cs.LG

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

El artículo presenta ProtAlign, un marco de aprendizaje contrastivo que alinea las secuencias y estructuras de proteínas en un espacio de incrustación compartido para mejorar la recuperación cruzada, las tareas de predicción downstream y la interpretabilidad de la relación entre la secuencia y la estructura.

Aditya Ranganath, Hasin Us Sami, Kowshik Thopalli, Bhavya Kailkhura, Wesam Sakla2026-03-10🤖 cs.LG

Bi Directional Feedback Fusion for Activity Aware Forecasting of Indoor CO2 and PM2.5

Este artículo presenta un marco de fusión de retroalimentación bidireccional que integra el comportamiento humano y los factores ambientales para mejorar la precisión y la interpretabilidad en la predicción de la calidad del aire interior (CO2 y PM2.5), superando a los métodos tradicionales mediante módulos temporales duales y una función de pérdida compuesta.

Harshala Gammulle, Lidia Morawska, Sridha Sridharan, Clinton Fookes2026-03-10🤖 cs.LG

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

El artículo presenta FutureBoosting, un enfoque híbrido que mejora significativamente la precisión de la predicción de precios eléctricos al integrar las capacidades de modelos fundacionales temporales congelados para generar características enriquecidas dentro de un marco de regresión, superando así a los modelos de vanguardia y reduciendo el error medio absoluto en más de un 30%.

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

El artículo presenta "Safe Transformer", un enfoque modular que inserta un bit de seguridad explícito en las capas de los modelos de lenguaje preentrenados para lograr una alineación segura, interpretable y controlable mediante un entrenamiento ligero que garantiza respuestas de rechazo o ayuda según el estado de dicho bit.

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

Orion: Characterizing and Programming Apple's Neural Engine for LLM Training and Inference

El paper presenta Orion, el primer sistema de extremo a extremo que habilita el entrenamiento y la inferencia de modelos de lenguaje grandes directamente en el Neural Engine de Apple mediante el uso de APIs privadas, superando las limitaciones de CoreML y logrando una aceleración significativa en el entrenamiento al optimizar la actualización de pesos sin recompilación completa.

Ramchand Kumaresan2026-03-10🤖 cs.LG

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

Este artículo presenta un enfoque de aprendizaje por refuerzo que extiende el rango operativo seguro de la navegación neuronal en multitudes densas mediante un codificado de observación invariante a la densidad y una recompensa informada por la física, logrando una generalización cero-shot que supera tanto el bloqueo de los métodos analíticos como las colisiones de los métodos basados en aprendizaje existentes.

Jiefu Zhang, Yang Xu, Vaneet Aggarwal2026-03-10🤖 cs.LG

PolyBlocks: A Compiler Infrastructure for AI Chips and Programming Frameworks

El artículo presenta PolyBlocks, una infraestructura de compilación modular basada en MLIR para frameworks de IA y chips que automatiza la generación de código de alto rendimiento mediante optimizaciones avanzadas, logrando un rendimiento comparable o superior a soluciones existentes como Torch Inductor y XLA.

Uday Bondhugula, Akshay Baviskar, Navdeep Katel, Vimal Patel, Anoop JS, Arnab Dutta2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

Este artículo presenta Calibrated Credit Intelligence (CCI), un marco de trabajo orientado a la implementación que combina puntuadores bayesianos, gradient boosting con restricciones de equidad y una estrategia de fusión consciente del cambio de distribución para generar puntuaciones de riesgo crediticio precisas, bien calibradas y justas ante la deriva temporal.

Srikumar Nayak2026-03-10🤖 cs.LG

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

Este artículo propone la Sesión Neural Implícita Factorizada por Rango (RIB), una alternativa a la sesgo posicional relativa que permite el uso de FlashAttention en transformadores de superresolución, logrando así escalar el tamaño de las ventanas de atención hasta 96×96 y mejorar significativamente tanto la calidad de la imagen como la eficiencia computacional.

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

Heterogeneous Decentralized Diffusion Models

Este artículo presenta un marco eficiente para el entrenamiento descentralizado de modelos de difusión heterogéneos que, al combinar objetivos de entrenamiento mixtos (DDPM y Flow Matching) y una arquitectura optimizada, reduce drásticamente los requisitos de cómputo y datos mientras mejora la calidad y diversidad de las imágenes generadas en comparación con enfoques anteriores homogéneos.

Zhiying Jiang, Raihan Seraj, Marcos Villagra, Bidhan Roy2026-03-10🤖 cs.LG

Improved Constrained Generation by Bridging Pretrained Generative Models

El artículo propone un marco de generación con restricciones que ajusta finamente modelos generativos preentrenados para producir muestras realistas dentro de regiones factibles complejas, logrando un nuevo equilibrio entre el cumplimiento de las restricciones y la calidad de la generación.

Xiaoxuan Liang, Saeid Naderiparizi, Yunpeng Liu, Berend Zwartsenberg, Frank Wood2026-03-10🤖 cs.LG

Stabilizing Reinforcement Learning for Diffusion Language Models

El artículo presenta StableDRL, un método de optimización de políticas que estabiliza el aprendizaje por refuerzo en modelos de lenguaje difusivos al reformular GRPO mediante un recorte incondicional y una auto-normalización para mitigar la inestabilidad causada por la estimación ruidosa de las razones de importancia.

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

← Anterior Siguiente →