cs.LG artículos | Gist.Science

SPOT: Single-Shot Positioning via Trainable Near-Field Rainbow Beamforming

Este artículo presenta SPOT, un esquema de aprendizaje profundo que utiliza arreglos de fase-tiempo para diseñar haces tipo arcoíris y estimar la posición del usuario en una sola transmisión, logrando una reducción significativa en la sobrecarga y un error de posicionamiento bidimensional menor que los métodos existentes.

Yeyue Cai, Jianhua Mo, Meixia Tao2026-03-06💻 cs

ReCast: Reliability-aware Codebook Assisted Lightweight Time Series Forecasting

ReCast es un marco de pronóstico de series temporales ligero y robusto que utiliza un código de aprendizaje para codificar patrones locales y una estrategia de actualización basada en la fiabilidad para manejar la no estacionariedad, superando a los modelos existentes en precisión y eficiencia.

Xiang Ma, Taihua Chen, Pengcheng Wang + 2 more2026-03-06💻 cs

Revisiting Multimodal KV Cache Compression: A Frequency-Domain-Guided Outlier-KV-Aware Approach

El artículo presenta FlashCache, un marco de compresión de caché KV multimodal que utiliza un enfoque guiado por el dominio de la frecuencia para identificar y preservar las salidas atípicas (outliers), logrando una reducción significativa de la memoria y una aceleración en la inferencia sin comprometer el rendimiento de los modelos.

Yaoxin Yang, Peng Ye, Xudong Tan + 4 more2026-03-06💻 cs

Observer-Actor: Active Vision Imitation Learning with Sparse-View Gaussian Splatting

El artículo presenta ObAct, un marco novedoso de aprendizaje por imitación con visión activa que utiliza un sistema robótico de doble brazo con cámaras en la muñeca para construir dinámicamente una representación 3DGS, explorar virtualmente y mover el brazo observador a la posición óptima, logrando así políticas más robustas y eficaces que superan significativamente a los enfoques con cámaras estáticas.

Yilong Wang, Cheng Qian, Ruomeng Fan + 1 more2026-03-06💻 cs

CycleChemist: A Dual-Pronged Machine Learning Framework for Organic Photovoltaic Discovery

Este trabajo presenta "CycleChemist", un marco de aprendizaje automático dual que integra el modelo de datos OPV2D, predictores de rendimiento y un generador de materiales (MatGPT) para acelerar el descubrimiento y diseño de materiales orgánicos fotovoltaicos de alto rendimiento.

Hou Hei Lam, Jiangjie Qiu, Xiuyuan Hu + 5 more2026-03-06🔬 cond-mat.mtrl-sci

A physics-informed U-Net-LSTM network for nonlinear structural response under seismic excitation

Este artículo propone un marco innovador de red U-Net-LSTM informada por física que integra leyes físicas con aprendizaje profundo para predecir con mayor precisión y eficiencia la respuesta sísmica no lineal de estructuras, superando las limitaciones computacionales del método de elementos finitos y la falta de generalización de los modelos puramente basados en datos.

Sutirtha Biswas, Kshitij Kumar Yadav2026-03-06💻 cs

DPAC: Distribution-Preserving Adversarial Control for Diffusion Sampling

El artículo presenta DPAC, un método de control adversarial para el muestreo de difusión que proyecta los gradientes sobre el espacio tangente definido por la geometría de la puntuación generativa para minimizar la divergencia KL en el espacio de trayectorias, preservando así la calidad de las muestras y mejorando métricas como el FID sin comprometer la tasa de éxito del ataque.

Han-Jin Lee, Han-Ju Lee, Jin-Seong Kim + 1 more2026-03-06💻 cs

An AI Implementation Science Study to Improve Trustworthy Data in a Large Healthcare System

Este estudio presenta una implementación de ciencia de la IA en el sistema pediátrico Shriners Childrens que moderniza su almacén de datos a OMOP CDM v5.4 en un entorno seguro de Microsoft Fabric, introduciendo una herramienta de evaluación de calidad de datos basada en Python que integra principios de IA confiable mediante el marco METRIC y compara estrategias de implementación para la microsomía craneofacial.

Benoit L. Marteau, Andrew Hornback, Shaun Q. Tan + 3 more2026-03-06💻 cs

GRAND: Guidance, Rebalancing, and Assignment for Networked Dispatch in Multi-Agent Path Finding

El artículo presenta GRAND, un algoritmo híbrido que combina una política de redes neuronales gráficas entrenada por aprendizaje por refuerzo con optimización de flujo mínimo y asignación local para mejorar el rendimiento y reducir la congestión en la programación de flotas de robots en almacenes, superando a los métodos actuales en benchmarks de gran escala.

Johannes Gaber, Meshal Alharbi, Daniele Gammelli + 1 more2026-03-06💻 cs

Fairness-Aware Fine-Tuning of Vision-Language Models for Medical Glaucoma Diagnosis

Este artículo presenta un enfoque de ajuste fino eficiente en parámetros para modelos de visión-idioma en el diagnóstico de glaucoma, que utiliza una nueva función de pérdida diferenciable y técnicas de ponderación para reducir significativamente las disparidades diagnósticas entre grupos demográficos manteniendo una alta precisión general.

Zijian Gu, Yuxi Liu, Zhenhao Zhang + 1 more2026-03-06💻 cs

Guided Flow Policy: Learning from High-Value Actions in Offline Reinforcement Learning

El artículo presenta Guided Flow Policy (GFP), un enfoque de aprendizaje por refuerzo offline que combina un actor distilado con un flujo de políticas guiado para priorizar la clonación de acciones de alto valor, logrando así un rendimiento superior en múltiples benchmarks al superar las limitaciones de la regularización conductual tradicional.

Franki Nguimatsia Tiofack, Théotime Le Hellard, Fabian Schramm + 2 more2026-03-06💻 cs

Bootstrapped Mixed Rewards for RL Post-Training: Injecting Canonical Action Order

Este artículo demuestra que en el entrenamiento post-RL de un Transformer para resolver acertijos tipo Zebra, la combinación de una recompensa de tarea con una señal de ordenamiento canónico mediante un enfoque de recompensas mixtas y escalado *bootstrapped* mejora el rendimiento en comparación con la optimización basada únicamente en la tarea, incluso cuando el modelo se entrena con secuencias de soluciones aleatorizadas.

Prakhar Gupta, Vaibhav Gupta2026-03-06💻 cs

NeuralRemaster: Phase-Preserving Diffusion for Structure-Aligned Generation

El artículo presenta NeuralRemaster, un método de difusión que preserva la fase de la imagen para generar resultados estructuralmente alineados y controlables en tareas como re-renderizado y mejora de simulaciones, sin requerir cambios arquitectónicos ni costos adicionales de inferencia.

Yu Zeng, Charles Ochoa, Mingyuan Zhou + 3 more2026-03-06💻 cs

Sparse Attention Post-Training for Mechanistic Interpretability

Este trabajo presenta un método de post-entrenamiento que logra una atención extremadamente dispersa en modelos de transformadores (reduciendo sus conexiones a aproximadamente el 0,4%) sin sacrificar el rendimiento, revelando circuitos más simples y organizados que facilitan la interpretabilidad mecánica al exponer la redundancia computacional inherente.

Florent Draye, Anson Lei, Hsiao-Ru Pan + 2 more2026-03-06💻 cs

Symmetric Aggregation of Conformity Scores for Efficient Uncertainty Sets

El artículo presenta SACP, un nuevo método que agrega simétricamente puntuaciones de no conformidad de múltiples modelos predictivos mediante valores-e para generar conjuntos de predicción más eficientes y válidos dentro del marco de la predicción conforme.

Nabil Alami, Jad Zakharia, Souhaib Ben Taieb2026-03-06💻 cs

Revolutionizing Mixed Precision Quantization: Towards Training-free Automatic Proxy Discovery via Large Language Models

Este artículo presenta TAP, un marco innovador impulsado por modelos de lenguaje grandes (LLM) y estrategias evolutivas que descubre automáticamente proxies de búsqueda de cuantización de precisión mixta sin necesidad de entrenamiento ni intervención humana, superando a los métodos convencionales mediante un controlador de optimización directa de preferencias (DPO) que refina dinámicamente la generación de proxies.

Haidong Kang, Jun Du, Lihong Lin2026-03-06💻 cs

ReFusion: A Diffusion Large Language Model with Parallel Autoregressive Decoding

El artículo presenta ReFusion, un modelo de difusión enmascarada que integra la reorganización de secuencias en un marco de atención causal para habilitar la decodificación paralela a nivel de bloques, logrando así una aceleración significativa y un rendimiento superior al de los modelos autoregresivos tradicionales mediante la reutilización completa de la caché KV y la reducción de la complejidad de aprendizaje.

Jia-Nan Li, Jian Guan, Wei Wu + 1 more2026-03-06💻 cs

Measuring Uncertainty Calibration

Este artículo presenta contribuciones no asintóticas y libres de distribución para estimar el error de calibración $L_1$ de clasificadores binarios, ofreciendo tanto un límite superior para funciones de calibración con variación acotada como un método para modificar clasificadores y garantizar un error acotado sin afectar significativamente su rendimiento.

Kamil Ciosek, Nicolò Felicioni, Sina Ghiassian + 6 more2026-03-06💻 cs

RePo: Language Models with Context Re-Positioning

El artículo presenta RePo, un mecanismo innovador que mejora el aprendizaje en contexto de los modelos de lenguaje reorganizando dinámicamente las posiciones de los tokens para reducir la carga cognitiva extrínseca y optimizar la atención hacia información relevante, logrando así un mejor rendimiento en tareas con contextos ruidosos, estructurados o extensos.

Huayang Li, Tianyu Zhao, Deng Cai + 1 more2026-03-06💻 cs

Agentic Multi-Persona Framework for Evidence-Aware Fake News Detection

El artículo presenta AMPEND-LS, un marco de detección de noticias falsas multimodal basado en agentes y sinergia entre modelos de lenguaje grandes y pequeños que supera a los métodos existentes al integrar evidencia, razonamiento estructurado y mecanismos de fusión de credibilidad para lograr mayor precisión, robustez y explicabilidad.

Roopa Bukke, Soumya Pandey, Suraj Kumar + 2 more2026-03-06💻 cs

← Anterior Siguiente →