cs.LG artículos | Gist.Science

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

Este trabajo presenta garantías finitas de muestra para aprender representaciones de estado impulsadas por costos y controladores subóptimos en sistemas de control lineal cuadrático gaussiano (LQG) de horizonte infinito, abordando tanto modelos de dinámica latente explícitos como implícitos (similares a MuZero) y estableciendo una nueva contribución técnica sobre la excitación persistente en procesos estocásticos.

Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra2026-03-10🤖 cs.LG

Few Tokens, Big Leverage: Preserving Safety Alignment by Constraining Safety Tokens during Fine-tuning

El artículo presenta PACT, un marco de ajuste fino que preserva la alineación de seguridad en modelos de lenguaje al restringir específicamente la confianza en tokens de seguridad durante el entrenamiento, evitando así la deriva de seguridad sin comprometer el rendimiento en tareas generales.

Guoli Wang, Haonan Shi, Tu Ouyang, An Wang2026-03-10🤖 cs.LG

Discrete Tokenization Unlocks Transformers for Calibrated Tabular Forecasting

Este artículo demuestra que un tokenizador discreto simple, combinado con suavizado gaussiano adaptativo, permite que los Transformers superen a los modelos de gradient boosting en la predicción tabular, logrando mayor precisión y calibración probabilística en un conjunto de datos masivo.

Yael S. Elmatad2026-03-10🤖 cs.LG

Dial: A Knowledge-Grounded Dialect-Specific NL2SQL System

El artículo presenta Dial, un sistema de NL2SQL basado en conocimiento que aborda la heterogeneidad de los dialectos SQL mediante planificación lógica consciente del dialecto, una base de conocimiento jerárquica y un bucle de depuración, logrando mejoras significativas en precisión y cobertura de características en comparación con los métodos existentes.

Xiang Zhang, Hongming Xu, Le Zhou, Wei Zhou, Xuanhe Zhou, Guoliang Li, Yuyu Luo, Changdong Liu, Guorun Chen, Jiang Liao, Fan Wu2026-03-10🤖 cs.LG

SLNet: A Super-Lightweight Geometry-Adaptive Network for 3D Point Cloud Recognition

El artículo presenta SLNet, una red neuronal extremadamente ligera y adaptable geométricamente para el reconocimiento de nubes de puntos 3D que logra un rendimiento competitivo en diversas tareas con una fracción de los parámetros y costos computacionales de modelos existentes, gracias a sus componentes NAPE y GMU.

Mohammad Saeid, Amir Salarpour, Pedram MohajerAnsari, Mert D. Pesé2026-03-10🤖 cs.LG

The Dual-Stream Transformer: Channelized Architecture for Interpretable Language Modeling

Este trabajo presenta el Transformador de Doble Flujo, una arquitectura que descompone el flujo residual en dos componentes funcionales distintos para lograr un equilibrio ajustable entre la interpretabilidad y el rendimiento en modelos de lenguaje, demostrando que estrategias de mezcla como la de Kronecker permiten una comunicación eficiente entre cabezas de atención con una pérdida de rendimiento mínima.

J. Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Trusting What You Cannot See: Auditable Fine-Tuning and Inference for Proprietary AI

El artículo presenta AFTUNE, un marco auditable y verificable que garantiza la integridad computacional del ajuste fino y la inferencia de modelos grandes en la nube mediante un mecanismo ligero de registro y verificación por muestreo, permitiendo a los clientes auditar procesos propietarios sin incurrir en sobrecargas prohibitivas.

Heng Jin, Chaoyu Zhang, Hexuan Yu, Shanghao Shi, Ning Zhang, Y. Thomas Hou, Wenjing Lou2026-03-10🤖 cs.LG

Probabilistic Inference and Learning with Stein's Method

Esta monografía ofrece una visión rigurosa de los aspectos teóricos y metodológicos de la inferencia probabilística y el aprendizaje mediante el método de Stein, abarcando desde la construcción de discrepancias y sus propiedades hasta su conexión con el descenso de gradiente variacional de Stein.

Qiang Liu, Lester Mackey, Chris Oates2026-03-10🤖 cs.LG

Towards Lightweight Adaptation of Speech Enhancement Models in Real-World Environments

Este trabajo propone un marco de adaptación ligero que, mediante el uso de adaptadores de bajo rango actualizados con aprendizaje auto-supervisado sobre una base congelada, mejora la robustez de los modelos de mejora de voz en entornos acústicos dinámicos con menos del 1% de parámetros actualizados y una rápida convergencia, facilitando su implementación en dispositivos.

Longbiao Cheng, Shih-Chii Liu2026-03-10🤖 cs.LG

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

Este estudio presenta un marco condicional de difusión-transformer que genera conjuntos heterogéneos de conformaciones tridimensionales del genoma de *E. coli* guiados por mapas de contacto Hi-C, superando las limitaciones de los modelos deterministas al preservar la diversidad conformacional y la consistencia física con los datos experimentales.

Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin2026-03-10🤖 cs.LG

Interpretable-by-Design Transformers via Architectural Stream Independence

El artículo presenta la Arquitectura de Fusión Tardía (LFA), un diseño de transformadores que garantiza la interpretabilidad mediante la separación estructural de las corrientes de tokens y semántica hasta la salida, logrando así una mayor estabilidad y modularidad funcional en comparación con los modelos estándar.

Clayton Kerce, Alexis Fox2026-03-10🤖 cs.LG

Pushing Bistatic Wireless Sensing toward High Accuracy at the Sub-Wavelength Scale

Este artículo presenta un marco robusto que supera las limitaciones de fase en la detección inalámbrica bistática al recuperar características de canal ideales a partir de relaciones distorsionadas, logrando una precisión sub-longitud de onda casi diez veces superior en experimentos reales con Wi-Fi y LoRa.

Wenwei Li, Jiarun Zhou, Qinxiao Quan, Fusang Zhang, Daqing Zhang2026-03-10🤖 cs.LG

Enhanced Random Subspace Local Projections for High-Dimensional Time Series Analysis

Este artículo propone un marco mejorado de proyecciones locales en subespacios aleatorios que, mediante técnicas como la agregación ponderada y el muestreo adaptativo, logra estimaciones de respuestas al impulso más estables y fiables en series temporales de alta dimensión, reduciendo significativamente la variabilidad del estimador y mejorando la inferencia estadística en comparación con los métodos tradicionales.

Eman Khalid, Moimma Ali Khan, Zarmeena Ali, Abdullah Illyas, Muhammad Usman, Saoud Ahmed2026-03-10🤖 cs.LG

A Unified Framework for Knowledge Transfer in Bidirectional Model Scaling

El artículo presenta BoT, el primer marco unificado y agnóstico al tamaño que trata el escalado bidireccional de modelos (de pequeño a grande y viceversa) como operaciones de procesamiento de señales mediante la Transformada Discreta de Wavelet, logrando ahorros significativos en FLOPs de pre-entrenamiento y rendimiento superior en diversos benchmarks.

Jianlu Shen, Fu Feng, Jiaze Xu, Yucheng Xie, Jiaqi Lv, Xin Geng2026-03-10🤖 cs.LG

Online Continual Learning for Anomaly Detection in IoT under Data Distribution Shifts

Este trabajo presenta OCLADS, un marco de comunicación con aprendizaje continuo que optimiza la detección de anomalías en dispositivos IoT mediante la selección inteligente de muestras y la detección de cambios de distribución en el servidor de borde, logrando alta precisión con menos actualizaciones de modelo en entornos no estacionarios.

Matea Marinova, Shashi Raj Pandey, Junya Shiraishi, Martin Voigt Vejling, Valentin Rakovic, Petar Popovski2026-03-10🤖 cs.LG

A Unified View of Drifting and Score-Based Models

Este artículo establece una conexión precisa entre los modelos de deriva y los basados en puntuación, demostrando que la deriva con núcleo gaussiano equivale a un objetivo de coincidencia de puntuaciones en distribuciones suavizadas y proporcionando un marco unificado que explica su relación con métodos como DMD y su validez en diversos regímenes.

Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao2026-03-10🤖 cs.LG

Reinforcement learning-based dynamic cleaning scheduling framework for solar energy system

Este estudio presenta un marco de aprendizaje por refuerzo que optimiza dinámicamente los calendarios de limpieza de paneles fotovoltaicos en regiones áridas, logrando hasta un 13% de ahorro de costos en Abu Dhabi al superar a los métodos tradicionales mediante la adaptación autónoma a condiciones ambientales inciertas.

Heungjo An2026-03-10🤖 cs.LG

Beyond Data Splitting: Full-Data Conformal Prediction by Differential Privacy

Este artículo propone un marco de predicción conforme que preserva la privacidad utilizando todos los datos sin necesidad de división, aprovechando la estabilidad de la privacidad diferencial para controlar la brecha entre puntuaciones internas y externas, lo que permite obtener conjuntos de predicción más precisos que los métodos basados en división.

Young Hyun Cho, Jordan Awan2026-03-10🤖 cs.LG

One-for-All Model Initialization with Frequency-Domain Knowledge

El artículo presenta FRONT, un marco novedoso que extrae el "learngene" (conocimiento fundamental) de modelos preentrenados mediante componentes de baja frecuencia en el dominio de la transformada discreta del coseno (DCT), permitiendo inicializar modelos de cualquier escala de forma libre de entrenamiento y logrando un rendimiento superior con una aceleración significativa en la convergencia y una reducción en los costos computacionales.

Jianlu Shen, Fu Feng, Yucheng Xie, Jiaqi Lv, Xin Geng2026-03-10🤖 cs.LG

Neural Dynamics-Informed Pre-trained Framework for Personalized Brain Functional Network Construction

Este artículo presenta un marco preentrenado informado por dinámicas neuronales que supera a los métodos dominantes al construir redes funcionales cerebrales personalizadas y generalizables en escenarios heterogéneos, logrando una representación precisa de los patrones de actividad neural sin depender de atlas predefinidos o suposiciones lineales.

Hongjie Jiang, Yifei Tang, Shuqiang Wang2026-03-10🤖 cs.LG

← Anterior Siguiente →