cs.LG artículos | Gist.Science

Coverage-Aware Web Crawling for Domain-Specific Supplier Discovery via a Web--Knowledge--Web Pipeline

El artículo propone un pipeline Web-Conocimiento-Web que utiliza grafos de conocimiento y estimadores de cobertura ecológica para descubrir de manera iterativa y eficiente proveedores de PYMEs en sectores especializados, superando las limitaciones de cobertura de las bases de datos comerciales existentes.

Yijiashun Qi, Yijiazhen Qi, Tanmay Wagh2026-03-09🤖 cs.LG

Weight Updates as Activation Shifts: A Principled Framework for Steering

Este trabajo establece un marco teórico que demuestra la equivalencia de primer orden entre las actualizaciones de pesos y los desplazamientos de activación, proponiendo un método de "adaptación conjunta" que supera a las técnicas anteriores de ajuste fino y de dirección de activación al lograr un rendimiento casi óptimo modificando solo el 0,04% de los parámetros del modelo.

Dyah Adila, John Cooper, Alexander Yun, Avi Trost, Frederic Sala2026-03-09🤖 cs.LG

Reparameterized Tensor Ring Functional Decomposition for Multi-Dimensional Data Recovery

Este trabajo propone una descomposición funcional de anillo tensorial reparametrizada que utiliza representaciones neuronales implícitas y un análisis en el dominio de la frecuencia para superar las limitaciones de los métodos tradicionales, logrando así una recuperación superior de datos multidimensionales tanto en mallas como fuera de ellas.

Yangyang Xu, Junbo Ke, You-Wei Wen, Chao Wang2026-03-09🤖 cs.AI

LMU-Based Sequential Learning and Posterior Ensemble Fusion for Cross-Domain Infant Cry Classification

Este trabajo propone un marco acústico compacto que fusiona características multirrama y una unidad de memoria Legendre (LMU) con una fusión de ensamble posterior calibrada para mejorar la clasificación de llantos infantiles en escenarios de dominio cruzado, logrando una generalización superior y una implementación eficiente en dispositivos.

Niloofar Jazaeri, Hilmi R. Dajani, Marco Janeczek, Martin Bouchard2026-03-09🤖 cs.LG

Whisper-RIR-Mega: A Paired Clean-Reverberant Speech Benchmark for ASR Robustness to Room Acoustics

Este trabajo presenta Whisper-RIR-Mega, un nuevo conjunto de datos de referencia que empareja grabaciones de habla limpias con sus versiones reverberantes utilizando respuestas de impulso reales, diseñado para evaluar y mejorar la robustez de los modelos de reconocimiento automático de voz frente a las condiciones acústicas de las habitaciones.

Mandip Goswami2026-03-09🤖 cs.AI

Rigidity-Aware Geometric Pretraining for Protein Design and Conformational Ensembles

El artículo presenta RigidSSL, un marco de preentrenamiento auto-supervisado que integra la rigidez geométrica y la dinámica conformacional para mejorar significativamente el diseño de proteínas, la generación de nuevas estructuras y la modelación de ensambles conformacionales realistas.

Zhanghan Ni, Yanjing Li, Zeju Qiu, Bernhard Schölkopf, Hongyu Guo, Weiyang Liu, Shengchao Liu2026-03-09🤖 cs.AI

mlx-vis: GPU-Accelerated Dimensionality Reduction and Visualization on Apple Silicon

mlx-vis es una biblioteca de Python de código abierto que aprovecha la aceleración por GPU en Apple Silicon mediante MLX para ejecutar métodos de reducción de dimensionalidad y generar visualizaciones animadas de alto rendimiento en un solo flujo de trabajo.

Han Xiao2026-03-09🤖 cs.LG

Traversal-as-Policy: Log-Distilled Gated Behavior Trees as Externalized, Verifiable Policies for Safe, Robust, and Efficient Agents

El artículo propone "Traversal-as-Policy", un marco que convierte los registros de ejecución de agentes LLM en árboles de comportamiento con puertas (GBT) ejecutables y verificables, logrando mejorar drásticamente el éxito en tareas complejas, eliminar violaciones de seguridad y reducir costos computacionales al reemplazar la generación libre por una política de control basada en la exploración de macros validadas.

Peiran Li, Jiashuo Sun, Fangzhou Lin, Shuo Xing, Tianfu Fu, Suofei Feng, Chaoqun Ni, Zhengzhong Tu2026-03-09🤖 cs.AI

Information-Theoretic Privacy Control for Sequential Multi-Agent LLM Systems

Este trabajo aborda la fuga de información composicional en sistemas secuenciales de agentes LLM, proponiendo un marco de entrenamiento regularizado que demuestra que la privacidad debe gestionarse como una propiedad del sistema y no solo mediante restricciones locales.

Sadia Asif, Mohammad Mohammadi Amiri2026-03-09🤖 cs.LG

RoboLayout: Differentiable 3D Scene Generation for Embodied Agents

El artículo presenta RoboLayout, una extensión de LayoutVLM que genera diseños de escenas 3D semánticamente coherentes y físicamente viables para agentes encarnados mediante la integración de restricciones de alcanzabilidad diferenciables y un proceso de refinamiento local que adapta el entorno a las capacidades físicas de diversos agentes.

Ali Shamsaddinlou2026-03-09🤖 cs.AI

Clinical-Injection Transformer with Domain-Adapted MAE for Lupus Nephritis Prognosis Prediction

Este estudio presenta el primer marco de patología computacional multimodal, basado en un Transformer de inyección clínica y un MAE adaptado al dominio, que logra una alta precisión (90,1%) en la predicción del pronóstico de nefritis lúpica pediátrica utilizando únicamente biopsias teñidas con PAS y datos clínicos estructurados.

Yuewen Huang, Zhitao Ye, Guangnan Feng, Fudan Zheng, Xia Gao, Yutong Lu2026-03-09🤖 cs.LG

JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization

El artículo presenta JAWS, una estrategia de regularización probabilística que modula dinámicamente la fuerza de la regularización según la complejidad física local para mejorar la estabilidad a largo plazo, la fidelidad de las ondas de choque y la generalización en modelos de operadores neuronales, superando las limitaciones de las técnicas de regularización global y los métodos de optimización de trayectorias de largo horizonte.

Fengxiang Nie, Yasuhiro Suzuki2026-03-09🤖 cs.AI

VDCook:DIY video data cook your MLLMs

El artículo presenta VDCook, un sistema operativo de datos de video autoevolutivo que permite a investigadores y equipos especializados generar, actualizar y gestionar conjuntos de datos de entrenamiento para modelos multimodales mediante consultas en lenguaje natural y un mecanismo automatizado de ingestión basado en el Protocolo de Contexto de Modelo (MCP).

Chengwei Wu2026-03-09🤖 cs.AI

Attention Meets Reachability: Structural Equivalence and Efficiency in Grammar-Constrained LLM Decoding

Este artículo establece fundamentos teóricos para la decodificación restringida por gramáticas, demostrando que la equivalencia lingüística no garantiza eficiencia computacional al introducir una métrica de costo de ambigüedad estructural, probar límites inferiores de complejidad y derivar acotaciones precisas de distorsión para el muestreo condicional en arquitecturas de transformadores.

Faruk Alpay, Bilge Senturk2026-03-09🤖 cs.LG

An intuitive rearranging of the Yates covariance decomposition for probabilistic verification of forecasts with the Brier score

Este artículo propone una reordenación algebraica intuitiva de la descomposición de la covarianza de Yates para la puntuación Brier, que expresa el error de pronóstico probabilístico como la suma de tres términos no negativos (desajuste de varianza, déficit de correlación y error de calibración global), haciendo así transparentes las condiciones de optimalidad para un pronóstico perfecto.

Bruno Hebling Vieira (Methods of Plasticity Research, Department of Psychology, University of Zurich, Zurich, Switzerland)2026-03-09🤖 cs.LG

IntSeqBERT: Learning Arithmetic Structure in OEIS via Modulo-Spectrum Embeddings

El artículo presenta IntSeqBERT, un modelo Transformer dual que integra representaciones de magnitud logarítmica y espectro de residuos módulo para predecir secuencias enteras del OEIS, logrando una precisión significativamente superior a los modelos basados en tokens al aprovechar la estructura aritmética mediante un solucionador probabilístico basado en el Teorema Chino del Resto.

Kazuhisa Nakasho2026-03-09🤖 cs.LG

Autocorrelation effects in a stochastic-process model for decision making via time series

Este estudio demuestra mediante un modelo matemático que la autocorrelación negativa o positiva de una serie temporal óptica caótica optimiza la toma de decisiones en problemas de bandido multi-brazo dependiendo de si la suma de las probabilidades de recompensa es mayor o menor que uno, respectivamente.

Tomoki Yamagami, Mikio Hasegawa, Takatomo Mihana, Ryoichi Horisaki, Atsushi Uchida2026-03-09🔬 physics.optics

Towards Efficient and Stable Ocean State Forecasting: A Continuous-Time Koopman Approach

El artículo presenta un autocodificador de Koopman en tiempo continuo (CT-KAE) como un modelo sustituto ligero y estable que supera a las redes Transformer autoregresivas en la predicción a largo plazo de estados oceánicos, logrando un crecimiento de error acotado y una inferencia significativamente más rápida mediante la proyección de dinámicas no lineales a un espacio latente lineal.

Rares Grozavescu, Pengyu Zhang, Mark Girolami, Etienne Meunier2026-03-09🔬 physics.app-ph

When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality

Este artículo presenta un modelo teórico que demuestra cómo la inteligencia artificial genera un aparente paradoja al igualar las habilidades individuales mientras concentra el valor económico en activos complementarios, creando dos regímenes de desigualdad que dependen de la estructura tecnológica y las instituciones laborales, aunque sus predicciones específicas aún carecen de datos empíricos adecuados para ser validadas.

Xupeng Chen, Shuchen Meng2026-03-09🤖 cs.AI

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

El artículo presenta CDDS, un nuevo algoritmo de alineación multimodal que supera a los métodos existentes mediante un decoplamiento restringido de las representaciones en componentes semánticos y modales, junto con un muestreo de distribución para cerrar la brecha entre modalidades y garantizar la alineación de la verdadera semántica.

Xiang Ma, Lexin Fang, Litian Xu, Caiming Zhang2026-03-09🤖 cs.LG

← Anterior Siguiente →