cs.LG artículos | Gist.Science

Neural Precoding in Complex Projective Spaces

Este artículo propone un marco de aprendizaje profundo basado en espacios proyectivos complejos para la precodificación en sistemas MU-MISO, el cual elimina las redundancias de fase global inherentes a las representaciones convencionales y logra mejoras sustanciales en la tasa de suma y la generalización con un aumento de complejidad insignificante.

Zaid Abdullah, Merouane Debbah, Symeon Chatzinotas, Bjorn Ottersten2026-03-10🤖 cs.LG

Learning embeddings of non-linear PDEs: the Burgers' equation

Este trabajo presenta un método que generaliza los embeddings a las redes neuronales informadas por física para construir espacios de incrustación de soluciones de ecuaciones diferenciales parciales no lineales, como la ecuación de Burgers viscosa, mediante un diseño de múltiples cabezales con restricciones de ortogonalidad que permiten una descomposición robusta e interpretable del espacio latente.

Pedro Tarancón-Álvarez, Leonid Sarieddine, Pavlos Protopapas, Raul Jimenez2026-03-10🤖 cs.LG

Fusion Complexity Inversion: Why Simpler Cross View Modules Outperform SSMs and Cross View Attention Transformers for Pasture Biomass Regression

Este estudio demuestra que, para la estimación de biomasa de pastizales con datos escasos, la calidad del modelo base preentrenado y el uso de módulos de fusión locales y simples (como convoluciones) superan significativamente a arquitecturas complejas como los transformadores de atención cruzada o los SSMs, estableciendo un principio de "inversión de complejidad de fusión" que prioriza la simplicidad sobre la sofisticación en benchmarks agrícolas.

Mridankan Mandal2026-03-10🤖 cs.LG

Transferable Optimization Network for Cross-Domain Image Reconstruction

Este artículo presenta un marco de aprendizaje transferible basado en optimización bi-nivel que combina un extractor de características universal entrenado con datos heterogéneos y un adaptador específico del dominio para lograr una reconstrucción de alta calidad de imágenes de resonancia magnética submuestreadas, incluso cuando se dispone de datos de entrenamiento limitados.

Yunmei Chen, Chi Ding, Xiaojing Ye2026-03-10🤖 cs.LG

Gradient Iterated Temporal-Difference Learning

Este trabajo presenta el aprendizaje iterado de diferencias temporales con gradiente (Gradient Iterated TD), un nuevo algoritmo que modifica el enfoque iterado para calcular gradientes sobre objetivos móviles, logrando por primera vez una velocidad de aprendizaje competitiva con los métodos semigradientes en tareas complejas como los juegos de Atari mientras mantiene la estabilidad de los métodos basados en gradiente.

Théo Vincent, Kevin Gerhardt, Yogesh Tripathi, Habib Maraqten, Adam White, Martha White, Jan Peters, Carlo D'Eramo2026-03-10🤖 cs.LG

Guess & Guide: Gradient-Free Zero-Shot Diffusion Guidance

Este artículo presenta un método de guía de difusión sin gradiente que elimina la necesidad de retropropagación para resolver problemas inversos bayesianos de forma cero-shot, logrando una reducción drástica en los costos de inferencia y un rendimiento superior en múltiples tareas.

Abduragim Shtanchaev, Albina Ilina, Yazid Janati, Arip Asadulaev, Martin Takác, Eric Moulines2026-03-10🤖 cs.LG

An Interpretable Generative Framework for Anomaly Detection in High-Dimensional Financial Time Series

El artículo presenta ReGEN-TAD, un marco generativo interpretable que combina arquitecturas de aprendizaje profundo con diagnósticos econométricos para detectar anomalías y inestabilidades estructurales en series temporales financieras de alta dimensión mediante un puntaje unificado sin necesidad de datos etiquetados.

Waldyn G Martinez2026-03-10🤖 cs.LG

Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations

Este artículo presenta un pipeline de agarre guiado por lenguaje para manipuladores móviles que combina detección de objetos, completado de nubes de puntos y filtrado de colisiones para lograr una ejecución robusta en entornos desordenados con observaciones parciales, logrando un 90% de éxito en pruebas reales frente al 30% de un método dependiente de la vista.

Dilermando Almeida, Juliano Negri, Guilherme Lazzarini, Thiago H. Segreto, Ranulfo Bezerra, Ricardo V. Godoy, Marcelo Becker2026-03-10🤖 cs.LG

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

Basado en procesos biológicos de sueño, el artículo presenta la Consolidación de Repetición de Sueño (SRC), un método post-entrenamiento que mejora la calibración y la confianza de las redes neuronales artificiales al replantear representaciones internas sin necesidad de reentrenamiento supervisado.

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

Este trabajo introduce un nuevo marco de "informatividad" y un conjunto de datos específico para evaluar la capacidad de los Modelos Visuales-Lingüísticos (VLM) en el sector hotelero, revelando que, aunque estos modelos carecen de conciencia decisional inherente, pueden adquirir un razonamiento fiable tras un ajuste fino modesto.

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Toward Unified Multimodal Representation Learning for Autonomous Driving

Este artículo propone el marco de preentrenamiento de tensor contrastivo (CTP) para alinear simultáneamente múltiples modalidades en un espacio de incrustación unificado, mejorando así el aprendizaje de representaciones multimodales para la conducción autónoma en comparación con los métodos tradicionales de similitud por pares.

Ximeng Tao, Dimitar Filev, Gaurav Pandey2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

Este artículo introduce un marco teórico basado en el filtrado de partículas para analizar rigurosamente los métodos de inferencia paralela en modelos de lenguaje, identificando garantías no asintóticas, mejoras algorítmicas y límites fundamentales, aunque sus hallazgos empíricos sugieren que la precisión final depende de factores más allá del error de muestreo.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?

Este trabajo presenta VLM-SubtleBench, un nuevo benchmark que evalúa la capacidad de los modelos de visión y lenguaje para realizar razonamiento comparativo sutil en diferencias finas y diversos dominios, revelando brechas significativas entre su rendimiento y el humano.

Minkyu Kim, Sangheon Lee, Dongmin Park2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

Los autores presentan un marco de teoría de decisiones y un sistema de pronóstico híbrido que combina modelos de inteligencia artificial con expectativas agrícolas evolutivas para generar pronósticos probabilísticos del monzón más precisos, los cuales fueron implementados exitosamente en 2025 para guiar las decisiones de 38 millones de agricultores indios.

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

SMGI: A Structural Theory of General Artificial Intelligence

El artículo presenta SMGI, una teoría estructural de la inteligencia artificial general que formaliza el aprendizaje como la evolución controlada de la interfaz de aprendizaje mediante un meta-modelo tipado, demostrando que paradigmas existentes son instancias restringidas de este marco y estableciendo condiciones matemáticas para la estabilidad y la capacidad de generalización.

Aomar Osmani2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

El artículo presenta LeJOT-AutoML, un marco de AutoML impulsado por agentes de modelos de lenguaje que automatiza la ingeniería de características mediante la extracción de datos de logs y metadatos para predecir con precisión los tiempos de ejecución en Databricks, reduciendo el ciclo de desarrollo de semanas a minutos y logrando un ahorro de costos del 19,01% mediante una optimización mejorada de la orquestación.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning

El artículo presenta E²OAL, un marco unificado y sin detectores para el aprendizaje activo de conjunto abierto que aprovecha las clases desconocidas etiquetadas mediante agrupamiento estructurado y calibración dirichlet para lograr un rendimiento superior en precisión, eficiencia y selección de muestras en comparación con los métodos actuales.

Chen-Chen Zong, Yu-Qi Chi, Xie-Yang Wang, Yan Cui, Sheng-Jun Huang2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

Este estudio presenta un Transformer Bayesiano que integra múltiples mecanismos de incertidumbre en una arquitectura PatchTST para lograr pronósticos de carga probabilísticos bien calibrados y robustos ante cambios climáticos extremos, superando significativamente a los modelos deterministas y de ensambles profundos en cinco redes eléctricas globales.

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

El artículo presenta NaviDriveVLM, un marco decoupled que separa el razonamiento de alto nivel de la planificación de movimiento mediante un Navegador a gran escala y un Controlador ligero, logrando una planificación de movimiento superior en el benchmark nuScenes al preservar la capacidad de razonamiento y reducir los costos de entrenamiento.

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

El artículo presenta DyQ-VLA, un marco de cuantización dinámica para modelos de Visión-Lenguaje-Acción que, al aprovechar la sensibilidad temporal y los indicadores cinemáticos en tiempo real, reduce la huella de memoria en un 69,1% y acelera la ejecución sin comprometer el rendimiento.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

← Anterior Siguiente →