cs.AI artículos | Gist.Science

Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling

Este trabajo propone un enfoque de muestreo de importancia con recocido (AIS) combinado con aprendizaje variacional para mejorar la inferencia en Modelos de Variables Latentes de Procesos Gaussianos, logrando límites variacionales más ajustados y una convergencia más robusta en espacios de alta dimensión.

Jian Xu, Shian Du, Junmei Yang, Qianli Ma, Delu Zeng, John Paisley2026-03-10🤖 cs.LG

Multimodal Laryngoscopic Video Analysis for Assisted Diagnosis of Vocal Fold Paralysis

Este trabajo presenta el Sistema de Análisis Multimodal de Video Laringoscópico (MLVAS), una herramienta innovadora que combina datos de audio y video mediante detección de glotis, refinamiento de segmentación basado en difusión y extracción de características acústicas y visuales para asistir en el diagnóstico objetivo y automatizado de la parálisis de las cuerdas vocales.

Yucong Zhang, Xin Zou, Jinshan Yang, Wenjun Chen, Juan Liu, Faya Liang, Ming Li2026-03-10💻 cs

The Future of Software Testing: AI-Powered Test Case Generation and Validation

Este artículo explora el potencial transformador de la inteligencia artificial para optimizar la generación y validación de casos de prueba mediante la automatización y el aprendizaje automático, abordando al mismo tiempo los desafíos de implementación para lograr lanzamientos de software más rápidos, precisos y escalables.

Mohammad Baqar, Rajat Khanda2026-03-10💻 cs

Reconsidering the energy efficiency of spiking neural networks

Este artículo presenta una reevaluación rigurosa de la eficiencia energética de las redes neuronales de espigas (SNN) frente a las redes neuronales cuantizadas (QNN), demostrando mediante un modelo analítico detallado que las SNN solo superan a las QNN bajo condiciones específicas de hardware y parámetros operativos, como tasas de espiga bajas y ventanas temporales moderadas, lo que podría duplicar la vida útil de la batería en dispositivos como relojes inteligentes.

Zhanglu Yan, Zhenyu Bai, Weng-Fai Wong2026-03-10🤖 cs.LG

Input-to-State Stable Coupled Oscillator Networks for Closed-form Model-based Control in Latent Space

Este trabajo presenta una red de osciladores acoplados (CON) que, al garantizar una estructura lagrangiana, estabilidad global y un mapeo invertible entre entrada y fuerza latente, permite un control basado en modelos de espacio latente eficiente y de alto rendimiento utilizando únicamente imágenes como retroalimentación.

Maximilian Stölzle, Cosimo Della Santina2026-03-10🤖 cs.LG

BNEM: A Boltzmann Sampler Based on Bootstrapped Noised Energy Matching

Este trabajo presenta BNEM, un muestreador de Boltzmann basado en la coincidencia de energía ruidosa y una técnica de *bootstrapping* que permite generar muestras independientes a partir de funciones de energía conocidas, logrando un rendimiento superior y mayor robustez en comparación con métodos existentes.

RuiKang OuYang, Bo Qiang, José Miguel Hernández-Lobato2026-03-10🤖 cs.LG

Improving Visual Object Tracking through Visual Prompting

El artículo presenta PiVOT, un nuevo mecanismo de visual prompting que aprovecha el modelo fundacional CLIP para generar y refinar dinámicamente indicaciones visuales en línea, mejorando así la capacidad de los rastreadores de objetos genéricos para suprimir distracciones y distinguir el objetivo de su entorno.

Shih-Fang Chen, Jun-Cheng Chen, I-Hong Jhuo, Yen-Yu Lin2026-03-10💻 cs

Neural delay differential equations: learning non-Markovian closures for partially known dynamical systems

Este artículo presenta un marco de Ecuaciones Diferenciales con Retardo Neuronales (NDDEs) inspirado en el formalismo Mori-Zwanzig para aprender dinámicas no markovianas a partir de datos de sistemas parcialmente observables, demostrando un rendimiento superior frente a métodos existentes como las redes LSTM y las ANODEs.

Thibault Monsel, Onofrio Semeraro, Lionel Mathelin, Guillaume Charpiat2026-03-10🤖 cs.LG

Puppet-CNN: Continuous Parameter Dynamics for Input-Adaptive Convolutional Networks

El artículo presenta Puppet-CNN, un marco que modela los parámetros de las redes neuronales convolucionales como un sistema dinámico continuo gobernado por una ecuación diferencial, lo que permite generar capas de manera adaptativa según la complejidad de la entrada y reducir significativamente los parámetros entrenables sin sacrificar el rendimiento.

Yucheng Xing, Xin Wang2026-03-10🤖 cs.LG

Input-Adaptive Generative Dynamics in Diffusion Models

Este trabajo propone un marco para modelos de difusión que adapta dinámicamente el proceso de generación a la complejidad de cada muestra, logrando reducir el número de pasos de muestreo sin comprometer la calidad de las imágenes generadas.

Yucheng Xing, Xiaodong Liu, Xin Wang2026-03-10🤖 cs.LG

The Illusion of Collusion

Este estudio demuestra que los agentes algorítmicos que utilizan aprendizaje por refuerzo sin conocimiento previo de la estructura del juego pueden desarrollar una "colusión ingenua" basada en la sincronización de sus acciones, un fenómeno cuya probabilidad de ocurrencia depende críticamente de la política de comportamiento específica (estocástica, determinista o híbrida) que empleen los algoritmos.

Connor Douglas, Foster Provost, Arun Sundararajan2026-03-10💻 cs

Energy-Efficient SLAM via Joint Design of Sensing, Communication, and Exploration Speed

Este artículo propone un diseño conjunto de los factores de sensado, comunicación y velocidad de exploración para optimizar la eficiencia energética en la localización y mapeo simultáneos (SLAM) de robots móviles a lo largo de su vida útil, transmitiendo datos a un centro en la nube para la reconstrucción de mapas mediante aprendizaje profundo.

Zidong Han, Ruibo Jin, Xiaoyang Li + 3 more2026-03-10🤖 cs.AI

Multi-modal, Multi-task, Multi-criteria Automatic Evaluation with Vision Language Models

El artículo presenta HarmonicEval, una métrica de evaluación automática sin referencia que genera puntuaciones integrales y por criterio mediante un enfoque ascendente, y introduce el benchmark MMHE con 18.000 juicios humanos para demostrar su superior correlación con la evaluación humana en escenarios multimodales y multitarea.

Masanari Ohi, Masahiro Kaneko, Naoaki Okazaki, Nakamasa Inoue2026-03-10💬 cs.CL

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Este trabajo presenta un método que utiliza modelos de visión y lenguaje preentrenados para aprender modelos de mundo simbólicos a partir de demostraciones cortas, permitiendo a los robots generalizar de forma cero-shot y resolver problemas de toma de decisiones a largo plazo en entornos complejos mediante planificación.

Ashay Athalye, Nishanth Kumar, Tom Silver, Yichao Liang, Jiuguang Wang, Tomás Lozano-Pérez, Leslie Pack Kaelbling2026-03-10🤖 cs.LG

Efficient Semi-Supervised Adversarial Training via Latent Clustering-Based Data Reduction

Este artículo propone estrategias de reducción de datos basadas en agrupamiento latente para optimizar la eficiencia de la entrenamiento adversario semi-supervisado (SSAT), logrando una robustez comparable con 5 a 10 veces menos datos no etiquetados y reduciendo el tiempo de ejecución en 3 a 4 veces.

Somrita Ghosh, Yuelin Xu, Xiao Zhang2026-03-10🤖 cs.LG

A Single Model Ensemble Framework for Neural Machine Translation using Pivot Translation

Este artículo presenta un marco de ensamblaje basado en un único modelo que mejora la traducción automática neuronal para pares de idiomas de recursos limitados mediante la generación de candidatos a través de traducción pivote y su posterior agregación para obtener una traducción final de mayor calidad.

Seokjin Oh, Keonwoong Noh, Woohwan Jung2026-03-10💬 cs.CL

GRADIEND: Feature Learning within Neural Networks Exemplified through Biases

Este estudio presenta GRADIEND, un enfoque novedoso que utiliza gradientes de modelos para identificar y reescribir neuronas específicas con el fin de eliminar sesgos sociales como género, raza y religión, manteniendo al mismo tiempo las capacidades generales del modelo.

Jonathan Drechsel, Steffen Herbold2026-03-10🤖 cs.LG

An Efficient Local Search Approach for Polarized Community Discovery in Signed Networks

Este artículo presenta un nuevo algoritmo de búsqueda local eficiente que descubre comunidades polarizadas en redes firmadas permitiendo vértices neutrales, resolviendo el problema del desequilibrio de tamaños mediante un objetivo de optimización novedoso y garantizando una convergencia lineal.

Linus Aronsson, Morteza Haghir Chehreghani2026-03-10🤖 cs.LG

Mitigating Unintended Memorization with LoRA in Federated Learning for LLMs

Este trabajo demuestra que el uso de Low-Rank Adaptation (LoRA) en el aprendizaje federado para modelos de lenguaje grandes reduce significativamente la memorización no deseada de datos de entrenamiento, mejorando la privacidad sin sacrificar el rendimiento en diversos dominios de alto riesgo.

Thierry Bossy, Julien Vignoud, Tahseen Rabbani, Juan R. Troncoso Pastoriza, Martin Jaggi2026-03-10🤖 cs.LG

Prompt-SID: Learning Structural Representation Prompt via Latent Diffusion for Single-Image Denoising

El artículo presenta Prompt-SID, un marco de aprendizaje auto-supervisado para la eliminación de ruido en imágenes individuales que preserva los detalles estructurales mediante un modelo de difusión latente para generar prompts estructurales y un mecanismo de repetición de escala para mitigar las diferencias de resolución.

Huaqiu Li, Wang Zhang, Xiaowan Hu, Tao Jiang, Zikang Chen, Haoqian Wang2026-03-10💻 cs

← Anterior Siguiente →