cs.AI artículos | Gist.Science

Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

El paper presenta EvoKernel, un marco de agentes autoevolutivos que utiliza un enfoque de memoria basado en valores para superar la escasez de datos en la síntesis de kernels para NPUs, logrando mejorar la precisión de los modelos de 11.0% a 83.0% y acelerar el rendimiento mediante un refinamiento continuo.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

Semantic Landmark Particle Filter for Robot Localisation in Vineyards

Este artículo presenta un Filtro de Partículas de Hitos Semánticos (SLPF) que integra la detección de troncos y postes con LiDAR 2D y GNSS para resolver el problema de la ambigüedad perceptiva en viñedos, logrando una localización robótica más precisa y robusta que los métodos basados únicamente en geometría o visión.

Rajitha de Silva, Jonathan Cox, James R. Heselden, Marija Popovic, Cesar Cadena, Riccardo Polvara2026-03-12🤖 cs.AI

$V_{0.5}$ : Generalist Value Model as a Prior for Sparse RL Rollouts

El artículo presenta $V_{0.5}$ , un modelo de valor generalista que fusiona adaptativamente una estimación previa con promedios empíricos de rollouts dispersos mediante pruebas estadísticas en tiempo real, logrando una reducción significativa de la varianza y un rendimiento superior en tareas de razonamiento matemático en comparación con métodos como GRPO y DAPO.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

El artículo presenta GRACE, un simulador y conjunto de pruebas unificado en 2D que permite comparaciones transparentes y reproducibles entre diferentes niveles de abstracción (cuadrícula, mapa de rutas y continuo) para la planificación de trayectorias multiagente, facilitando así el estudio de las compensaciones entre fidelidad y escalabilidad en la investigación de robots múltiples.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang Hönig2026-03-12🤖 cs.AI

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Este trabajo presenta un corpus bilingüe (inglés/alemán) de registros de catálogo anotados con la Integrated Authority File (GND) y una taxonomía procesable por máquinas, diseñado para habilitar la clasificación multietiqueta consciente de la ontología y evaluar sistemas de IA que asistan a los catalogadores en la indexación a escala.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma Suominen2026-03-12💬 cs.CL

Continuous Diffusion Transformers for Designing Synthetic Regulatory Elements

Este trabajo presenta un modelo eficiente de Difusión Transformer (DiT) que genera secuencias de ADN regulador específicas de tipo celular con una convergencia más rápida y menos memorización que los enfoques anteriores, mejorando además significativamente la actividad reguladora predicha mediante ajuste fino con DDPO.

Jonathan Liu, Kia Ghods2026-03-12🧬 q-bio

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Este trabajo propone el Muestreo Predictivo de Dinámicas (DPS), un método que utiliza inferencia bayesiana sobre un modelo oculto de Markov para predecir y seleccionar proactivamente los prompts más informativos durante el ajuste fino con aprendizaje por refuerzo de modelos de razonamiento grandes, reduciendo así significativamente el costo computacional de las simulaciones y acelerando el entrenamiento sin comprometer el rendimiento.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

El artículo presenta PharmGraph-Auditor, un sistema innovador que combina una Base de Conocimiento Farmacéutico Híbrida (HPKB) con un paradigma de Verificación Basada en Conocimiento (CoV) para transformar a los modelos de lenguaje en motores de razonamiento transparentes y seguros, mejorando así la precisión y la trazabilidad en la verificación de recetas médicas.

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-12🤖 cs.AI

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV es un marco de expulsión de caché KV ligero que, al predecir puntuaciones de importancia futuras mediante módulos eficientes en lugar de generar borradores explícitos, logra una alta precisión y reduce el costo de expulsión hasta 14,5 veces en comparación con métodos anteriores.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

When Fine-Tuning Fails and when it Generalises: Role of Data Diversity and Mixed Training in LLM-based TTS

Este trabajo demuestra que el ajuste fino con LoRA de modelos de lenguaje grandes compactos para sistemas de síntesis de voz mejora significativamente la calidad perceptiva, la fidelidad del hablante y la relación señal-ruido, siempre que se utilice un conjunto de datos de entrenamiento suficientemente diverso.

Anupam Purwar, Aditya Choudhary2026-03-12🤖 cs.AI

Historical Consensus: Preventing Posterior Collapse via Iterative Selection of Gaussian Mixture Priors

Este artículo propone el Entrenamiento de Consenso Histórico, un método iterativo que selecciona mezclas gaussianas para crear una barrera de estabilidad que elimina por completo el colapso posterior en los autoencoders variacionales sin requerir restricciones arquitectónicas ni ajustes de hiperparámetros.

Zegu Zhang, Jian Zhang2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Este trabajo presenta RAD, un marco de alineación que reemplaza las restricciones de costo esperado tradicionales por restricciones de dominancia estocástica de primer orden dentro de un marco de transporte óptimo, permitiendo un control universal de medidas de riesgo espectral y mejorando la robustez ante eventos catastróficos y distribuciones fuera de contexto en el Aprendizaje por Refuerzo a partir de Feedback Humano (RLHF).

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

El artículo presenta CCGE, un método de exploración general que guía el aprendizaje por refuerzo en manipulación diestra mediante el conteo y la recompensa de patrones de contacto novedosos entre la mano y el objeto, logrando así una mayor eficiencia de entrenamiento y una transferencia robusta a sistemas robóticos reales.

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

GroundCount: Grounding Vision-Language Models with Object Detection for Mitigating Counting Hallucinations

El artículo presenta GroundCount, un marco que mejora la precisión del conteo en modelos de visión y lenguaje al integrar detección de objetos basada en CNN para mitigar las alucinaciones espaciales, logrando mejoras significativas en la mayoría de las arquitecturas evaluadas mediante una estrategia de anclaje simbólico explícito.

Boyuan Chen, Minghao Shao, Siddharth Garg, Ramesh Karri, Muhammad Shafique2026-03-12🤖 cs.AI

Artificial Intelligence as a Catalyst for Innovation in Software Engineering

Este artículo examina cómo la inteligencia artificial actúa como catalizador de innovación en la ingeniería de software, demostrando mediante una revisión bibliográfica y un estudio empírico que su integración optimiza las prácticas ágiles y automatiza tareas clave para mejorar la calidad, la velocidad y la adaptabilidad ante requisitos cambiantes.

Carlos Alberto Fernández-y-Fernández, Jorge R. Aguilar-Cisneros2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

Este artículo examina los desafíos metodológicos que surgen al aplicar ensayos controlados aleatorios para evaluar el impacto de la IA de vanguardia en el rendimiento humano, identificando tensiones en la validez de los estudios y proponiendo soluciones prácticas basadas en la experiencia de expertos para mejorar la toma de decisiones de alto riesgo.

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

Esta investigación interdisciplinaria demuestra que los Modelos de Lenguaje Visuales predicen el estilo artístico basándose en conceptos visualmente coherentes y semánticamente significativos que, en un 90% de los casos, son juzgados como relevantes por historiadores del arte, aunque a veces logran aciertos mediante interpretaciones formales de conceptos que estos expertos considerarían irrelevantes.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

Instruction set for the representation of graphs

El artículo presenta IsalGraph, un método que codifica cualquier grafo finito en una cadena compacta mediante un conjunto de instrucciones de nueve caracteres, permitiendo una representación isomórfica, válida y compatible con modelos de lenguaje que facilita la búsqueda de similitud, la generación de grafos y la modelación condicionada.

Ezequiel Lopez-Rubio, Mario Pascual-Gonzalez2026-03-12💬 cs.CL

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

El paper presenta V2M-Zero, un enfoque de generación de música a partir de video sin pares de datos que logra una alineación temporal precisa al extraer y transferir estructuras de cambio temporal independientes dentro de cada modalidad mediante curvas de eventos, superando significativamente a los métodos basados en datos pareados.

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

El artículo presenta NeFTY, un marco de física diferenciable que reconstruye cuantitativamente propiedades materiales en 3D y localiza defectos subsuperficiales mediante la parametrización de un campo de difusividad continuo optimizado con un solver numérico riguroso, superando las limitaciones de las aproximaciones tradicionales y las redes neuronales informadas por física en escenarios de difusión transitoria.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

← Anterior Siguiente →

cs.AI