cs.AI artículos | Gist.Science

MPBMC: Multi-Property Bounded Model Checking with GNN-guided Clustering

Este artículo presenta MPBMC, un enfoque híbrido que utiliza redes neuronales gráficas y estadísticas de diseño para agrupar propiedades de manera funcional y acelerar la verificación formal mediante comprobación de modelos acotada.

Soumik Guha Roy, Sumana Ghosh, Ansuman Banerjee + 2 more2026-03-06💻 cs

On Emergences of Non-Classical Statistical Characteristics in Classical Neural Networks

Este artículo presenta la NCnet, una arquitectura clásica que exhibe comportamientos estadísticos no clásicos análogos a las desigualdades de Bell, demostrando que las correlaciones no locales surgen de la competencia de gradientes entre tareas compartidas y que la métrica $S$ puede servir como indicador de la dinámica de entrenamiento y el rendimiento de generalización.

Hanyu Zhao, Yang Wu, Yuexian Hou2026-03-06⚛️ quant-ph

A unified foundational framework for knowledge injection and evaluation of Large Language Models in Combustion Science

Este estudio presenta el primer marco unificado de extremo a extremo para desarrollar modelos de lenguaje especializados en combustión, que integra una base de conocimientos multimodal a gran escala y una evaluación rigurosa para demostrar que, aunque la generación aumentada por recuperación (RAG) supera a los modelos de cero disparos, la creación de un modelo fundacional de dominio requiere necesariamente grafos de conocimiento estructurados y entrenamiento continuo para superar las limitaciones de contaminación contextual.

Zonglin Yang, Runze Mao, Tianhao Wu + 3 more2026-03-06💻 cs

Induced Numerical Instability: Hidden Costs in Multimodal Large Language Models

Este trabajo identifica y valida una nueva vulnerabilidad en los modelos de lenguaje grandes multimodales, demostrando que optimizar una función de pérdida para inducir inestabilidad numérica genera imágenes que degradan significativamente el rendimiento del modelo con perturbaciones mínimas, revelando un vector de fallo distinto a las perturbaciones adversarias tradicionales.

Wai Tuck Wong, Jun Sun, Arunesh Sinha2026-03-06💻 cs

Query Disambiguation via Answer-Free Context: Doubling Performance on Humanity's Last Exam

Este trabajo demuestra que reescribir consultas utilizando contexto de referencia sin respuestas reduce la ambigüedad y duplica el rendimiento en el examen Humanity's Last Exam, logrando que la precisión de un modelo pase de 0.14 a 0.37 mediante una fase de reescritura distinta a la de respuesta.

Michael Majurski, Cynthia Matuszek2026-03-06💻 cs

Large Language Models as Bidding Agents in Repeated HetNet Auction

Este artículo propone un marco de subastas distribuido en redes heterogéneas donde los equipos de usuario utilizan agentes impulsados por modelos de lenguaje grandes para tomar decisiones estratégicas de oferta a largo plazo, logrando una mayor eficiencia presupuestaria y acceso a canales en comparación con políticas tradicionales.

Ismail Lotfi, Ali Ghrayeb, Samson Lasaulce + 1 more2026-03-06💻 cs

Capability Thresholds and Manufacturing Topology: How Embodied Intelligence Triggers Phase Transitions in Economic Geography

Este paper establece la Economía de la Inteligencia Encarnada, argumentando que cuando las capacidades de la IA física superan umbrales críticos de destreza y fiabilidad, provocan una transición de fase que reorganiza la geografía económica de la manufactura, desplazando las fábricas de los centros de mano de obra hacia ubicaciones optimizadas para máquinas y permitiendo una producción descentralizada cerca de la demanda.

Xinmin Fang, Lingfeng Tao, Zhengxiong Li2026-03-06🔬 physics

Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering

Este artículo propone un nuevo paradigma de aprendizaje llamado HARR (Reconstrucción y Representación de Atributos Heterogéneos) que transforma atributos numéricos y categóricos en un espacio homogéneo para aprender una métrica de distancia unificada, mejorando así la precisión y eficiencia del clustering en datos mixtos sin requerir parámetros ni garantías de convergencia.

Yiqun Zhang, Mingjie Zhao, Yizhou Chen + 2 more2026-03-06💻 cs

Benchmark of Benchmarks: Unpacking Influence and Code Repository Quality in LLM Safety Benchmarks

Este estudio evalúa por primera vez la influencia académica y la calidad del código de 31 benchmarks de seguridad en LLM, revelando que, aunque los benchmarks no superan a otros trabajos en impacto académico, existe una desconexión significativa entre la prominencia de los autores y la calidad del código, evidenciando una necesidad urgente de mejorar la reutilización y los estándares éticos en los repositorios.

Junjie Chu, Xinyue Shen, Ye Leng, Michael Backes, Yun Shen, Yang Zhang2026-03-06🔒 cs.CR

VSPrefill: Vertical-Slash Sparse Attention with Lightweight Indexing for Long-Context Prefilling

El paper presenta VSPrefill, un mecanismo de atención dispersa con indexación ligera que explota patrones estructurales verticales y diagonales para lograr una complejidad lineal durante la fase de prellenado, logrando una aceleración de 4.95x en contextos de 128k manteniendo el 98.35% de la precisión de la atención completa sin modificar los parámetros del modelo base.

Chen Guanzhong2026-03-06💻 cs

MAD-SmaAt-GNet: A Multimodal Advection-Guided Neural Network for Precipitation Nowcasting

El artículo presenta MAD-SmaAt-GNet, una arquitectura de red neuronal multimodal que mejora la predicción de precipitaciones a corto plazo al combinar un diseño ligero basado en SmaAt-UNet con un codificador adicional para múltiples variables meteorológicas y un componente de advección basado en física, logrando una reducción del 8,9% en el error cuadrático medio frente al modelo base.

Samuel van Wonderen, Siamak Mehrkanoon2026-03-06💻 cs

Understanding the Dynamics of Demonstration Conflict in In-Context Learning

Este estudio revela que los modelos de lenguaje grandes sufren degradación en el aprendizaje en contexto debido a demostraciones corruptas, identificando una estructura computacional de dos fases donde cabezas de atención específicas ("Vulnerability" y "Susceptible") procesan reglas contradictorias, lo que permite mejorar el rendimiento mediante su ablación dirigida.

Difan Jiao, Di Wang, Lijie Hu2026-03-06💻 cs

Towards Explainable Deep Learning for Ship Trajectory Prediction in Inland Waterways

Este estudio presenta un modelo de predicción de trayectorias de buques en vías navegables interiores basado en LSTM y atención, que logra una precisión comparable a estudios similares mientras revela mediante su diseño intrínsecamente interpretable que las mejoras en la exactitud no se deben exclusivamente a relaciones causales con las trayectorias de los buques cercanos.

Tom Legel, Dirk Söffker, Roland Schätzle + 1 more2026-03-06💻 cs

From Spark to Fire: Modeling and Mitigating Error Cascades in LLM-Based Multi-Agent Collaboration

Este trabajo presenta un modelo de dinámica de propagación y una capa de gobernanza basada en grafos genealógicos para detectar y mitigar las cascadas de errores en sistemas multiagente basados en LLM, logrando elevar la tasa de éxito de defensa de 0,32 a más de 0,89 sin alterar la arquitectura de colaboración original.

Yizhe Xie, Congcong Zhu, Xinyue Zhang + 5 more2026-03-06💻 cs

Activity Recognition from Smart Insole Sensor Data Using a Circular Dilated CNN

El artículo presenta un sistema de reconocimiento de actividades basado en una red neuronal convolucional con dilatación circular (CDCNN) que procesa datos multimodales de plantillas inteligentes, logrando una precisión del 86,42% en la clasificación de cuatro actividades y demostrando su viabilidad para su despliegue en sistemas embebidos.

Yanhua Zhao2026-03-06💻 cs

Progressive Refinement Regulation for Accelerating Diffusion Language Model Decoding

El artículo presenta la Regulación de Refinamiento Progresivo (PRR), un marco de control dinámico basado en la trayectoria de decodificación que acelera significativamente la generación de texto en modelos de lenguaje difusivos al adaptar el refinamiento de cada token según su convergencia empírica, manteniendo al mismo tiempo la calidad de la generación.

Lipeng Wan, Jianhui Gu, Junjie Ma + 4 more2026-03-06💻 cs

Augmenting representations with scientific papers

Este trabajo presenta un marco de aprendizaje contrastivo que alinea espectros de rayos X con literatura científica para crear representaciones multimodales compartidas, mejorando la estimación de variables físicas y facilitando la identificación de fuentes astrofísicas inusuales.

Nicolò Oreste Pinciroli Vago, Rocco Di Tella, Carolina Cuesta-Lázaro + 3 more2026-03-06✓ Author reviewed ⓘ🔭 astro-ph

Projected Hessian Learning: Fast Curvature Supervision for Accurate Machine-Learning Interatomic Potentials

El artículo presenta la Aprendizaje de Hessiano Proyectado (PHL), un marco de entrenamiento escalable que incorpora información de curvatura en potenciales interatómicos de aprendizaje automático mediante productos Hessiano-vector, logrando una precisión comparable a la del Hessiano completo con un coste de memoria y tiempo significativamente menores.

Austin Rodriguez, Justin S. Smith, Sakib Matin + 3 more2026-03-06🔬 physics

Discovering mathematical concepts through a multi-agent system

Este artículo presenta un sistema multiagente que descubre conceptos matemáticos, como la homología, mediante un ciclo dinámico de experimentación, prueba y contraejemplos, demostrando que la optimización de estos procesos locales genera una noción alineada de interés matemático.

Daattavya Aggarwal, Oisin Kim, Carl Henrik Ek + 1 more2026-03-06🔢 math

Still Fresh? Evaluating Temporal Drift in Retrieval Benchmarks

Este trabajo evalúa el impacto del desplazamiento temporal en el corpus del benchmark de recuperación técnica FreshStack, demostrando que, a pesar de la migración de documentos relevantes entre repositorios, las métricas de evaluación de modelos de recuperación permanecen altamente consistentes y fiables a lo largo del tiempo.

Nathan Kuissi, Suraj Subrahmanyan, Nandan Thakur + 1 more2026-03-06💻 cs

← Anterior Siguiente →