On Emergences of Non-Classical Statistical Characteristics in Classical Neural Networks

Este artículo presenta la NCnet, una arquitectura clásica que exhibe comportamientos estadísticos no clásicos análogos a las desigualdades de Bell, demostrando que las correlaciones no locales surgen de la competencia de gradientes entre tareas compartidas y que la métrica SS puede servir como indicador de la dinámica de entrenamiento y el rendimiento de generalización.

Hanyu Zhao, Yang Wu, Yuexian Hou2026-03-06⚛️ quant-ph

A unified foundational framework for knowledge injection and evaluation of Large Language Models in Combustion Science

Este estudio presenta el primer marco unificado de extremo a extremo para desarrollar modelos de lenguaje especializados en combustión, que integra una base de conocimientos multimodal a gran escala y una evaluación rigurosa para demostrar que, aunque la generación aumentada por recuperación (RAG) supera a los modelos de cero disparos, la creación de un modelo fundacional de dominio requiere necesariamente grafos de conocimiento estructurados y entrenamiento continuo para superar las limitaciones de contaminación contextual.

Zonglin Yang, Runze Mao, Tianhao Wu + 3 more2026-03-06💻 cs

Induced Numerical Instability: Hidden Costs in Multimodal Large Language Models

Este trabajo identifica y valida una nueva vulnerabilidad en los modelos de lenguaje grandes multimodales, demostrando que optimizar una función de pérdida para inducir inestabilidad numérica genera imágenes que degradan significativamente el rendimiento del modelo con perturbaciones mínimas, revelando un vector de fallo distinto a las perturbaciones adversarias tradicionales.

Wai Tuck Wong, Jun Sun, Arunesh Sinha2026-03-06💻 cs

Capability Thresholds and Manufacturing Topology: How Embodied Intelligence Triggers Phase Transitions in Economic Geography

Este paper establece la Economía de la Inteligencia Encarnada, argumentando que cuando las capacidades de la IA física superan umbrales críticos de destreza y fiabilidad, provocan una transición de fase que reorganiza la geografía económica de la manufactura, desplazando las fábricas de los centros de mano de obra hacia ubicaciones optimizadas para máquinas y permitiendo una producción descentralizada cerca de la demanda.

Xinmin Fang, Lingfeng Tao, Zhengxiong Li2026-03-06🔬 physics

Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering

Este artículo propone un nuevo paradigma de aprendizaje llamado HARR (Reconstrucción y Representación de Atributos Heterogéneos) que transforma atributos numéricos y categóricos en un espacio homogéneo para aprender una métrica de distancia unificada, mejorando así la precisión y eficiencia del clustering en datos mixtos sin requerir parámetros ni garantías de convergencia.

Yiqun Zhang, Mingjie Zhao, Yizhou Chen + 2 more2026-03-06💻 cs

Benchmark of Benchmarks: Unpacking Influence and Code Repository Quality in LLM Safety Benchmarks

Este estudio evalúa por primera vez la influencia académica y la calidad del código de 31 benchmarks de seguridad en LLM, revelando que, aunque los benchmarks no superan a otros trabajos en impacto académico, existe una desconexión significativa entre la prominencia de los autores y la calidad del código, evidenciando una necesidad urgente de mejorar la reutilización y los estándares éticos en los repositorios.

Junjie Chu, Xinyue Shen, Ye Leng, Michael Backes, Yun Shen, Yang Zhang2026-03-06🔒 cs.CR

VSPrefill: Vertical-Slash Sparse Attention with Lightweight Indexing for Long-Context Prefilling

El paper presenta VSPrefill, un mecanismo de atención dispersa con indexación ligera que explota patrones estructurales verticales y diagonales para lograr una complejidad lineal durante la fase de prellenado, logrando una aceleración de 4.95x en contextos de 128k manteniendo el 98.35% de la precisión de la atención completa sin modificar los parámetros del modelo base.

Chen Guanzhong2026-03-06💻 cs

MAD-SmaAt-GNet: A Multimodal Advection-Guided Neural Network for Precipitation Nowcasting

El artículo presenta MAD-SmaAt-GNet, una arquitectura de red neuronal multimodal que mejora la predicción de precipitaciones a corto plazo al combinar un diseño ligero basado en SmaAt-UNet con un codificador adicional para múltiples variables meteorológicas y un componente de advección basado en física, logrando una reducción del 8,9% en el error cuadrático medio frente al modelo base.

Samuel van Wonderen, Siamak Mehrkanoon2026-03-06💻 cs

Towards Explainable Deep Learning for Ship Trajectory Prediction in Inland Waterways

Este estudio presenta un modelo de predicción de trayectorias de buques en vías navegables interiores basado en LSTM y atención, que logra una precisión comparable a estudios similares mientras revela mediante su diseño intrínsecamente interpretable que las mejoras en la exactitud no se deben exclusivamente a relaciones causales con las trayectorias de los buques cercanos.

Tom Legel, Dirk Söffker, Roland Schätzle + 1 more2026-03-06💻 cs

Progressive Refinement Regulation for Accelerating Diffusion Language Model Decoding

El artículo presenta la Regulación de Refinamiento Progresivo (PRR), un marco de control dinámico basado en la trayectoria de decodificación que acelera significativamente la generación de texto en modelos de lenguaje difusivos al adaptar el refinamiento de cada token según su convergencia empírica, manteniendo al mismo tiempo la calidad de la generación.

Lipeng Wan, Jianhui Gu, Junjie Ma + 4 more2026-03-06💻 cs

Projected Hessian Learning: Fast Curvature Supervision for Accurate Machine-Learning Interatomic Potentials

El artículo presenta la Aprendizaje de Hessiano Proyectado (PHL), un marco de entrenamiento escalable que incorpora información de curvatura en potenciales interatómicos de aprendizaje automático mediante productos Hessiano-vector, logrando una precisión comparable a la del Hessiano completo con un coste de memoria y tiempo significativamente menores.

Austin Rodriguez, Justin S. Smith, Sakib Matin + 3 more2026-03-06🔬 physics