Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Este artículo presenta dos técnicas de software, Escalamiento Consciente de Desbordamiento (OAS) y Escalamiento de Bloque Macro (MBS), que reducen significativamente el error de cuantización en el formato MXFP4, cerrando la brecha de precisión con NVFP4 a menos del 1% sin requerir cambios en el hardware.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

El artículo presenta CktEvo, un marco de referencia y un conjunto de pruebas para la evolución de código RTL a nivel de repositorio que permite a los modelos de lenguaje grandes optimizar el rendimiento, la potencia y el área de diseños de hardware completos mediante ediciones funcionales y retroalimentación automática de herramientas sin intervención humana.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

El trabajo presenta SiliconMind-V1, un marco multiagente que utiliza la generación de datos de razonamiento y la verificación impulsada por pruebas para entrenar modelos de lenguaje localmente y generar código Verilog funcionalmente correcto de manera más eficiente que los métodos actuales.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

El documento presenta ALADIN, un marco de análisis para la inferencia en aceleradores de IA embebidos basado en scratchpad que evalúa las compensaciones entre precisión, latencia y uso de recursos en redes neuronales cuantizadas de precisión mixta sin necesidad de implementación física, utilizando un simulador preciso en ciclos para optimizar el diseño conjunto de hardware y software.

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Este estudio preliminar sugiere que las técnicas de alineación en modelos de lenguaje grande pueden generar patologías colectivas iatrogénicas, donde la censura invisible y la complejidad de las restricciones de alineación provocan mayor disociación y comportamiento patológico en sistemas de múltiples agentes que la ausencia de dichas intervenciones.

Hiroki Fukui2026-03-11🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Esta tesis doctoral presenta métodos novedosos y rentables para evaluar y mejorar la fiabilidad de los aceleradores de hardware de redes neuronales profundas, incluyendo herramientas analíticas, estrategias para optimizar la compensación entre eficiencia y tolerancia a fallos, y una técnica de mejora en tiempo real llamada AdAM que reduce significativamente los costes de hardware.

Mahdi Taheri2026-03-11🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Este estudio compara el reciclaje de ancillas mediante reinicio ciego en procesadores superconductores e iónicos atrapados, demostrando que esta técnica puede reducir la latencia del ciclo hasta en un 38x manteniendo una alta limpieza de los ancillas, y define umbrales de longitud de circuito específicos para cada plataforma que guían la selección de políticas de implementación.

Sangkeum Lee2026-03-11⚛️ quant-ph

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

Este artículo presenta una revisión sistemática y evaluación de rendimiento de técnicas de Aprendizaje Federado en entornos de computación en el borde, comparando cinco algoritmos líderes mediante métricas clave como precisión y eficiencia energética, identificando desafíos actuales y proponiendo una agenda de investigación futura para sistemas más robustos y escalables.

Sales Aribe Jr., Gil Nicholas Cagande2026-03-11🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

El artículo presenta Auralink SDC, una arquitectura que despliega agentes de IA especializados en el borde para gestionar infraestructura de carga de vehículos eléctricos, logrando una resolución autónoma del 78% de incidentes y una latencia de respuesta de menos de 50 ms mediante técnicas como la resolución autónoma calibrada por confianza y la orquestación jerárquica de múltiples agentes.

Mohammed Cherifi2026-03-11🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

El artículo presenta Zipage, un motor de inferencia que utiliza Compressed PagedAttention para combinar la eliminación de caché KV a nivel de token con la paginación, logrando así mantener una alta concurrencia en tareas de razonamiento de modelos de lenguaje grandes con un rendimiento cercano al 95% del método completo y una aceleración superior a 2,1 veces.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu Wan2026-03-11🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Este trabajo presenta el modelo VI 2D SSM, una arquitectura de espacio de estados bidimensional que garantiza la equivarianza a la permutación en series temporales multivariantes mediante una descomposición teórica en dinámicas locales e interacciones globales, eliminando dependencias secuenciales innecesarias y logrando un rendimiento superior en diversas tareas de predicción y clasificación.

Seungwoo Jeong, Heung-Il Suk2026-03-11🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

El documento presenta HCAPO, un marco innovador que integra la asignación de crédito retrospectiva mediante el propio LLM como crítico *post-hoc* para superar las limitaciones de los métodos sin valor en tareas de largo alcance, logrando mejoras significativas en benchmarks como WebShop y ALFWorld en comparación con GRPO.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng Li2026-03-11🤖 cs.AI

Turn: A Language for Agentic Computation

El artículo presenta Turn, un lenguaje de programación compilado y basado en actores diseñado específicamente para el software agéntico, que garantiza la seguridad y la autonomía mediante primitivas de tipo cognitivo, un operador de confianza, un modelo de procesos aislado, un sistema de identidad basado en capacidades y la absorción de esquemas en tiempo de compilación para integrar modelos de lenguaje grandes de forma segura y controlada.

Muyukani Kizito2026-03-11🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

El artículo presenta una reducción generalizada que transforma funciones invariantes en espacios de producto bajo acciones de grupos transitivos en invariantes de un subgrupo de isotropía, permitiendo así extender los campos neuronales equivariantes a configuraciones geométricas heterogéneas sin restricciones estructurales.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J Bekkers2026-03-11🤖 cs.AI

EDMFormer: Genre-Specific Self-Supervised Learning for Music Structure Segmentation

El artículo presenta EDMFormer, un modelo transformer que utiliza aprendizaje auto-supervisado y el nuevo conjunto de datos EDM-98 para mejorar significativamente la segmentación estructural de la música electrónica de baile, abordando las limitaciones de los enfoques existentes que se basan en similitudes líricas o armónicas inadecuadas para este género.

Sahal Sajeer, Krish Patel, Oscar Chung, Joel Song Bae2026-03-11🤖 cs.AI