Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Este trabajo presenta Coordinated Boltzmann MCTS (CB-MCTS), un nuevo enfoque de búsqueda en árboles de Monte Carlo descentralizado que utiliza una política estocástica basada en Boltzmann y una bonificación de entropía decreciente para superar las limitaciones de la exploración en entornos de recompensa dispersa o engañosa, demostrando un rendimiento superior frente a métodos existentes como Dec-MCTS.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. NguyenWed, 11 Ma🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

El artículo presenta FinTexTS, un nuevo conjunto de datos de series temporales financieras emparejadas con texto que utiliza un marco de emparejamiento semántico y multinivel para capturar las complejas interdependencias del mercado y mejorar la precisión en la predicción de precios de acciones.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin AhnWed, 11 Ma🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

El artículo propone SPARC, un método de planificación de trayectorias para múltiples robots que utiliza un mecanismo de atención multi-cabeza mejorado con relaciones espaciales (RMHA) para priorizar dinámicamente la comunicación entre vecinos cercanos, logrando una tasa de éxito significativamente superior en entornos congestionados y una generalización cero-shot desde 8 hasta 128 robots.

Sayang Mu, Xiangyu Wu, Bo AnWed, 11 Ma🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Este artículo presenta dos técnicas de software, Escalamiento Consciente de Desbordamiento (OAS) y Escalamiento de Bloque Macro (MBS), que reducen significativamente el error de cuantización en el formato MXFP4, cerrando la brecha de precisión con NVFP4 a menos del 1% sin requerir cambios en el hardware.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu KimWed, 11 Ma🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

El artículo presenta CktEvo, un marco de referencia y un conjunto de pruebas para la evolución de código RTL a nivel de repositorio que permite a los modelos de lenguaje grandes optimizar el rendimiento, la potencia y el área de diseños de hardware completos mediante ediciones funcionales y retroalimentación automática de herramientas sin intervención humana.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang XuWed, 11 Ma🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

El trabajo presenta SiliconMind-V1, un marco multiagente que utiliza la generación de datos de razonamiento y la verificación impulsada por pruebas para entrenar modelos de lenguaje localmente y generar código Verilog funcionalmente correcto de manera más eficiente que los métodos actuales.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung KungWed, 11 Ma🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

El documento presenta ALADIN, un marco de análisis para la inferencia en aceleradores de IA embebidos basado en scratchpad que evalúa las compensaciones entre precisión, latencia y uso de recursos en redes neuronales cuantizadas de precisión mixta sin necesidad de implementación física, utilizando un simulador preciso en ciclos para optimizar el diseño conjunto de hardware y software.

T. Baldi, D. Casini, A. BiondiWed, 11 Ma🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Este estudio preliminar sugiere que las técnicas de alineación en modelos de lenguaje grande pueden generar patologías colectivas iatrogénicas, donde la censura invisible y la complejidad de las restricciones de alineación provocan mayor disociación y comportamiento patológico en sistemas de múltiples agentes que la ausencia de dichas intervenciones.

Hiroki FukuiWed, 11 Ma🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Esta tesis doctoral presenta métodos novedosos y rentables para evaluar y mejorar la fiabilidad de los aceleradores de hardware de redes neuronales profundas, incluyendo herramientas analíticas, estrategias para optimizar la compensación entre eficiencia y tolerancia a fallos, y una técnica de mejora en tiempo real llamada AdAM que reduce significativamente los costes de hardware.

Mahdi TaheriWed, 11 Ma🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Este estudio compara el reciclaje de ancillas mediante reinicio ciego en procesadores superconductores e iónicos atrapados, demostrando que esta técnica puede reducir la latencia del ciclo hasta en un 38x manteniendo una alta limpieza de los ancillas, y define umbrales de longitud de circuito específicos para cada plataforma que guían la selección de políticas de implementación.

Sangkeum LeeWed, 11 Ma⚛️ quant-ph

Benchmarking Federated Learning in Edge Computing Environments: A Systematic Review and Performance Evaluation

Este artículo presenta una revisión sistemática y evaluación de rendimiento de técnicas de Aprendizaje Federado en entornos de computación en el borde, comparando cinco algoritmos líderes mediante métricas clave como precisión y eficiencia energética, identificando desafíos actuales y proponiendo una agenda de investigación futura para sistemas más robustos y escalables.

Sales Aribe Jr., Gil Nicholas CagandeWed, 11 Ma🤖 cs.AI

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

El artículo presenta Auralink SDC, una arquitectura que despliega agentes de IA especializados en el borde para gestionar infraestructura de carga de vehículos eléctricos, logrando una resolución autónoma del 78% de incidentes y una latencia de respuesta de menos de 50 ms mediante técnicas como la resolución autónoma calibrada por confianza y la orquestación jerárquica de múltiples agentes.

Mohammed CherifiWed, 11 Ma🤖 cs.AI

Zipage: Maintain High Request Concurrency for LLM Reasoning through Compressed PagedAttention

El artículo presenta Zipage, un motor de inferencia que utiliza Compressed PagedAttention para combinar la eliminación de caché KV a nivel de token con la paginación, logrando así mantener una alta concurrencia en tareas de razonamiento de modelos de lenguaje grandes con un rendimiento cercano al 95% del método completo y una aceleración superior a 2,1 veces.

Mengqi Liao, Lu Wang, Chaoyun Zhang, Bo Qiao, Si Qin, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang, Huaiyu WanWed, 11 Ma🤖 cs.AI

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Este trabajo presenta el modelo VI 2D SSM, una arquitectura de espacio de estados bidimensional que garantiza la equivarianza a la permutación en series temporales multivariantes mediante una descomposición teórica en dinámicas locales e interacciones globales, eliminando dependencias secuenciales innecesarias y logrando un rendimiento superior en diversas tareas de predicción y clasificación.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

El documento presenta HCAPO, un marco innovador que integra la asignación de crédito retrospectiva mediante el propio LLM como crítico *post-hoc* para superar las limitaciones de los métodos sin valor en tareas de largo alcance, logrando mejoras significativas en benchmarks como WebShop y ALFWorld en comparación con GRPO.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng LiWed, 11 Ma🤖 cs.AI