cs.LG artículos | Gist.Science

Equitable Multi-Task Learning for AI-RANs

Este artículo presenta el marco OWO-FMTL, un enfoque de aprendizaje multitarea en línea que garantiza equidad a largo plazo en las redes de acceso por radio habilitadas para IA mediante un mecanismo de actualización primal-dual ligero que equilibra la eficiencia y la justicia en entornos de recursos compartidos dinámicos.

Panayiotis Raptis, Fatih Aslan, George IosifidisWed, 11 Ma🤖 cs.LG

KernelCraft: Benchmarking for Agentic Close-to-Metal Kernel Generation on Emerging Hardware

El paper presenta KernelCraft, el primer benchmark que demuestra cómo los agentes de IA pueden generar y optimizar automáticamente kernels de bajo nivel para aceleradores emergentes con nuevas arquitecturas de instrucciones, reduciendo significativamente el tiempo y la complejidad del desarrollo manual.

Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren ZhaoWed, 11 Ma🤖 cs.LG

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

El documento presenta ALADIN, un marco de análisis para la inferencia en aceleradores de IA embebidos basado en scratchpad que evalúa las compensaciones entre precisión, latencia y uso de recursos en redes neuronales cuantizadas de precisión mixta sin necesidad de implementación física, utilizando un simulador preciso en ciclos para optimizar el diseño conjunto de hardware y software.

T. Baldi, D. Casini, A. BiondiWed, 11 Ma🤖 cs.AI

Performance Analysis of Edge and In-Sensor AI Processors: A Comparative Review

Esta revisión analiza el panorama de los procesadores de IA de ultra bajo consumo, comparando arquitecturas heterogéneas, aceleradores neuronales y diseños en el sensor, y valida empíricamente el rendimiento de tres plataformas representativas (GAP9, STM32N6 e IMX500) para demostrar la superioridad de la computación en el sensor en términos de eficiencia energética y latencia.

Luigi Capogrosso, Pietro Bonazzi, Michele MagnoWed, 11 Ma🤖 cs.LG

Data-Rate-Aware High-Speed CNN Inference on FPGAs

Este artículo presenta una arquitectura de acelerador de CNN para FPGAs que, mediante la exploración del espacio de diseño y el procesamiento de múltiples píxeles, optimiza la utilización de recursos y la eficiencia energética al adaptar dinámicamente las implementaciones de hardware a las tasas de datos variables de las capas, permitiendo la ejecución eficiente de redes complejas en un solo chip.

Tobias Habermann, Martin KummWed, 11 Ma🤖 cs.LG

Memory-Augmented Spiking Networks: Synergistic Integration of Complementary Mechanisms for Neuromorphic Vision

Este estudio demuestra que la integración equilibrada de mecanismos de memoria complementarios, como el aprendizaje contrastivo supervisado y las redes recurrentes jerárquicas, en redes de espigas neuronales (SNN) supera las compensaciones individuales para lograr un rendimiento óptimo en precisión, eficiencia energética y organización neuronal en tareas de visión neuromórfica.

Effiong Blessing, Chiung-Yi Tseng, Isaac Nkrumah, Junaid RehmanWed, 11 Ma🤖 cs.LG

Hebbian-Oscillatory Co-Learning

El artículo presenta HOC-L, un marco dinámico unificado de dos escalas temporales que combina la geometría hiperbólica dispersa y la sincronización oscilatoria para lograr una plasticidad estructural guiada por la coherencia de fase, garantizando la convergencia teórica y una complejidad computacional eficiente.

Hasi HaysWed, 11 Ma🤖 cs.LG

Autonomous Edge-Deployed AI Agents for Electric Vehicle Charging Infrastructure Management

El artículo presenta Auralink SDC, una arquitectura que despliega agentes de IA especializados en el borde para gestionar infraestructura de carga de vehículos eléctricos, logrando una resolución autónoma del 78% de incidentes y una latencia de respuesta de menos de 50 ms mediante técnicas como la resolución autónoma calibrada por confianza y la orquestación jerárquica de múltiples agentes.

Mohammed CherifiWed, 11 Ma🤖 cs.AI

Sensitivity-Guided Framework for Pruned and Quantized Reservoir Computing Accelerators

Este artículo presenta un marco de compresión para la Computación de Reservorio que utiliza un mecanismo de poda basado en sensibilidad para optimizar el equilibrio entre precisión, eficiencia de hardware y recursos en implementaciones de FPGA mediante la poda y cuantización de pesos.

Atousa Jafari, Mahdi Taheri, Hassan Ghasemzadeh Mohammadi, Christian Herglotz, Marco PlatznerWed, 11 Ma🤖 cs.AI

The AetherFloat Family: Block-Scale-Free Quad-Radix Floating-Point Architectures for AI Accelerators

El documento presenta la familia AetherFloat, una arquitectura de punto flotante cuaternaria y sin escalado por bloques diseñada para aceleradores de IA que elimina la lógica de escalado dinámica, reduce significativamente el área y el consumo energético, y mejora el rendimiento mediante un manto explícito y un redondeo estocástico compartido.

Keita MorisakiWed, 11 Ma🤖 cs.LG

Robust Parameter and State Estimation in Multiscale Neuronal Systems Using Physics-Informed Neural Networks

Este trabajo presenta un marco de redes neuronales informadas por física (PINN) que logra una estimación robusta de parámetros biofísicos y la reconstrucción de estados ocultos en modelos neuronales multiescala, superando las limitaciones de los métodos tradicionales al requerir solo observaciones parciales de voltaje y funcionar eficazmente incluso con estimaciones iniciales no informativas.

Changliang Wei, Yangyang Wang, Xueyu ZhuWed, 11 Ma🤖 cs.LG

Permutation-Equivariant 2D State Space Models: Theory and Canonical Architecture for Multivariate Time Series

Este trabajo presenta el modelo VI 2D SSM, una arquitectura de espacio de estados bidimensional que garantiza la equivarianza a la permutación en series temporales multivariantes mediante una descomposición teórica en dinámicas locales e interacciones globales, eliminando dependencias secuenciales innecesarias y logrando un rendimiento superior en diversas tareas de predicción y clasificación.

Seungwoo Jeong, Heung-Il SukWed, 11 Ma🤖 cs.AI

Hindsight Credit Assignment for Long-Horizon LLM Agents

El documento presenta HCAPO, un marco innovador que integra la asignación de crédito retrospectiva mediante el propio LLM como crítico *post-hoc* para superar las limitaciones de los métodos sin valor en tareas de largo alcance, logrando mejoras significativas en benchmarks como WebShop y ALFWorld en comparación con GRPO.

Hui-Ze Tan, Xiao-Wen Yang, Hao Chen, Jie-Jing Shao, Yi Wen, Yuteng Shen, Weihong Luo, Xiku Du, Lan-Zhe Guo, Yu-Feng LiWed, 11 Ma🤖 cs.AI

Generalized Reduction to the Isotropy for Flexible Equivariant Neural Fields

El artículo presenta una reducción generalizada que transforma funciones invariantes en espacios de producto bajo acciones de grupos transitivos en invariantes de un subgrupo de isotropía, permitiendo así extender los campos neuronales equivariantes a configuraciones geométricas heterogéneas sin restricciones estructurales.

Alejandro García-Castellanos, Gijs Bellaard, Remco Duits, Daniel Pelt, Erik J BekkersWed, 11 Ma🤖 cs.AI

On the Formal Limits of Alignment Verification

Este artículo demuestra que no es posible diseñar un procedimiento de verificación de alineación que sea simultáneamente sonoro, general y tratable, estableciendo un trilema fundamental que define los límites teóricos de la certificación formal de la seguridad en la IA.

Ayushi AgarwalWed, 11 Ma🤖 cs.LG

SPREAD: Subspace Representation Distillation for Lifelong Imitation Learning

El artículo presenta SPREAD, un marco de aprendizaje por imitación vitalicio que utiliza descomposición en valores singulares para preservar la geometría de las representaciones de tareas en subespacios de bajo rango, logrando así una transferencia de conocimiento estable y un rendimiento superior al estado del arte en el benchmark LIBERO.

Kaushik Roy, Giovanni D'urso, Nicholas Lawrance, Brendan Tidd, Peyman MoghadamWed, 11 Ma🤖 cs.LG

Micro-Diffusion Compression -- Binary Tree Tweedie Denoising for Online Probability Estimation

El artículo presenta Midicoth, un sistema de compresión sin pérdida que mejora la estimación de probabilidades en modelos adaptativos mediante una capa de denoising de micro-difusión basada en un árbol binario que corrige las distorsiones causadas por el suavizado de priores en contextos escasos.

Roberto TacconelliWed, 11 Ma🤖 cs.LG

Multi-level meta-reinforcement learning with skill-based curriculum

Este trabajo propone un marco de aprendizaje por refuerzo meta-multinivel que combina la compresión eficiente de procesos de decisión de Markov mediante jerarquías de habilidades con un aprendizaje curricular, logrando así reducir la complejidad de la búsqueda de políticas, facilitar la transferencia de habilidades entre tareas y niveles, y garantizar la consistencia teórica bajo suposiciones moderadas.

Sichen Yang (Johns Hopkins University), Mauro Maggioni (Johns Hopkins University)Wed, 11 Ma🤖 cs.AI

The Temporal Markov Transition Field

Este artículo introduce el Campo de Transición Markoviano Temporal (TMTF), una extensión del método MTF que divide la serie temporal en segmentos contiguos para estimar matrices de transición locales, preservando así la información sobre cuándo ocurren los cambios de régimen y evitando el promediado engañoso de dinámicas no estacionarias.

Michael LeznikWed, 11 Ma🤖 cs.LG

SoftJAX & SoftTorch: Empowering Automatic Differentiation Libraries with Informative Gradients

Este trabajo presenta SoftJAX y SoftTorch, bibliotecas de código abierto que unifican y facilitan el acceso a relajaciones suaves diferenciables para operaciones "duras" en JAX y PyTorch, permitiendo el uso de gradientes informativos en optimizaciones basadas en gradientes.

Anselm Paulus, A. René Geist, Vít Musil, Sebastian Hoffmann, Onur Beker, Georg MartiusWed, 11 Ma🤖 cs.LG

← Anterior Siguiente →