cs.AI artículos | Gist.Science

Continual uncertainty learning

Este estudio propone un marco de aprendizaje continuo basado en currículos que descompone problemas de control robusto con múltiples incertidumbres no lineales en tareas secuenciales, integrando un controlador basado en modelos para mejorar la eficiencia y evitar el olvido catastrófico, logrando así una transferencia exitosa de simulación a realidad en un controlador de vibración activa para trenes motrices automotrices.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

El artículo presenta ReDON, un nuevo procesador óptico neuronal recurrente que supera las limitaciones de expresividad de las redes ópticas difractivas tradicionales mediante una no linealidad auto-modulada reconfigurable, logrando mejoras significativas en precisión y eficiencia energética sin añadir consumo eléctrico adicional.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics

SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems

El artículo presenta SafeGen-LLM, un marco de entrenamiento post-procesamiento que combina ajuste fino supervisado y optimización de políticas para dotar a los modelos de lenguaje grandes de una capacidad robusta de generalización en seguridad para la planificación de tareas robóticas en diversos dominios.

Jialiang Fan, Weizhe Xu, Mengyu Liu + 3 more2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

El artículo presenta Coupled Discrete Diffusion (CoDD), un marco híbrido que supera la barrera de factorización en los modelos de lenguaje difusivos al reemplazar las distribuciones de salida totalmente factorizadas con una capa de inferencia probabilística ligera, permitiendo así generar texto coherente y de alta calidad en pocos pasos sin los altos costos computacionales de los enfoques existentes.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

OrthoAI: A Neurosymbolic Framework for Evidence-Grounded Biomechanical Reasoning in Clear Aligner Orthodontics

El artículo presenta OrthoAI, un marco neurosimbólico que integra segmentación de puntos dentales con supervisión escasa, inferencia de restricciones biomecánicas basada en ontologías y evaluación multicriterio para apoyar la toma de decisiones clínicas en ortodoncia con alineadores transparentes.

Edouard Lansiaux, Margaux Leman, Mehdi Ammi2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

Este artículo presenta un marco de doble flujo para la segmentación de imágenes de aves que combina Grounding DINO 1.5 y YOLOv11 con el modelo SAM 2.1, logrando resultados de vanguardia tanto en modo cero disparos como supervisado al superar las redes de segmentación tradicionales sin necesidad de reentrenar el modelo de segmentación.

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

El artículo presenta Pri4R, un enfoque que mejora los modelos de Visión-Lenguaje-Acción (VLA) al incorporar dinámicas del mundo mediante el aprendizaje de trayectorias de puntos 3D durante el entrenamiento, logrando así un control físico más preciso sin añadir sobrecarga computacional en la inferencia.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

El artículo presenta a \textsc{Gome}, un agente de ingeniería de aprendizaje automático que supera a los métodos tradicionales de búsqueda en árbol al operacionalizar la optimización basada en gradientes mediante el razonamiento estructurado, logrando un rendimiento superior a medida que aumenta la capacidad de razonamiento de los modelos.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Este trabajo presenta Coordinated Boltzmann MCTS (CB-MCTS), un nuevo enfoque de búsqueda en árboles de Monte Carlo descentralizado que utiliza una política estocástica basada en Boltzmann y una bonificación de entropía decreciente para superar las limitaciones de la exploración en entornos de recompensa dispersa o engañosa, demostrando un rendimiento superior frente a métodos existentes como Dec-MCTS.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. Nguyen2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

El artículo presenta FinTexTS, un nuevo conjunto de datos de series temporales financieras emparejadas con texto que utiliza un marco de emparejamiento semántico y multinivel para capturar las complejas interdependencias del mercado y mejorar la precisión en la predicción de precios de acciones.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

El artículo propone SPARC, un método de planificación de trayectorias para múltiples robots que utiliza un mecanismo de atención multi-cabeza mejorado con relaciones espaciales (RMHA) para priorizar dinámicamente la comunicación entre vecinos cercanos, logrando una tasa de éxito significativamente superior en entornos congestionados y una generalización cero-shot desde 8 hasta 128 robots.

Sayang Mu, Xiangyu Wu, Bo An2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Este artículo presenta dos técnicas de software, Escalamiento Consciente de Desbordamiento (OAS) y Escalamiento de Bloque Macro (MBS), que reducen significativamente el error de cuantización en el formato MXFP4, cerrando la brecha de precisión con NVFP4 a menos del 1% sin requerir cambios en el hardware.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

El agente autónomo Design Conductor logró diseñar, verificar y generar el archivo de layout (GDSII) de un procesador RISC-V completo y funcional que opera a 1.48 GHz en solo 12 horas, marcando el primer hito en la creación totalmente autónoma de un CPU desde la especificación hasta la preparación para fabricación.

The Verkor Team, Ravi Krishna, Suresh Krishna, David Chin2026-03-11🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

El artículo presenta CktEvo, un marco de referencia y un conjunto de pruebas para la evolución de código RTL a nivel de repositorio que permite a los modelos de lenguaje grandes optimizar el rendimiento, la potencia y el área de diseños de hardware completos mediante ediciones funcionales y retroalimentación automática de herramientas sin intervención humana.

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

El trabajo presenta SiliconMind-V1, un marco multiagente que utiliza la generación de datos de razonamiento y la verificación impulsada por pruebas para entrenar modelos de lenguaje localmente y generar código Verilog funcionalmente correcto de manera más eficiente que los métodos actuales.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

El documento presenta ALADIN, un marco de análisis para la inferencia en aceleradores de IA embebidos basado en scratchpad que evalúa las compensaciones entre precisión, latencia y uso de recursos en redes neuronales cuantizadas de precisión mixta sin necesidad de implementación física, utilizando un simulador preciso en ciclos para optimizar el diseño conjunto de hardware y software.

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Este estudio preliminar sugiere que las técnicas de alineación en modelos de lenguaje grande pueden generar patologías colectivas iatrogénicas, donde la censura invisible y la complejidad de las restricciones de alineación provocan mayor disociación y comportamiento patológico en sistemas de múltiples agentes que la ausencia de dichas intervenciones.

Hiroki Fukui2026-03-11🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Esta tesis doctoral presenta métodos novedosos y rentables para evaluar y mejorar la fiabilidad de los aceleradores de hardware de redes neuronales profundas, incluyendo herramientas analíticas, estrategias para optimizar la compensación entre eficiencia y tolerancia a fallos, y una técnica de mejora en tiempo real llamada AdAM que reduce significativamente los costes de hardware.

Mahdi Taheri2026-03-11🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

El paper presenta ARKV, un marco ligero y adaptativo que gestiona dinámicamente la memoria de la caché KV asignando niveles de precisión según la importancia de los tokens, logrando reducir el uso de memoria en 4x sin sacrificar significativamente la precisión en inferencias de largo contexto.

Jianlong Lei, Shashikant Ilager2026-03-11🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Este estudio compara el reciclaje de ancillas mediante reinicio ciego en procesadores superconductores e iónicos atrapados, demostrando que esta técnica puede reducir la latencia del ciclo hasta en un 38x manteniendo una alta limpieza de los ancillas, y define umbrales de longitud de circuito específicos para cada plataforma que guían la selección de políticas de implementación.

Sangkeum Lee2026-03-11⚛️ quant-ph

← Anterior Siguiente →