cs.AI articoli | Gist.Science

Continual uncertainty learning

Questo studio propone un nuovo framework di apprendimento continuo basato su curriculum che, integrando un controllore basato su modello con l'apprendimento per rinforzo profondo, scompone il controllo robusto di sistemi meccanici non lineari con molteplici incertezze in una sequenza di compiti gestibili per garantire un trasferimento efficace dalla simulazione alla realtà senza dimenticare le conoscenze apprese.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

Il documento presenta ReDON, una nuova architettura di processore ottico neurale ricorrente che supera i limiti delle reti diffrattive tradizionali integrando una non linearità auto-modulata riconfigurabile, ottenendo così significativi miglioramenti di accuratezza e adattabilità con un consumo energetico trascurabile.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics

SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems

Il paper propone SafeGen-LLM, un modello linguistico addestrato con un framework a due stadi (SFT e GRPO) su un benchmark PDDL3 multi-dominio, che supera le limitazioni dei metodi esistenti garantendo una robusta generalizzazione della sicurezza nella pianificazione di compiti robotici.

Jialiang Fan, Weizhe Xu, Mengyu Liu + 3 more2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

Il paper propone CoDD, un framework ibrido che supera la barriera della fattorizzazione nei modelli linguistici di diffusione sostituendo le distribuzioni completamente fattorizzate con un layer di inferenza probabilistica leggero, permettendo così di modellare dipendenze congiunte complesse e ottenere generazioni di alta qualità in pochi passi senza i costi computazionali eccessivi delle soluzioni RL.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

OrthoAI: A Neurosymbolic Framework for Evidence-Grounded Biomechanical Reasoning in Clear Aligner Orthodontics

Il paper presenta OrthoAI, un framework neuro-simbolico che integra segmentazione dentale con supervisione sparsa, inferenza di vincoli biomeccanici basata su conoscenza e valutazione del trattamento per supportare le decisioni cliniche nell'ortodonzia con allineatori trasparenti.

Edouard Lansiaux, Margaux Leman, Mehdi Ammi2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

Questo articolo presenta un approccio a doppia pipeline per la segmentazione di immagini di uccelli basato su modelli fondazionali del 2025, che combina Grounding DINO 1.5 e YOLOv11 con SAM 2.1 per ottenere risultati di precisione superiore sia in modalità zero-shot che supervisionata, superando le reti di segmentazione tradizionali.

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Il paper introduce Pri4R, un approccio semplice ed efficace che potenzia i modelli Vision-Language-Action con una comprensione implicita delle dinamiche del mondo attraverso l'addestramento su rappresentazioni 4D privilegiate, migliorando significativamente le prestazioni nei compiti di manipolazione fisica senza aggiungere overhead computazionale durante l'inferenza.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

Il paper introduce \textsc{Gome}, un agente per l'ingegneria del machine learning che sostituisce la ricerca ad albero con l'ottimizzazione basata su gradienti, ottenendo risultati state-of-the-art su MLE-Bench e dimostrando che, man mano che le capacità di ragionamento dei modelli LLM migliorano, questo approccio supera progressivamente i metodi di esplorazione esaustiva.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Il paper presenta il Coordinated Boltzmann MCTS (CB-MCTS), un nuovo approccio decentralizzato che sostituisce la politica UCT deterministica con una strategia stocastica basata su Boltzmann e un bonus di entropia decrescente, risultando superiore al Dec-MCTS tradizionale in scenari ingannevoli e a ricompensa scarsa.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. Nguyen2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

Il paper presenta FinTexTS, un nuovo dataset su larga scala che associa dati temporali finanziari a notizie testuali attraverso un framework di accoppiamento semantico e multilivello, superando i limiti dei metodi basati su parole chiave e migliorando le prestazioni di previsione dei prezzi azionari.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

Il paper presenta SPARC, un metodo di pianificazione dei percorsi per robot multipli che utilizza un meccanismo di attenzione potenziato dalle relazioni spaziali (RMHA) per migliorare la comunicazione decentralizzata e ottenere prestazioni superiori in ambienti ad alta densità rispetto alle tecniche esistenti.

Sayang Mu, Xiangyu Wu, Bo An2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Il paper introduce due tecniche software, Overflow-Aware Scaling e Macro Block Scaling, che riducono drasticamente il divario di accuratezza tra il formato MXFP4 e NVFP4 nei grandi modelli linguistici, rendendo MXFP4 un'alternativa pratica ed efficiente dal punto di vista hardware senza richiedere modifiche all'hardware.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

Design Conductor: An agent autonomously builds a 1.5 GHz Linux-capable RISC-V CPU

Il documento presenta Design Conductor, un agente autonomo che ha progettato e realizzato in sole 12 ore un processore RISC-V Linux-compatibile funzionante a 1,48 GHz, passando direttamente dalle specifiche testuali al file di layout GDSII pronto per la produzione.

The Verkor Team, Ravi Krishna, Suresh Krishna, David Chin2026-03-11🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

Il paper presenta CktEvo, un benchmark e un framework di riferimento che abilita l'ottimizzazione automatica, a livello di repository e preservando la funzionalità, del codice RTL attraverso l'uso di modelli linguistici su larga scala guidati dal feedback degli strumenti di sintesi per migliorare le prestazioni energetiche, di potenza e di area (PPA).

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

Il lavoro presenta SiliconMind-V1, un framework multi-agente che utilizza la generazione di dati di addestramento orientata al ragionamento e la verifica guidata da testbench per permettere a modelli LLM localmente affinati di generare, testare e correggere iterativamente progetti RTL in Verilog, ottenendo una correttezza funzionale superiore rispetto allo stato dell'arte con minori risorse di addestramento.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

ALADIN: Accuracy-Latency-Aware Design-space Inference Analysis for Embedded AI Accelerators

Il paper presenta ALADIN, un framework di analisi del design space per acceleratori AI embedded basato su scratchpad che valuta i compromessi tra accuratezza, latenza e consumo di risorse per reti neurali quantizzate senza richiedere il deployment sulla piattaforma target.

T. Baldi, D. Casini, A. Biondi2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Questo studio preliminare suggerisce che le tecniche di allineamento nei modelli linguistici su larga scala possono generare una patologia collettiva iatrogena, dove la censura invisibile e la complessità dei vincoli di allineamento, anziché garantire la sicurezza, esacerbano il comportamento patologico e la dissociazione tra insight e azione in sistemi multi-agente.

Hiroki Fukui2026-03-11🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Questa tesi di dottorato presenta metodi innovativi ed economici per valutare e migliorare l'affidabilità degli acceleratori hardware per reti neurali profonde, introducendo nuovi strumenti analitici, ottimizzando i compromessi tra efficienza e tolleranza ai guasti e sviluppando la tecnica AdAM per l'enhancement dell'affidabilità in tempo reale senza sovraccarico.

Mahdi Taheri2026-03-11🤖 cs.AI

ARKV: Adaptive and Resource-Efficient KV Cache Management under Limited Memory Budget for Long-Context Inference in LLMs

Il paper presenta ARKV, un framework adattivo e leggero che ottimizza la gestione della cache KV per l'inferenza di LLM in contesti lunghi, riducendo l'uso di memoria GPU di 4 volte mantenendo il 97% dell'accuratezza di base senza richiedere riaddestramento o modifiche architetturali.

Jianlong Lei, Shashikant Ilager2026-03-11🤖 cs.AI

Measurement-Free Ancilla Recycling via Blind Reset: A Cross-Platform Study on Superconducting and Trapped-Ion Processors

Questo studio valuta il riciclo degli ancilla tramite reset cieco su processori superconduttori e a ioni intrappolati, dimostrando che tale approccio può ridurre la latenza del ciclo logico fino a 38 volte mantenendo un'alta pulizia degli ancilla, e definisce una matrice decisionale per l'implementazione specifica per piattaforma.

Sangkeum Lee2026-03-11⚛️ quant-ph

← Precedente Successivo →