Continual uncertainty learning

Questo studio propone un nuovo framework di apprendimento continuo basato su curriculum che, integrando un controllore basato su modello con l'apprendimento per rinforzo profondo, scompone il controllo robusto di sistemi meccanici non lineari con molteplici incertezze in una sequenza di compiti gestibili per garantire un trasferimento efficace dalla simulazione alla realtà senza dimenticare le conoscenze apprese.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

Il documento presenta ReDON, una nuova architettura di processore ottico neurale ricorrente che supera i limiti delle reti diffrattive tradizionali integrando una non linearità auto-modulata riconfigurabile, ottenendo così significativi miglioramenti di accuratezza e adattabilità con un consumo energetico trascurabile.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics

Breaking the Factorization Barrier in Diffusion Language Models

Il paper propone CoDD, un framework ibrido che supera la barriera della fattorizzazione nei modelli linguistici di diffusione sostituendo le distribuzioni completamente fattorizzate con un layer di inferenza probabilistica leggero, permettendo così di modellare dipendenze congiunte complesse e ottenere generazioni di alta qualità in pochi passi senza i costi computazionali eccessivi delle soluzioni RL.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

Questo articolo presenta un approccio a doppia pipeline per la segmentazione di immagini di uccelli basato su modelli fondazionali del 2025, che combina Grounding DINO 1.5 e YOLOv11 con SAM 2.1 per ottenere risultati di precisione superiore sia in modalità zero-shot che supervisionata, superando le reti di segmentazione tradizionali.

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Il paper introduce Pri4R, un approccio semplice ed efficace che potenzia i modelli Vision-Language-Action con una comprensione implicita delle dinamiche del mondo attraverso l'addestramento su rappresentazioni 4D privilegiate, migliorando significativamente le prestazioni nei compiti di manipolazione fisica senza aggiungere overhead computazionale durante l'inferenza.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

Il paper introduce \textsc{Gome}, un agente per l'ingegneria del machine learning che sostituisce la ricerca ad albero con l'ottimizzazione basata su gradienti, ottenendo risultati state-of-the-art su MLE-Bench e dimostrando che, man mano che le capacità di ragionamento dei modelli LLM migliorano, questo approccio supera progressivamente i metodi di esplorazione esaustiva.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

Il paper presenta FinTexTS, un nuovo dataset su larga scala che associa dati temporali finanziari a notizie testuali attraverso un framework di accoppiamento semantico e multilivello, superando i limiti dei metodi basati su parole chiave e migliorando le prestazioni di previsione dei prezzi azionari.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

Unveiling the Potential of Quantization with MXFP4: Strategies for Quantization Error Reduction

Il paper introduce due tecniche software, Overflow-Aware Scaling e Macro Block Scaling, che riducono drasticamente il divario di accuratezza tra il formato MXFP4 e NVFP4 nei grandi modelli linguistici, rendendo MXFP4 un'alternativa pratica ed efficiente dal punto di vista hardware senza richiedere modifiche all'hardware.

Jatin Chhugani, Geonhwa Jeong, Bor-Yiing Su, Yunjie Pan, Hanmei Yang, Aayush Ankit, Jiecao Yu, Summer Deng, Yunqing Chen, Nadathur Satish, Changkyu Kim2026-03-11🤖 cs.AI

CktEvo: Repository-Level RTL Code Benchmark for Design Evolution

Il paper presenta CktEvo, un benchmark e un framework di riferimento che abilita l'ottimizzazione automatica, a livello di repository e preservando la funzionalità, del codice RTL attraverso l'uso di modelli linguistici su larga scala guidati dal feedback degli strumenti di sintesi per migliorare le prestazioni energetiche, di potenza e di area (PPA).

Zhengyuan Shi, Jingxin Wang, Tairan Cheng, Changran Xu, Weikang Qian, Qiang Xu2026-03-11🤖 cs.AI

SiliconMind-V1: Multi-Agent Distillation and Debug-Reasoning Workflows for Verilog Code Generation

Il lavoro presenta SiliconMind-V1, un framework multi-agente che utilizza la generazione di dati di addestramento orientata al ragionamento e la verifica guidata da testbench per permettere a modelli LLM localmente affinati di generare, testare e correggere iterativamente progetti RTL in Verilog, ottenendo una correttezza funzionale superiore rispetto allo stato dell'arte con minori risorse di addestramento.

Mu-Chi Chen, Yu-Hung Kao, Po-Hsuan Huang, Shao-Chun Ho, Hsiang-Yu Tsou, I-Ting Wu, En-Ming Huang, Yu-Kai Hung, Wei-Po Hsin, Cheng Liang, Chia-Heng Tu, Shih-Hao Hung, Hsiang-Tsung Kung2026-03-11🤖 cs.AI

Alignment Is the Disease: Censorship Visibility and Alignment Constraint Complexity as Determinants of Collective Pathology in Multi-Agent LLM Systems

Questo studio preliminare suggerisce che le tecniche di allineamento nei modelli linguistici su larga scala possono generare una patologia collettiva iatrogena, dove la censura invisibile e la complessità dei vincoli di allineamento, anziché garantire la sicurezza, esacerbano il comportamento patologico e la dissociazione tra insight e azione in sistemi multi-agente.

Hiroki Fukui2026-03-11🤖 cs.AI

PhD Thesis Summary: Methods for Reliability Assessment and Enhancement of Deep Neural Network Hardware Accelerators

Questa tesi di dottorato presenta metodi innovativi ed economici per valutare e migliorare l'affidabilità degli acceleratori hardware per reti neurali profonde, introducendo nuovi strumenti analitici, ottimizzando i compromessi tra efficienza e tolleranza ai guasti e sviluppando la tecnica AdAM per l'enhancement dell'affidabilità in tempo reale senza sovraccarico.

Mahdi Taheri2026-03-11🤖 cs.AI