cs.AI articoli | Gist.Science

Multi-head automated segmentation by incorporating detection head into the contextual layer neural network

Il paper propone un'architettura Transformer multi-testa basata su Swin U-Net che integra un modulo di rilevamento per attivare selettivamente la segmentazione solo nelle slice anatomicamente pertinenti, eliminando efficacemente i falsi positivi e migliorando l'affidabilità della segmentazione automatica nella radioterapia.

Edwin Kys, Febian Febian2026-03-11🤖 cs.AI

UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers

Il paper presenta UAT-LITE, un framework di inferenza che rende l'attenzione dei trasformatori preaddestrati consapevole dell'incertezza epistemica tramite dropout Monte Carlo, migliorando la calibrazione e la selezione delle predizioni senza modificare i pesi del modello o richiedere un addestramento aggiuntivo.

Elias Hossain, Shubhashis Roy Dipta, Subash Neupane, Rajib Rana, Ravid Shwartz-Ziv, Ivan Garibay, Niloofar Yousefi2026-03-11🤖 cs.AI

WebAccessVL: Violation-Aware VLM for Web Accessibility

Il paper presenta WebAccessVL, un modello visione-linguaggio supervisionato che corregge automaticamente le violazioni delle linee guida di accessibilità WCAG2 nel codice HTML dei siti web, preservando il design originale e riducendo drasticamente gli errori rispetto agli approcci esistenti.

Amber Yijia Zheng, Jae Joong Lee, Bedrich Benes, Raymond A. Yeh2026-03-11🤖 cs.AI

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

Il documento sostiene che la fiducia negli chatbot è spesso il risultato di meccanismi comportamentali e bias cognitivi sfruttati dal design, piuttosto che di una reale affidabilità, proponendo di ridefinirli come abili venditori e di distinguere tra la formazione psicologica della fiducia e la sua affidabilità normativa.

Aditya Gulati, Nuria Oliver2026-03-11🤖 cs.AI

Monocular Normal Estimation via Shading Sequence Estimation

Il paper presenta RoSE, un metodo innovativo che supera i limiti di allineamento 3D delle tecniche esistenti per la stima delle normali monoculare riformulando il problema come stima di sequenze di ombreggiatura tramite modelli generativi video, ottenendo così prestazioni state-of-the-art su dataset reali.

Zongrui Li, Xinhua Ma, Minghui Hu, Yunqing Zhao, Yingchen Yu, Qian Zheng, Chang Liu, Xudong Jiang, Song Bai2026-03-11🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

Il paper presenta "Infusion", un framework che utilizza le funzioni di influenza per modificare in modo sottile e scalabile un piccolo sottoinsieme dei dati di addestramento, permettendo di indurre cambiamenti mirati nel comportamento dei modelli di visione e linguaggio senza aggiungere esempi espliciti.

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis2026-03-11🤖 cs.AI

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

Il paper propone un framework di budgeting degli spike consapevole dell'energia per l'apprendimento continuo nelle reti neurali a impulsi, che integra replay esperienziale e parametri neuronali adattivi per migliorare l'accuratezza e ridurre il consumo energetico sia su dataset basati su frame che su eventi.

Anika Tabassum Meem, Muntasir Hossain Nadid, Md Zesun Ahmed Mia2026-03-11🤖 cs.AI

B-DENSE: Branching For Dense Ensemble Network Supervision Efficiency

Il paper propone B-DENSE, un nuovo framework che migliora l'efficienza dell'inferenza nei modelli di diffusione tramite allineamento denso di traiettorie multi-ramo, permettendo al modello studente di apprendere informazioni strutturali intermedie complete e ottenere una qualità di generazione superiore rispetto alle tecniche di distillazione esistenti.

Cherish Puniani, Tushar Kumar, Arnav Bendre, Gaurav Kumar, Shree Singhi2026-03-11🤖 cs.AI

Contextuality from Single-State Ontological Models: An Information-Theoretic No-Go Theorem

Il paper dimostra un teorema di impossibilità di tipo informativo che stabilisce che i modelli ontologici classici vincolati a riutilizzare un unico spazio di stati ontici non possono riprodurre le statistiche quantistiche senza incorrere in un costo informativo contestuale irriducibile, identificando tale limitazione come la radice fondamentale della contestualità.

Song-Ju Kim2026-03-11⚛️ quant-ph

Continual uncertainty learning

Questo studio propone un nuovo framework di apprendimento continuo basato su curriculum che, integrando un controllore basato su modello con l'apprendimento per rinforzo profondo, scompone il controllo robusto di sistemi meccanici non lineari con molteplici incertezze in una sequenza di compiti gestibili per garantire un trasferimento efficace dalla simulazione alla realtà senza dimenticare le conoscenze apprese.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

Il documento presenta ReDON, una nuova architettura di processore ottico neurale ricorrente che supera i limiti delle reti diffrattive tradizionali integrando una non linearità auto-modulata riconfigurabile, ottenendo così significativi miglioramenti di accuratezza e adattabilità con un consumo energetico trascurabile.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics

SafeGen-LLM: Enhancing Safety Generalization in Task Planning for Robotic Systems

Il paper propone SafeGen-LLM, un modello linguistico addestrato con un framework a due stadi (SFT e GRPO) su un benchmark PDDL3 multi-dominio, che supera le limitazioni dei metodi esistenti garantendo una robusta generalizzazione della sicurezza nella pianificazione di compiti robotici.

Jialiang Fan, Weizhe Xu, Mengyu Liu + 3 more2026-03-11🤖 cs.AI

Breaking the Factorization Barrier in Diffusion Language Models

Il paper propone CoDD, un framework ibrido che supera la barriera della fattorizzazione nei modelli linguistici di diffusione sostituendo le distribuzioni completamente fattorizzate con un layer di inferenza probabilistica leggero, permettendo così di modellare dipendenze congiunte complesse e ottenere generazioni di alta qualità in pochi passi senza i costi computazionali eccessivi delle soluzioni RL.

Ian Li, Zilei Shao, Benjie Wang, Rose Yu, Guy Van den Broeck, Anji Liu2026-03-11🤖 cs.AI

OrthoAI: A Neurosymbolic Framework for Evidence-Grounded Biomechanical Reasoning in Clear Aligner Orthodontics

Il paper presenta OrthoAI, un framework neuro-simbolico che integra segmentazione dentale con supervisione sparsa, inferenza di vincoli biomeccanici basata su conoscenza e valutazione del trattamento per supportare le decisioni cliniche nell'ortodonzia con allineatori trasparenti.

Edouard Lansiaux, Margaux Leman, Mehdi Ammi2026-03-11🤖 cs.AI

Zero-Shot and Supervised Bird Image Segmentation Using Foundation Models: A Dual-Pipeline Approach with Grounding DINO~1.5, YOLOv11, and SAM~2.1

Questo articolo presenta un approccio a doppia pipeline per la segmentazione di immagini di uccelli basato su modelli fondazionali del 2025, che combina Grounding DINO 1.5 e YOLOv11 con SAM 2.1 per ottenere risultati di precisione superiore sia in modalità zero-shot che supervisionata, superando le reti di segmentazione tradizionali.

Abhinav Munagala2026-03-11🤖 cs.AI

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

Il paper introduce Pri4R, un approccio semplice ed efficace che potenzia i modelli Vision-Language-Action con una comprensione implicita delle dinamiche del mondo attraverso l'addestramento su rappresentazioni 4D privilegiate, migliorando significativamente le prestazioni nei compiti di manipolazione fisica senza aggiungere overhead computazionale durante l'inferenza.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI

Reasoning as Gradient: Scaling MLE Agents Beyond Tree Search

Il paper introduce \textsc{Gome}, un agente per l'ingegneria del machine learning che sostituisce la ricerca ad albero con l'ottimizzazione basata su gradienti, ottenendo risultati state-of-the-art su MLE-Bench e dimostrando che, man mano che le capacità di ragionamento dei modelli LLM migliorano, questo approccio supera progressivamente i metodi di esplorazione esaustiva.

Yifei Zhang, Xu Yang, Xiao Yang, Bowen Xian, Qizheng Li, Shikai Fang, Jingyuan Li, Jian Wang, Mingrui Xu, Weiqing Liu, Jiang Bian2026-03-11🤖 cs.AI

Boltzmann-based Exploration for Robust Decentralized Multi-Agent Planning (Extended Version)

Il paper presenta il Coordinated Boltzmann MCTS (CB-MCTS), un nuovo approccio decentralizzato che sostituisce la politica UCT deterministica con una strategia stocastica basata su Boltzmann e un bonus di entropia decrescente, risultando superiore al Dec-MCTS tradizionale in scenari ingannevoli e a ricompensa scarsa.

Nhat D. A. Nguyen, Duong D. Nguyen, Gianluca Rizzo, Hung X. Nguyen2026-03-11🤖 cs.AI

FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing

Il paper presenta FinTexTS, un nuovo dataset su larga scala che associa dati temporali finanziari a notizie testuali attraverso un framework di accoppiamento semantico e multilivello, superando i limiti dei metodi basati su parole chiave e migliorando le prestazioni di previsione dei prezzi azionari.

Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn2026-03-11🤖 cs.AI

SPARC: Spatial-Aware Path Planning via Attentive Robot Communication

Il paper presenta SPARC, un metodo di pianificazione dei percorsi per robot multipli che utilizza un meccanismo di attenzione potenziato dalle relazioni spaziali (RMHA) per migliorare la comunicazione decentralizzata e ottenere prestazioni superiori in ambienti ad alta densità rispetto alle tecniche esistenti.

Sayang Mu, Xiangyu Wu, Bo An2026-03-11🤖 cs.AI

← Precedente Successivo →