How Long Can Unified Multimodal Models Generate Images Reliably? Taming Long-Horizon Interleaved Image Generation via Context Curation

Dit paper introduceert UniLongGen, een trainingsvrije inferentiestrategie die de betrouwbaarheid van langdurige, interleaved beeldgeneratie in unified multimodale modellen verbetert door dynamisch irrelevante visuele informatie te verwijderen en zo de ophoping van visuele vervuiling te voorkomen.

Haoyu Chen, Qing Liu, Yuqian Zhou, He Zhang, Zhaowen Wang, Mengwei Ren, Jingjing Ren, Xiang Wang, Zhe Lin, Lei Zhu2026-03-10💻 cs

Targeted Speaker Poisoning Framework in Zero-Shot Text-to-Speech

Deze paper introduceert een nieuw raamwerk voor 'Speech Generation Speaker Poisoning' om de privacyrisico's van zero-shot tekst-naar-spraakmodellen te beperken door specifieke stemidentiteiten te verwijderen, waarbij wordt aangetoond dat dit effectief werkt voor tot 15 sprekers maar schaalbaarheidsproblemen ondervindt bij 100 sprekers.

Thanapat Trachu, Thanathai Lertpetchpun, Sai Praneeth Karimireddy, Shrikanth Narayanan2026-03-10💻 cs

Nw\=ach\=a Mun\=a: A Devanagari Speech Corpus and Proximal Transfer Benchmark for Nepal Bhasha ASR

De auteurs presenteren Nwāchā Munā, een nieuw spraakcorpus en benchmark voor de bedreigde Nepal Bhasha-taal, en tonen aan dat effectieve spraakherkenning mogelijk is door middel van computerefficiënte, taalkundig nabije transfer van het Nepalees, in plaats van zware meertalige modellen.

Rishikesh Kumar Sharma, Safal Narshing Shrestha, Jenny Poudel, Rupak Tiwari, Arju Shrestha, Rupak Raj Ghimire, Bal Krishna Bal2026-03-10💬 cs.CL

GRD-Net: Generative-Reconstructive-Discriminative Anomaly Detection with Region of Interest Attention Module

Het paper introduceert GRD-Net, een nieuw model voor industriële afwijkingdetectie dat een generatieve reconstructie-architectuur combineert met een discriminatieve module voor segmentatie van gebieden van belang, waardoor de afhankelijkheid van vooraf gedefinieerde voorverwerkingsalgoritmen wordt verminderd en de generalisatie op zowel synthetische als realistische industriële datasets wordt verbeterd.

Niccolò Ferrari, Michele Fraccaroli, Evelina Lamma2026-03-10🤖 cs.LG

Integration of deep generative Anomaly Detection algorithm in high-speed industrial line

Dit paper presenteert een semi-supervised anomaliedetectieframework op basis van generatieve adversariale netwerken dat is ontworpen voor online implementatie op een hoge-snelheids Blow-Fill-Seal-productielijn, waar het met hoge nauwkeurigheid en binnen strikte tijdsbeperkingen defecten detecteert door enkel te trainen op nominale monsters.

Niccolò Ferrari, Nicola Zanarini, Michele Fraccaroli, Alice Bizzarri, Evelina Lamma2026-03-10🤖 cs.LG

Evaluating Synthetic Data for Baggage Trolley Detection in Airport Logistics

Dit artikel introduceert een synthetische data-pipeline op basis van een digitale tweeling van de luchthaven van Algiers die, in combinatie met YOLO-OBB en gemengde training, de annotatie-inspanning voor het detecteren van bagagewagentjes met 25 tot 35 procent verlaagt terwijl de prestaties gelijk blijven aan of beter zijn dan die van modellen getraind op volledige real-world datasets.

Abdeldjalil Taibi, Mohmoud Badlis, Amina Bensalem, Belkacem Zouilekh, Mohammed Brahimi2026-03-10🤖 cs.LG

AtomicVLA: Unlocking the Potential of Atomic Skill Learning in Robots

Deze paper introduceert AtomicVLA, een unificerend kader voor robotplanning en -executie dat via een Skill-Guided Mixture-of-Experts (SG-MoE) schaalbare atomaire vaardigheden leert en dynamisch combineert, waardoor robuustere prestaties worden bereikt bij langdurige taken en voortdurend leren in vergelijking met bestaande VLA-modellen.

Likui Zhang, Tao Tang, Zhihao Zhan, Xiuwei Chen, Zisheng Chen, Jianhua Han, Jiangtong Zhu, Pei Xu, Hang Xu, Hefeng Wu, Liang Lin, Xiaodan Liang2026-03-10💻 cs

AI-Driven Phase Identification from X-ray Hyperspectral Imaging of cycled Na-ion Cathode Materials

Dit artikel presenteert een door AI-aangedreven methode die hyperspectrale STXM-data van Na-ion kathodematerialen onder ruwe bemonsteringsomstandigheden verwerkt om nanoschaal-faseheterogeniteit en -evolutie in individuele deeltjes nauwkeurig in kaart te brengen.

Fayçal Adrar, Nicolas Folastre, Chloé Pablos, Stefan Stanescu, Sufal Swaraj, Raghvender Raghvender, François Cadiou, Laurence Croguennec, Matthieu Bugnet, Arnaud Demortière2026-03-10🔬 cond-mat.mtrl-sci