cs.AI papers | Gist.Science

MUGEN: Evaluating and Improving Multi-audio Understanding of Large Audio-Language Models

Dit paper introduceert MUGEN, een benchmark die de beperkingen van grote audio-taalmodellen bij het verwerken van meerdere simultane audio-invoeren blootlegt en aantoont dat trainingsvrije strategieën zoals Audio-Permutational Self-Consistency de prestaties aanzienlijk verbeteren.

Chih-Kai Yang, Yun-Shao Tsai, Yu-Kai Guo, Ping-Le Tsai, Yen-Ting Piao, Hung-Wei Chen, Ting-Lin Hsiao, Yun-Man Hsu, Ke-Han Lu, Hung-yi Lee2026-03-11🤖 cs.AI

Does the Question Really Matter? Training-Free Data Selection for Vision-Language SFT

Dit paper introduceert CVS, een trainingsvrije methode voor het selecteren van hoogwaardige multimodale data voor visueel-taalmodellen door de discrepantie in antwoordvaliditeit met en zonder de vraag te meten, waardoor de prestaties aanzienlijk worden verbeterd met minder data en lagere rekenkosten.

Peng Sun, Huawen Shen, Yi Ban, Tianfan Fu, Yanbo Wang, Yuqiang Li2026-03-11🤖 cs.AI

AutoAgent: Evolving Cognition and Elastic Memory Orchestration for Adaptive Agents

AutoAgent is een zelfevoluerend multi-agent framework dat adaptiviteit in dynamische omgevingen verbetert door evolutie van cognitie, contextuele besluitvorming en elastische geheugenorkestratie te combineren om langdurig leren en real-time beslissingen te verenigen zonder externe hertraining.

Xiaoxing Wang, Ning Liao, Shikun Wei, Chen Tang, Feiyu Xiong2026-03-11🤖 cs.AI

RbtAct: Rebuttal as Supervision for Actionable Review Feedback Generation

Dit paper introduceert RbtAct, een methode die gebruikmaakt van auteursrebuttals als impliciete supervisie om grote taalmodellen te trainen in het genereren van specifiekere en actievere peer-review feedback.

Sihong Wu, Yiling Ma, Yilun Zhao, Tiansheng Hu, Owen Jiang, Manasi Patwardhan, Arman Cohan2026-03-11🤖 cs.AI

EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning

Dit paper introduceert EXPLORE-Bench, een benchmark voor het evalueren van het vermogen van multimodale grote taalmodellen tot lang-horizon redenering in egocentrische omgevingen, en toont aan dat deze modellen significant achterblijven bij menselijke prestaties ondanks verbeteringen door stapsgewijze redenering.

Chengjun Yu, Xuhan Zhu, Chaoqun Du, Pengfei Yu, Wei Zhai, Yang Cao, Zheng-Jun Zha2026-03-11🤖 cs.AI

Ego: Embedding-Guided Personalization of Vision-Language Models

Deze paper introduceert Ego, een efficiënte methode voor het personaliseren van vision-language modellen door interne attention-mechanismen te gebruiken om visuele tokens als conceptgeheugen te extraheren, waardoor geavanceerde aanpassing mogelijk is zonder extra trainingsfasen of externe modules.

Soroush Seifi, Simon Gardier, Vaggelis Dorovatas, Daniel Olmeda Reino, Rahaf Aljundi2026-03-11🤖 cs.AI

World2Mind: Cognition Toolkit for Allocentric Spatial Reasoning in Foundation Models

Het paper introduceert World2Mind, een trainingsvrije toolkit die foundation modellen in staat stelt om robuuste allocentrische ruimtelijke redenering uit te voeren door het construeren van gestructureerde cognitieve kaarten en een allocentrische ruimtelijke boom, waardoor zelfs tekst-only modellen complexe 3D-taken kunnen oplossen met prestaties die dicht bij die van geavanceerde multimodale modellen liggen.

Shouwei Ruan, Bin Wang, Zhenyu Wu, Qihui Zhu, Yuxiang Zhang, Hang Su, Yubin Wang2026-03-11🤖 cs.AI

First Estimation of Model Parameters for Neutrino-Induced Nucleon Knockout Using Simulation-Based Inference

Dit onderzoek toont aan dat simulatie-gebaseerde inferentie (SBI) een veelbelovende machinelearningtechniek is om de parameters van neutrino-interactiemodellen nauwkeuriger te schatten dan traditionele methoden, zoals aangetoond door de toepassing op GENIE- en NuWro-simulaties.

Karla Tame-Narvaez, Steven Gardiner, Aleksandra Ciprijanovic, Giuseppe Cerati2026-03-11⚛️ hep-ph

Quantifying the Necessity of Chain of Thought through Opaque Serial Depth

Dit artikel introduceert het concept van 'opaque serial depth' om de noodzaak van Chain of Thought bij grote taalmodellen te kwantificeren en biedt een geautomatiseerde methode om de bovengrenzen van niet-geexternaliseerd redeneren in verschillende neurale netwerken te berekenen.

Jonah Brown-Cohen, David Lindner, Rohin Shah2026-03-11🤖 cs.AI

A Hybrid Quantum-Classical Framework for Financial Volatility Forecasting Based on Quantum Circuit Born Machines

Dit artikel presenteert een hybride quantum-klassiek framework dat een LSTM-netwerk combineert met een Quantum Circuit Born Machine om de volatiliteit van financiële markten nauwkeuriger te voorspellen dan traditionele modellen, zoals aangetoond door experimenten met Chinese aandelenindexen.

Yixiong Chen2026-03-11⚛️ quant-ph

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

Dit paper introduceert ACP-SL, een adaptief kanaalpruning-systeem voor gesplitst leren dat communicatie-overhead vermindert door label-bewuste kanaal-importantiemetingen te gebruiken om minder belangrijke kanalen te verwijderen en zo de doorgegeven 'gesmoorde' data te comprimeren zonder in te leveren op de nauwkeurigheid.

Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei Ni2026-03-11🤖 cs.AI

MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

Dit paper introduceert MITRA, een lokaal gehoste RAG-gebaseerde AI-assistent die gebruikmaakt van een geautomatiseerde documentpypeline en een tweelaagse vectordatabase om veilig en nauwkeurig contextbewuste vragen te beantwoorden over fysicanalyses binnen grote wetenschappelijke samenwerkingen zoals CMS.

Abhishikth Mallampalli, Sridhara Dasu2026-03-11🤖 cs.AI

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

Dit paper introduceert de 'smoothing pseudo-projector', een lichtgewicht correctiemodule die is geïnspireerd op het multigrid-paradigma en de robuustheid en trainingsdynamiek van transformer-modellen verbetert door ruis te onderdrukken zonder de kernarchitectuur te wijzigen.

Vitaly Bulgakov2026-03-11🤖 cs.AI

MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents

Dit paper introduceert MA-EgoQA, een nieuw benchmark en probleemdefinitie voor het beantwoorden van vragen op basis van gelijktijdig opgenomen egocentrische video's van meerdere embodied agents, en presenteert het EgoMAS-basismodel om de huidige tekortkomingen in systeemniveau-interpretatie te adresseren.

Kangsan Kim, Yanlai Yang, Suji Kim, Woongyeong Yeo, Youngwan Lee, Mengye Ren, Sung Ju Hwang2026-03-11🤖 cs.AI

SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases

Dit paper introduceert SCENEBench, een nieuw benchmarkpakket voor het evalueren van het begrip van niet-spraakcomponenten en context in audio door grote audio-taalmodellen, specifiek gericht op toepassing in toegankelijkheidstechnologie en industriële geluidsmeting.

Laya Iyer, Angelina Wang, Sanmi Koyejo2026-03-11🤖 cs.AI

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Dit paper introduceert HR-GAT, een hiërarchisch opgezet grafisch aandachtmodel dat geospatiale data gebruikt om de vraag naar spectrum nauwkeuriger te voorspellen dan bestaande methoden, wat essentieel is voor efficiënt spectrumbeheer.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Deze paper introduceert het Dynamics-Aware Policy Learning (DAPL)-framework, dat door het leren van contactgedreven dynamica via wereldmodelleren en versterkende leer, extrinsieke dexteriteit in rommelige omgevingen mogelijk maakt zonder handmatige heuristieken, met een succespercentage dat tot 50% reikt in real-world tests.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

LCA: Local Classifier Alignment for Continual Learning

Dit paper introduceert Local Classifier Alignment (LCA), een nieuwe verliesfunctie en volledige oplossing voor continu leren die de mismatch tussen aangepaste backbones en taakspecifieke classificatoren oplost om catastrofaal vergeten te voorkomen en de prestaties op benchmarks aanzienlijk te verbeteren.

Tung Tran, Danilo Vasconcellos Vargas, Khoat Than2026-03-11🤖 cs.AI

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Dit paper introduceert een lichtgewicht, trainingsvrij framework dat prompts als geparameteriseerde acties behandelt om het gedrag van LLM-multi-agenten in dialogen te sturen via dynamisch gegenereerde prompt-componenten, wat effectief bleek in het beïnvloeden van dialoogdynamiek voor sociale simulaties.

Hongbo Bo, Jingyu Hu, Weiru Liu2026-03-11🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

Dit paper introduceert MSSR, een ervaringherhaalframework voor continue fine-tuning van grote taalmodellen dat op basis van geschatte geheugensterkte van individuele samples adaptieve herhalingsintervallen toepast om catastrofale vergeten te verminderen zonder de aanpassingssnelheid te vertragen.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

← Vorige Volgende →