cs.AI papers | Gist.Science

MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents

Dit paper introduceert MA-EgoQA, een nieuw benchmark en probleemdefinitie voor het beantwoorden van vragen op basis van gelijktijdig opgenomen egocentrische video's van meerdere embodied agents, en presenteert het EgoMAS-basismodel om de huidige tekortkomingen in systeemniveau-interpretatie te adresseren.

Kangsan Kim, Yanlai Yang, Suji Kim, Woongyeong Yeo, Youngwan Lee, Mengye Ren, Sung Ju Hwang2026-03-11🤖 cs.AI

SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases

Dit paper introduceert SCENEBench, een nieuw benchmarkpakket voor het evalueren van het begrip van niet-spraakcomponenten en context in audio door grote audio-taalmodellen, specifiek gericht op toepassing in toegankelijkheidstechnologie en industriële geluidsmeting.

Laya Iyer, Angelina Wang, Sanmi Koyejo2026-03-11🤖 cs.AI

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Dit paper introduceert HR-GAT, een hiërarchisch opgezet grafisch aandachtmodel dat geospatiale data gebruikt om de vraag naar spectrum nauwkeuriger te voorspellen dan bestaande methoden, wat essentieel is voor efficiënt spectrumbeheer.

Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Deze paper introduceert het Dynamics-Aware Policy Learning (DAPL)-framework, dat door het leren van contactgedreven dynamica via wereldmodelleren en versterkende leer, extrinsieke dexteriteit in rommelige omgevingen mogelijk maakt zonder handmatige heuristieken, met een succespercentage dat tot 50% reikt in real-world tests.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

LCA: Local Classifier Alignment for Continual Learning

Dit paper introduceert Local Classifier Alignment (LCA), een nieuwe verliesfunctie en volledige oplossing voor continu leren die de mismatch tussen aangepaste backbones en taakspecifieke classificatoren oplost om catastrofaal vergeten te voorkomen en de prestaties op benchmarks aanzienlijk te verbeteren.

Tung Tran, Danilo Vasconcellos Vargas, Khoat Than2026-03-11🤖 cs.AI

Influencing LLM Multi-Agent Dialogue via Policy-Parameterized Prompts

Dit paper introduceert een lichtgewicht, trainingsvrij framework dat prompts als geparameteriseerde acties behandelt om het gedrag van LLM-multi-agenten in dialogen te sturen via dynamisch gegenereerde prompt-componenten, wat effectief bleek in het beïnvloeden van dialoogdynamiek voor sociale simulaties.

Hongbo Bo, Jingyu Hu, Weiru Liu2026-03-11🤖 cs.AI

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

Dit paper introduceert MSSR, een ervaringherhaalframework voor continue fine-tuning van grote taalmodellen dat op basis van geschatte geheugensterkte van individuele samples adaptieve herhalingsintervallen toepast om catastrofale vergeten te verminderen zonder de aanpassingssnelheid te vertragen.

Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

MedMASLab is een unificerend raamwerk en benchmarkplatform dat de architecturale fragmentatie in multimodale medische multi-agent systemen aanpakt door een gestandaardiseerd communicatieprotocol, een geautomatiseerde klinische redeneerevaluator en een uitgebreide benchmark te introduceren, waarmee een kritisch prestatiekloof tussen gespecialiseerde medische domeinen wordt blootgelegd.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Dit artikel presenteert een door kunstmatige intelligentie en machine learning aangedreven, datagestuurde aanpak om de spectrumvraag nauwkeurig te schatten aan de hand van licentie- en crowdsourced-data, wat beleidsmakers helpt bij een efficiëntere toewijzing van spectrumresources.

Colin Brown, Mohamad Alkadamani, Halim Yanikomeroglu2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

Dit paper introduceert ACADiff, een adaptief latent diffusion-framework dat ontbrekende multimodale hersenbeelden synthetiseert door klinische metadata en beschikbare beeldvorming te integreren, waardoor de diagnose van de ziekte van Alzheimer ook bij extreme data-ontbrekingen robuust blijft.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

Towards Flexible Spectrum Access: Data-Driven Insights into Spectrum Demand

Dit artikel presenteert een datagedreven methode die gebruikmaakt van ruimtelijke analyse en machine learning om variaties in spectrumvraag te schatten en de belangrijkste drijvende krachten te identificeren, waarmee beleidsmakers beter kunnen inspelen op de eisen van toekomstige 6G-netwerken.

Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

PathMem is een op geheugen gericht multimodaal framework dat, geïnspireerd door het hiërarchische geheugen van menselijke pathologen, gestructureerde domeinkennis integreert om de diagnose- en rapportageprestaties van pathologie-MLLMs aanzienlijk te verbeteren.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

Deze paper introduceert k-MTR, een end-to-end multi-task framework dat directe diagnostische analyses van het hart uitvoert op basis van onderbemonsterde k-ruimte-data, waardoor de traditionele en foutgevoelige stap van beeldherstel wordt omzeild.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Dit onderzoek toont aan dat vertrouwen gebaseerde afweging in gerangschikte beslissingssystemen alleen monotoon de kwaliteit verbetert bij structurele onzekerheid, terwijl het bij contextuele onzekerheid faalt en daarom een diagnose van het onzekerheidstype vereist voor effectieve implementatie.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Dit artikel introduceert de Overfitting-Underfitting Indicator (OUI) als een efficiënt, vroeg signaal dat op basis van neuronale activatiepatronen al na 10% van de training succesvolle leerstappen in PPO-actor-critic modellen kan onderscheiden van instabiele of suboptimale configuraties.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Towards a Neural Debugger for Python

Dit paper introduceert neurale debuggers, taalmodellen die traditionele debuggers nabootsen door interactieve controle over Python-uitvoering te bieden, waardoor zowel voorwaartse als achterwaartse uitvoeringsvoorspelling mogelijk wordt en de basis wordt gelegd voor geavanceerde agentische coderingssystemen.

Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

In tegenstelling tot mensen, die bij nadenken minder eerlijk worden, blijkt dat redenering bij grote taalmodellen de eerlijkheid verhoogt doordat het proces de modellen door een vertegenwoordigingsruimte leidt waar eerlijke antwoorden stabieler zijn dan leugenachtige.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

Dit paper introduceert BEACON, een methode die taalgeconditioneerde navigatie onder obstructie verbetert door in plaats van 2D-beeldvoorspellingen een vogelvluchtaanzicht (BEV) van toegankelijkheidskansen te genereren die ook verborgen gebieden omvat, wat resulteert in een aanzienlijke prestatieverbetering ten opzichte van bestaande beeldgebaseerde methoden.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Emotional Modulation in Swarm Decision Dynamics

Dit onderzoek breidt het bijenmodel voor zwermbesluitvorming uit tot een agent-gebaseerd simulatiemodel waarin emotionele valentie en opwinding interactiepatronen moduleren, waardoor zowel emotionele asymmetrieën als structurele kantelpunten de snelheid en uitkomst van collectieve consensus beïnvloeden.

David Freire-Obregón2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Deze studie toont aan dat een door een groot taalmodel aangedreven 'zichtgeleider' blinden en slechtzienden in virtuele realiteit niet alleen als hulpmiddel, maar in sociale situaties ook als metgezel wordt ervaren, wat leidt tot specifieke ontwerpaanbevelingen voor toekomstige toegankelijkheidsoplossingen.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

← Vorige Volgende →