cs.AI papers | Gist.Science

Information Capacity: Evaluating the Efficiency of Large Language Models via Text Compression

Dit paper introduceert 'information capacity', een nieuwe metriek die de inferentie-efficiëntie van grote taalmodellen kwantificeert door tekstcompressieprestaties te relateren aan rekencomplexiteit en tokeniseer-efficiëntie, waardoor inzicht wordt verkregen in de schaalbaarheid en linguïstische bias van diverse modellen.

Cheng Yuan, Jiawei Shao, Xuelong Li2026-03-11💬 cs.CL

Lightweight Time Series Data Valuation on Time Series Foundation Models via In-Context Finetuning

Dit artikel introduceert LTSV, een lichtgewicht methode voor het waarderen van tijdreeksdata in foundationmodellen via in-context finetuning en temporele blokkenaggregatie, die een nauwkeurige en schaalbare oplossing biedt voor de beperkingen van traditionele datawaarderingstechnieken.

Shunyu Wu, Tianyue Li, Yixuan Leng, Jingyi Suo, Jian Lou, Dan Li, See-Kiong Ng2026-03-11🤖 cs.AI

MediRound: Multi-Round Entity-Level Reasoning Segmentation in Medical Images

Dit paper introduceert MediRound, een model en dataset voor multi-rond medische segmentatie met entiteitsgebaseerd redenering, dat foutenpropagatie aanpakt en beter presteert dan bestaande methoden in medische educatieve scenario's.

Qinyue Tong, Ziqian Lu, Jun Liu, Rui Zuo, Zheming Lu2026-03-11🤖 cs.AI

TSFM in-context learning for time-series classification of bearing-health status

Deze paper introduceert een methode voor het classificeren van de gezondheidstoestand van lagers op basis van in-context learning met tijdreeks-fundamentmodellen, waardoor vibratiegegevens zonder fijnafstemming kunnen worden geanalyseerd en de weg vrijmaken voor schaalbare AI-onderhoudssystemen.

Michel Tokic, Slobodan Djukanovic, Anja von Beuningen, Cheng Feng2026-03-11🤖 cs.AI

Research and Prototyping Study of an LLM-Based Chatbot for Electromagnetic Simulations

Dit onderzoek presenteert een op een groot taalmodel (Google Gemini 2.0 Flash) gebaseerde chatbot die de opzet en uitvoering van tweedimensionale elektromagnetische simulaties met Gmsh en GetDP automatiseert, waardoor de tijdsinvestering voor het modelleren van geleiders met variabele geometrieën en aangepaste post-processing aanzienlijk wordt gereduceerd.

Albert Piwonski, Mirsad Hadžiefendic2026-03-11🤖 cs.AI

Mitigating Long-Tail Bias in HOI Detection via Adaptive Diversity Cache

Deze paper introduceert de Adaptive Diversity Cache (ADC), een trainingsvrije en plug-and-play module die de langstaartbias in mens-objectinteractie-detectie vermindert door tijdens de inferentie adaptieve, diverse kenmerken op te slaan, waardoor zeldzame interacties op de HICO-DET en V-COCO-datasets aanzienlijk worden verbeterd zonder extra rekencapaciteit.

Yuqiu Jiang, Xiaozhen Qiao, Yifan Chen, Ye Zheng, Zhe Sun, Xuelong Li2026-03-11🤖 cs.AI

Periodic Asynchrony: An On-Policy Approach for Accelerating LLM Reinforcement Learning

Dit artikel introduceert een periodiek asynchrone, on-policy framework voor LLM-versterkingsleer dat door het scheiden van inferentie en training een drievoudige tot vijfvoudige toename in doorvoersnelheid bereikt zonder de nauwkeurigheid te beïnvloeden.

Jian Lu2026-03-11🤖 cs.AI

When Robots Obey the Patch: Universal Transferable Patch Attacks on Vision-Language-Action Models

Dit artikel introduceert UPA-RFAS, een uniek raamwerk voor universele en overdraagbare adversariële patch-aanvallen op Vision-Language-Action-modellen die effectief zijn over verschillende architecturen, taken en fysieke uitvoeringen heen.

Hui Lu, Yi Yu, Yiming Yang, Chenyu Yi, Qixin Zhang, Bingquan Shen, Alex C. Kot, Xudong Jiang2026-03-11🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Deze paper introduceert een robuust multi-agent reinforcement learning-framework dat communicatiebeperkingen als leerprioriteit gebruikt om de impact van verliesvolle en verliesvrije berichten op gedecentraliseerde besluitvorming te kwantificeren en te optimaliseren in complexe, dynamische omgevingen.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang Gao2026-03-11🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

Dit artikel introduceert ELERAG, een verbeterde Retrieval-Augmented Generation-architectuur die Entiteitenkoppeling integreert om de feitelijke nauwkeurigheid van educatieve vraag-antwoordsystemen in het Italiaans te verhogen, waarbij experimenten aantonen dat deze domeinspecifieke aanpak de prestaties van standaardmodellen overtreft in gespecialiseerde contexten.

Francesco Granata, Francesco Poggi, Misael Mongiovì2026-03-11🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

Dit paper introduceert EMFusion, een conditioneel diffusiemodel dat betrouwbare, frequentieselectieve probabilistische voorspellingen van elektromagnetische velden in draadloze netwerken mogelijk maakt door diverse contextfactoren te integreren en expliciete onzekerheidsschattingen te bieden.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca Chiaraviglio2026-03-11🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

Dit onderzoek toont aan dat een zorgvuldig gefinetuned Small Language Model (OPT-350M) door middel van één epoch supervised fine-tuning de prestaties van grote taalmodellen overtreft bij agentic tool-calling, met een opmerkelijke 77,55% slagingskans op de ToolBench-evaluatie.

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel Sendas2026-03-11🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

Dit artikel introduceert SAGE, een versterkingsleerframework dat agents via een geautomatiseerde vaardigheidsbibliotheek en sequentiële rollouts in staat stelt om zichzelf te verbeteren, wat resulteert in aanzienlijk betere prestaties, minder interactiestappen en een lagere token-gebruik in vergelijking met bestaande methoden.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee Cheong2026-03-11🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

Dit paper introduceert MCGI, een geometrie-bewuste, schijf-residente indexeringsmethode die lokale intrinsieke dimensie gebruikt om de zoekstrategie dynamisch aan te passen aan de onderliggende data-manifold, waardoor de prestaties van billion-scale vectorzoekopdrachten aanzienlijk worden verbeterd ten opzichte van bestaande methoden zoals DiskANN.

Dongfang Zhao2026-03-11🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

Dit paper introduceert CRANE, een nieuw raamwerk dat taal-specifieke neuronen in meertalige grote taalmodellen identificeert op basis van functionele noodzaak door gerichte interventies, waardoor deze methoden nauwkeuriger zijn dan eerdere op activatie gebaseerde benaderingen.

Yifan Le, Yunliang Li2026-03-11🤖 cs.AI

An AI-powered Bayesian Generative Modeling Approach for Arbitrary Conditional Inference

Dit paper introduceert Bayesian Generative Modeling (BGM), een unificerend AI-framework dat via een stochastisch iteratief Bayesiaans update-algoritme een enkel generatief model leert voor willekeurige conditionele inferentie met principieel onzekerheidskwantificering, zonder dat hertraining nodig is voor verschillende conditioneringsstructuren.

Qiao Liu, Wing Hung Wong2026-03-11🤖 cs.AI

Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

Dit paper introduceert SpaceHMchat, een open-source mens-AI samenwerkingsframework dat de gezondheidsbeheer van ruimtevaartuigstroomsystemen in het tijdperk van mega-constellaties transformeert door een volledig geautomatiseerde cyclus van storingsdetectie tot onderhoudsbeslissingen te ondersteunen, wat wordt gevalideerd door een nieuw hardware-realistisch testplatform en het eerste openbare dataset voor dit domein.

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng Chen2026-03-11🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

Het paper introduceert CLEAR-Mamba, een geoptimaliseerd raamwerk dat hypernetwerk-gebaseerde adaptieve conditionering en betrouwbaarheidsbewuste voorspelling combineert om de nauwkeurigheid, generalisatie en betrouwbaarheid van de classificatie van oogangiografie-beelden (FFA en ICGA) te verbeteren.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

Dit artikel introduceert een systeem dat gebruikmaakt van LLM-gestuurde webresearchagents om automatisch en in grote schaal diverse, realistische voorspellingsvragen te genereren en op te lossen, waarmee de kwaliteit van AI-voorspellers wordt geëvalueerd en verbeterd.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan Schwarz2026-03-11🤖 cs.AI

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

Deze paper introduceert EigenData, een unificerend framework dat een zelf-evoluerend data-agent combineert met verifieerbaar-beloond versterkend leren om schaalbaar en efficiënt complexe multi-turn tool-gebruikende agenten te trainen zonder dure menselijke annotatie.

Jiaxuan Gao, Jiaao Chen, Chuyi He, Shusheng Xu, Di Jin, Yi Wu2026-03-11🤖 cs.AI

← Vorige Volgende →