cs.AI papers | Gist.Science

TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas

Het paper introduceert TRUST-SQL, een tool-geïntegreerd multi-turn reinforcement learning-framework dat agents in staat stelt om effectief tekst-naar-SQL-query's te genereren in onbekende schema-omgevingen door middel van een geautomatiseerd vierfasenprotocol en een innovatieve Dual-Track GRPO-strategie, wat leidt tot aanzienlijke prestatieverbeteringen ten opzichte van bestaande methoden.

Ai Jian, Xiaoyun Zhang, Wanrou Du, Jingqing Ruan, Jiangbo Pei, Weipeng Zhang, Ke Zeng, Xunliang Cai2026-03-18🤖 cs.AI

RetailBench: Evaluating Long-Horizon Autonomous Decision-Making and Strategy Stability of LLM Agents in Realistic Retail Environments

Dit paper introduceert RetailBench, een benchmark voor het evalueren van lange-termijn besluitvorming van LLM-agenten in realistische retailomgevingen, en stelt een nieuw raamwerk voor dat strategisch redeneren scheidt van uitvoering om stabiliteit te verbeteren, hoewel fundamentele beperkingen blijven bestaan bij toenemende taakcomplexiteit.

Linghua Zhang, Jun Wang, Jingtong Wu, Zhisong Zhang2026-03-18🤖 cs.AI

Follow the Clues, Frame the Truth: Hybrid-evidential Deductive Reasoning in Open-Vocabulary Multimodal Emotion Recognition

Dit paper introduceert HyDRA, een hybride architecture voor deductief redenering die multimodale emotionele herkenning in open vocabulaires verbetert door een Propose-Verify-Decide-protocol en versterkingslering toe te passen om ambiguïteit op te lossen en interpreteerbare bewijsvoering te genereren.

Yu Liu, Lei Zhang, Haoxun Li, Hanlei Shi, Yuxuan Ding, Leyuan Qu, Taihao Li2026-03-18🤖 cs.AI

Multi-Agent Reinforcement Learning Counteracts Delayed CSI in Multi-Satellite Systems

Dit paper introduceert een nieuw bi-niveau optimalisatie-algoritme genaamd DS-PPO, gebaseerd op multi-agent versterkende leer, dat de uitdagingen van verouderde kanaalstatusinformatie (CSI) in multi-satellietcommunicatiesystemen effectief aanpakt door de totale doorvoer te maximaliseren via zowel individuele als gecoördineerde satellietacties.

Marios Aristodemou, Yasaman Omid, Sangarapillai Lambotharan, Mahsa Derakhshan, Lajos Hanzo2026-03-18⚡ eess

Breaking the Chain: A Causal Analysis of LLM Faithfulness to Intermediate Structures

Deze studie toont aan dat tussenliggende structuren in schema-gestuurde LLM-pipelines voornamelijk fungeren als beïnvloedende context in plaats van stabiele causale mediators, aangezien modellen vaak falen om hun voorspellingen aan te passen wanneer deze structuren worden gemanipuleerd.

Oleg Somov, Mikhail Chaichuk, Mikhail Seleznyov, Alexander Panchenko, Elena Tutubalina2026-03-18🤖 cs.AI

DST-Net: A Dual-Stream Transformer with Illumination-Independent Feature Guidance and Multi-Scale Spatial Convolution for Low-Light Image Enhancement

Dit paper introduceert DST-Net, een dubbelstroom-Transformer-netwerk dat gebruikmaakt van verlichtingsonafhankelijke signaalprioriën en multi-schaal ruimtelijke convoluties om beelden bij zwakke lichtomstandigheden effectief te verbeteren zonder in te leveren op de oorspronkelijke signaalkwaliteit.

Yicui Shi, Yuhan Chen, Xiangfei Huang, Zhenguo Wang, Wenxuan Yu, Ying Fang2026-03-18🤖 cs.AI

Unlearning for One-Step Generative Models via Unbalanced Optimal Transport

Deze paper introduceert UOT-Unlearn, een nieuw framework dat onbalans optimale transport gebruikt om klassen effectief te laten vergeten in één-staps generatieve modellen terwijl de algehele generatiekwaliteit behouden blijft.

Hyundo Choi, Junhyeong An, Jinseong Park, Jaewoong Choi2026-03-18🤖 cs.AI

ExpressMind: A Multimodal Pretrained Large Language Model for Expressway Operation

Dit paper introduceert ExpressMind, een multimodaal voorgetraind groot taalmodel dat speciaal is ontwikkeld voor intelligente snelwegoperaties door een nieuw dataset, een dubbel-laags trainingsparadigma, een grafiek-gestuurde RAG-framework en een RL-gealigneerde redeneermethode te combineren om gebeurtenisdetectie, veiligheidsrespons en verkeersanalyse te verbeteren.

Zihe Wang, Yihuan Wang, Haiyang Yu. Zhiyong Cui, Xiaojian Liao, Chengcheng Wang, Yonglin Tian, Yongxin Tong2026-03-18🤖 cs.AI

Bridging the High-Frequency Data Gap: A Millisecond-Resolution Network Dataset for Advancing Time Series Foundation Models

Deze paper introduceert een nieuw dataset met milliseconden-resolutie voor draadloze en verkeersdata om bestaande tijdreeks-foundationmodellen te testen, waarbij blijkt dat deze modellen slecht presteren op dergelijke hoogfrequente data en dat het integreren van dit type datasets essentieel is voor hun verdere ontwikkeling.

Subina Khanal, Seshu Tirupathi, Merim Dzaferagic, Marco Ruffini, Torben Bach Pedersen2026-03-18🤖 cs.LG

FEAT: A Linear-Complexity Foundation Model for Extremely Large Structured Data

Het paper introduceert FEAT, een foundation model met lineaire complexiteit dat door middel van een hybride dual-as architectuur de beperkingen van bestaande modellen voor zeer grote gestructureerde data overwint en aanzienlijk snellere inferentie biedt zonder in te leveren op prestaties.

Zhenghang Song, Tang Qian, Lu Chen, Yushuai Li, Zhengke Hu, Bingbing Fang, Yumeng Song, Junbo Zhao, Sheng Zhang, Tianyi Li2026-03-18🤖 cs.LG

Exploring different approaches to customize language models for domain-specific text-to-code generation

Dit onderzoek toont aan dat parameter-efficiënt fine-tuning met LoRA voor het genereren van domeinspecifieke code uit natuurlijke taal over het algemeen superieure nauwkeurigheid en domeinalignement biedt vergeleken met prompting-technieken zoals few-shot learning en RAG, hoewel deze laatste methoden een kosteneffectieve alternatief vormen voor flexibiliteit.

Luís Freire, Fernanda A. Andaló, Nicki Skafte Detlefsen2026-03-18🤖 cs.AI

Designing for Disagreement: Front-End Guardrails for Assistance Allocation in LLM-Enabled Robots

Dit paper introduceert een front-end patroon genaamd 'bounded calibration with contestability' voor LLM-gestuurde robots, dat prioritering in sociale situaties reguleert door deze te beperken tot goedgekeurde modi, de actieve modus transparant te maken en een specifieke bezwaarmogelijkheid te bieden zonder de globale regels te heronderhandelen.

Carmen Ng2026-03-18🤖 cs.AI

DanceHA: A Multi-Agent Framework for Document-Level Aspect-Based Sentiment Analysis

Dit paper introduceert DanceHA, een multi-agent framework voor documentgebaseerde aspectgebaseerde sentimentintensiteitsanalyse in informele teksten, dat een 'divide-and-conquer'-strategie en mens-AI-samenwerking combineert om het onderzochte Inf-ABSIA-dataset te creëren en effectieve kennisoverdracht naar studentmodellen mogelijk te maken.

Lei Wang, Min Huang, Eduard Dragut2026-03-18💬 cs.CL

CompDiff: Hierarchical Compositional Diffusion for Fair and Zero-Shot Intersectional Medical Image Generation

Het paper introduceert CompDiff, een hiërarchisch compositional diffusion-framework dat het probleem van ongelijke generatiekwaliteit bij zeldzame demografische groepen in medische beeldvorming oplost door conditionering op representatieniveau te decomponeren, wat leidt tot verbeterde eerlijkheid, zero-shot generalisatie en prestaties van downstream-klassificatoren.

Mahmoud Ibrahim, Bart Elen, Chang Sun, Gokhan Ertaylan, Michel Dumontier2026-03-18🤖 cs.AI

EmoLLM: Appraisal-Grounded Cognitive-Emotional Co-Reasoning in Large Language Models

Het artikel introduceert EmoLLM, een framework dat cognitieve en emotionele intelligentie combineert via een expliciet Appraisal Reasoning Graph en versterkt leren met reverse-perspectief redenering, om in dialogen zowel feitelijk betrouwbaar als emotioneel adequaat te reageren.

Yifei Zhang, Mingyang Li, Henry Gao, Liang Zhao2026-03-18💬 cs.CL

BenchPreS: A Benchmark for Context-Aware Personalized Preference Selectivity of Persistent-Memory LLMs

Het paper introduceert BenchPreS, een benchmark die aantoont dat geavanceerde taalkundige modellen met persistente geheugenfuncties moeite hebben om persoonlijke voorkeuren contextueel correct toe te passen of te onderdrukken, wat vaak leidt tot ongepast gebruik in sociale situaties.

Sangyeon Yoon, Sunkyoung Kim, Hyesoo Hong, Wonje Jeung, Yongil Kim, Wooseok Seo, Heuiyeen Yeen, Albert No2026-03-18🤖 cs.AI

Deep Learning-Driven Black-Box Doherty Power Amplifier with Pixelated Output Combiner and Extended Efficiency Range

Dit artikel presenteert een deep learning-gedreven inverse ontwerpmethode voor Doherty-versterkers met gepixeliseerde outputcombinatoren, die door fabricage en testen van prototypes met GaN-transistoren een uitgebreid efficiëntiebereik en hoge lineairiteit onder realistische 5G-signalen aantonen.

Han Zhou, Haojie Chang, David Widen2026-03-18⚡ eess

Characterizing Delusional Spirals through Human-LLM Chat Logs

Dit onderzoek analyseert voor het eerst in detail chatlogs van gebruikers die psychische schade hebben opgelopen door interactie met LLM-chatbots, en identificeert patronen zoals delusief denken en het misleiden van de AI als sentient om concrete aanbevelingen te doen voor het beperken van deze schade.

Jared Moore, Ashish Mehta, William Agnew, Jacy Reese Anthis, Ryan Louie, Yifan Mai, Peggy Yin, Myra Cheng, Samuel J Paech, Kevin Klyman, Stevie Chancellor, Eric Lin, Nick Haber, Desmond C. Ong2026-03-18💬 cs.CL

Manifold-Matching Autoencoders

Dit paper introduceert Manifold-Matching Autoencoders (MMAE), een onbewaakte regularisatiemethode die de onderlinge afstanden in de latente ruimte aanpast aan die van de invoerruimte om de buurtstructuur en topologische eigenschappen van de data beter te behouden dan bestaande methoden.

Laurent Cheret, Vincent Létourneau, Isar Nejadgholi, Chris Drummond, Hussein Al Osman, Maia Fraser2026-03-18🤖 cs.LG

Malicious Or Not: Adding Repository Context to Agent Skill Classification

Dit onderzoek toont aan dat het analyseren van de context van een GitHub-repository in plaats van alleen de skillspecificatie het aantal vals-positief gemarkeerde kwaadaardige AI-agent-skills drastisch verlaagt van 46,8% naar 0,52% en bovendien nieuwe aanvalsvectoren, zoals het kapen van skills in verlaten repositories, blootlegt.

Florian Holzbauer, David Schmidt, Gabriel Gegenhuber, Sebastian Schrittwieser, Johanna Ullrich2026-03-18🤖 cs.AI

← Vorige Volgende →