TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas

Het paper introduceert TRUST-SQL, een tool-geïntegreerd multi-turn reinforcement learning-framework dat agents in staat stelt om effectief tekst-naar-SQL-query's te genereren in onbekende schema-omgevingen door middel van een geautomatiseerd vierfasenprotocol en een innovatieve Dual-Track GRPO-strategie, wat leidt tot aanzienlijke prestatieverbeteringen ten opzichte van bestaande methoden.

Ai Jian, Xiaoyun Zhang, Wanrou Du, Jingqing Ruan, Jiangbo Pei, Weipeng Zhang, Ke Zeng, Xunliang Cai2026-03-18🤖 cs.AI

RetailBench: Evaluating Long-Horizon Autonomous Decision-Making and Strategy Stability of LLM Agents in Realistic Retail Environments

Dit paper introduceert RetailBench, een benchmark voor het evalueren van lange-termijn besluitvorming van LLM-agenten in realistische retailomgevingen, en stelt een nieuw raamwerk voor dat strategisch redeneren scheidt van uitvoering om stabiliteit te verbeteren, hoewel fundamentele beperkingen blijven bestaan bij toenemende taakcomplexiteit.

Linghua Zhang, Jun Wang, Jingtong Wu, Zhisong Zhang2026-03-18🤖 cs.AI

Follow the Clues, Frame the Truth: Hybrid-evidential Deductive Reasoning in Open-Vocabulary Multimodal Emotion Recognition

Dit paper introduceert HyDRA, een hybride architecture voor deductief redenering die multimodale emotionele herkenning in open vocabulaires verbetert door een Propose-Verify-Decide-protocol en versterkingslering toe te passen om ambiguïteit op te lossen en interpreteerbare bewijsvoering te genereren.

Yu Liu, Lei Zhang, Haoxun Li, Hanlei Shi, Yuxuan Ding, Leyuan Qu, Taihao Li2026-03-18🤖 cs.AI

Multi-Agent Reinforcement Learning Counteracts Delayed CSI in Multi-Satellite Systems

Dit paper introduceert een nieuw bi-niveau optimalisatie-algoritme genaamd DS-PPO, gebaseerd op multi-agent versterkende leer, dat de uitdagingen van verouderde kanaalstatusinformatie (CSI) in multi-satellietcommunicatiesystemen effectief aanpakt door de totale doorvoer te maximaliseren via zowel individuele als gecoördineerde satellietacties.

Marios Aristodemou, Yasaman Omid, Sangarapillai Lambotharan, Mahsa Derakhshan, Lajos Hanzo2026-03-18⚡ eess

DST-Net: A Dual-Stream Transformer with Illumination-Independent Feature Guidance and Multi-Scale Spatial Convolution for Low-Light Image Enhancement

Dit paper introduceert DST-Net, een dubbelstroom-Transformer-netwerk dat gebruikmaakt van verlichtingsonafhankelijke signaalprioriën en multi-schaal ruimtelijke convoluties om beelden bij zwakke lichtomstandigheden effectief te verbeteren zonder in te leveren op de oorspronkelijke signaalkwaliteit.

Yicui Shi, Yuhan Chen, Xiangfei Huang, Zhenguo Wang, Wenxuan Yu, Ying Fang2026-03-18🤖 cs.AI

ExpressMind: A Multimodal Pretrained Large Language Model for Expressway Operation

Dit paper introduceert ExpressMind, een multimodaal voorgetraind groot taalmodel dat speciaal is ontwikkeld voor intelligente snelwegoperaties door een nieuw dataset, een dubbel-laags trainingsparadigma, een grafiek-gestuurde RAG-framework en een RL-gealigneerde redeneermethode te combineren om gebeurtenisdetectie, veiligheidsrespons en verkeersanalyse te verbeteren.

Zihe Wang, Yihuan Wang, Haiyang Yu. Zhiyong Cui, Xiaojian Liao, Chengcheng Wang, Yonglin Tian, Yongxin Tong2026-03-18🤖 cs.AI

Bridging the High-Frequency Data Gap: A Millisecond-Resolution Network Dataset for Advancing Time Series Foundation Models

Deze paper introduceert een nieuw dataset met milliseconden-resolutie voor draadloze en verkeersdata om bestaande tijdreeks-foundationmodellen te testen, waarbij blijkt dat deze modellen slecht presteren op dergelijke hoogfrequente data en dat het integreren van dit type datasets essentieel is voor hun verdere ontwikkeling.

Subina Khanal, Seshu Tirupathi, Merim Dzaferagic, Marco Ruffini, Torben Bach Pedersen2026-03-18🤖 cs.LG

FEAT: A Linear-Complexity Foundation Model for Extremely Large Structured Data

Het paper introduceert FEAT, een foundation model met lineaire complexiteit dat door middel van een hybride dual-as architectuur de beperkingen van bestaande modellen voor zeer grote gestructureerde data overwint en aanzienlijk snellere inferentie biedt zonder in te leveren op prestaties.

Zhenghang Song, Tang Qian, Lu Chen, Yushuai Li, Zhengke Hu, Bingbing Fang, Yumeng Song, Junbo Zhao, Sheng Zhang, Tianyi Li2026-03-18🤖 cs.LG

Exploring different approaches to customize language models for domain-specific text-to-code generation

Dit onderzoek toont aan dat parameter-efficiënt fine-tuning met LoRA voor het genereren van domeinspecifieke code uit natuurlijke taal over het algemeen superieure nauwkeurigheid en domeinalignement biedt vergeleken met prompting-technieken zoals few-shot learning en RAG, hoewel deze laatste methoden een kosteneffectieve alternatief vormen voor flexibiliteit.

Luís Freire, Fernanda A. Andaló, Nicki Skafte Detlefsen2026-03-18🤖 cs.AI

CompDiff: Hierarchical Compositional Diffusion for Fair and Zero-Shot Intersectional Medical Image Generation

Het paper introduceert CompDiff, een hiërarchisch compositional diffusion-framework dat het probleem van ongelijke generatiekwaliteit bij zeldzame demografische groepen in medische beeldvorming oplost door conditionering op representatieniveau te decomponeren, wat leidt tot verbeterde eerlijkheid, zero-shot generalisatie en prestaties van downstream-klassificatoren.

Mahmoud Ibrahim, Bart Elen, Chang Sun, Gokhan Ertaylan, Michel Dumontier2026-03-18🤖 cs.AI

BenchPreS: A Benchmark for Context-Aware Personalized Preference Selectivity of Persistent-Memory LLMs

Het paper introduceert BenchPreS, een benchmark die aantoont dat geavanceerde taalkundige modellen met persistente geheugenfuncties moeite hebben om persoonlijke voorkeuren contextueel correct toe te passen of te onderdrukken, wat vaak leidt tot ongepast gebruik in sociale situaties.

Sangyeon Yoon, Sunkyoung Kim, Hyesoo Hong, Wonje Jeung, Yongil Kim, Wooseok Seo, Heuiyeen Yeen, Albert No2026-03-18🤖 cs.AI

Characterizing Delusional Spirals through Human-LLM Chat Logs

Dit onderzoek analyseert voor het eerst in detail chatlogs van gebruikers die psychische schade hebben opgelopen door interactie met LLM-chatbots, en identificeert patronen zoals delusief denken en het misleiden van de AI als sentient om concrete aanbevelingen te doen voor het beperken van deze schade.

Jared Moore, Ashish Mehta, William Agnew, Jacy Reese Anthis, Ryan Louie, Yifan Mai, Peggy Yin, Myra Cheng, Samuel J Paech, Kevin Klyman, Stevie Chancellor, Eric Lin, Nick Haber, Desmond C. Ong2026-03-18💬 cs.CL

Malicious Or Not: Adding Repository Context to Agent Skill Classification

Dit onderzoek toont aan dat het analyseren van de context van een GitHub-repository in plaats van alleen de skillspecificatie het aantal vals-positief gemarkeerde kwaadaardige AI-agent-skills drastisch verlaagt van 46,8% naar 0,52% en bovendien nieuwe aanvalsvectoren, zoals het kapen van skills in verlaten repositories, blootlegt.

Florian Holzbauer, David Schmidt, Gabriel Gegenhuber, Sebastian Schrittwieser, Johanna Ullrich2026-03-18🤖 cs.AI