Age Predictors Through the Lens of Generalization, Bias Mitigation, and Interpretability: Reflections on Causal Implications

Dit artikel onderzoekt hoe het leren van invariante representaties met betrekking tot exogene attributen zoals ras en geslacht de generalisatie van leeftijdsvoorspellers verbetert, bias vermindert en interpretatie mogelijk maakt via een op adversariaal leren gebaseerd neuronaal netwerk, terwijl het ook de beperkingen van causale conclusies uit puur voorspellende modellen benadrukt.

Debdas Paul, Elisa Ferrari, Irene Gravili, Alessandro Cellerino2026-03-18🤖 cs.LG

Who Benchmarks the Benchmarks? A Case Study of LLM Evaluation in Icelandic

Dit artikel analyseert de tekortkomingen van bestaande benchmarks voor het IJslands, waarbij het waarschuwt dat ongeverifieerde synthetische of machinaal vertaalde data de resultaten kan vertekenen, en pleit voor betere evaluatiemethoden voor talen met een beperkte of gemiddelde hoeveelheid data.

Finnur Ágúst Ingimundarson, Steinunn Rut Fri{\dh}riksdóttir, Bjarki Ármannsson, Iris Edda Nowenstein, Stein{\th}ór Steingrímsson2026-03-18💬 cs.CL

LenghuSky-8: An 8-Year All-Sky Cloud Dataset with Star-Aware Masks and Alt-Az Calibration for Segmentation and Nowcasting

Dit artikel introduceert LenghuSky-8, een uitgebreide achtjarige all-sky dataset met sterbewuste maskers en nauwkeurige alt-azimuth-calibratie die wordt gebruikt voor geavanceerde wolkensegmentatie en een benchmark voor korte-termijn weersvoorspelling ter ondersteuning van autonome astronomische observatoria.

Yicheng Rui, Xiao-Wei Duan, Licai Deng, Fan Yang, Zhengming Dang, Zhengjun Du, Junhao Peng, Wenhao Chu, Umut Mahmut, Kexin Li, Yiyun Wu, Fabo Feng2026-03-18🔭 astro-ph

EngGPT2: Sovereign, Efficient and Open Intelligence

EngGPT2-16B-A3B is een nieuw, open-source Mixture-of-Experts taalmodel dat door zijn efficiënte architectuur en sterke Italiaanse vaardigheden een kosteneffectief en EU-wetgeving-conform alternatief biedt voor grotere modellen.

G. Ciarfaglia, A. Rosanova, S. Cipolla, J. Bartoli, A. Di Domenico, C. Fioroni, A. Fontana, M. R. Scoleri, M. I. Mone, D. Franchi, M. C. Del Gaudio, F. Picariello, M. Gabusi, S. Bonura, V. Morreale, I. Bailo2026-03-18💬 cs.CL

TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas

Het paper introduceert TRUST-SQL, een tool-geïntegreerd multi-turn reinforcement learning-framework dat agents in staat stelt om effectief tekst-naar-SQL-query's te genereren in onbekende schema-omgevingen door middel van een geautomatiseerd vierfasenprotocol en een innovatieve Dual-Track GRPO-strategie, wat leidt tot aanzienlijke prestatieverbeteringen ten opzichte van bestaande methoden.

Ai Jian, Xiaoyun Zhang, Wanrou Du, Jingqing Ruan, Jiangbo Pei, Weipeng Zhang, Ke Zeng, Xunliang Cai2026-03-18🤖 cs.AI

RetailBench: Evaluating Long-Horizon Autonomous Decision-Making and Strategy Stability of LLM Agents in Realistic Retail Environments

Dit paper introduceert RetailBench, een benchmark voor het evalueren van lange-termijn besluitvorming van LLM-agenten in realistische retailomgevingen, en stelt een nieuw raamwerk voor dat strategisch redeneren scheidt van uitvoering om stabiliteit te verbeteren, hoewel fundamentele beperkingen blijven bestaan bij toenemende taakcomplexiteit.

Linghua Zhang, Jun Wang, Jingtong Wu, Zhisong Zhang2026-03-18🤖 cs.AI

Follow the Clues, Frame the Truth: Hybrid-evidential Deductive Reasoning in Open-Vocabulary Multimodal Emotion Recognition

Dit paper introduceert HyDRA, een hybride architecture voor deductief redenering die multimodale emotionele herkenning in open vocabulaires verbetert door een Propose-Verify-Decide-protocol en versterkingslering toe te passen om ambiguïteit op te lossen en interpreteerbare bewijsvoering te genereren.

Yu Liu, Lei Zhang, Haoxun Li, Hanlei Shi, Yuxuan Ding, Leyuan Qu, Taihao Li2026-03-18🤖 cs.AI

Multi-Agent Reinforcement Learning Counteracts Delayed CSI in Multi-Satellite Systems

Dit paper introduceert een nieuw bi-niveau optimalisatie-algoritme genaamd DS-PPO, gebaseerd op multi-agent versterkende leer, dat de uitdagingen van verouderde kanaalstatusinformatie (CSI) in multi-satellietcommunicatiesystemen effectief aanpakt door de totale doorvoer te maximaliseren via zowel individuele als gecoördineerde satellietacties.

Marios Aristodemou, Yasaman Omid, Sangarapillai Lambotharan, Mahsa Derakhshan, Lajos Hanzo2026-03-18⚡ eess

DST-Net: A Dual-Stream Transformer with Illumination-Independent Feature Guidance and Multi-Scale Spatial Convolution for Low-Light Image Enhancement

Dit paper introduceert DST-Net, een dubbelstroom-Transformer-netwerk dat gebruikmaakt van verlichtingsonafhankelijke signaalprioriën en multi-schaal ruimtelijke convoluties om beelden bij zwakke lichtomstandigheden effectief te verbeteren zonder in te leveren op de oorspronkelijke signaalkwaliteit.

Yicui Shi, Yuhan Chen, Xiangfei Huang, Zhenguo Wang, Wenxuan Yu, Ying Fang2026-03-18🤖 cs.AI