cs.AI papers | Gist.Science

Age Predictors Through the Lens of Generalization, Bias Mitigation, and Interpretability: Reflections on Causal Implications

Dit artikel onderzoekt hoe het leren van invariante representaties met betrekking tot exogene attributen zoals ras en geslacht de generalisatie van leeftijdsvoorspellers verbetert, bias vermindert en interpretatie mogelijk maakt via een op adversariaal leren gebaseerd neuronaal netwerk, terwijl het ook de beperkingen van causale conclusies uit puur voorspellende modellen benadrukt.

Debdas Paul, Elisa Ferrari, Irene Gravili, Alessandro Cellerino2026-03-18🤖 cs.LG

Robust Physics-Guided Diffusion for Full-Waveform Inversion

Deze paper introduceert een robuust, door de fysica geleid diffusiemodel voor full-waveform inversion dat een score-gebaseerde generatieve prior combineert met een op de watervergelijking gebaseerde waarschijnlijkheidsgeleiding en een voorafgeconditioneerde reverse-diffusie-scheme om de reconstructiekwaliteit te verbeteren ten opzichte van bestaande methoden.

Jishen Peng, Enze Jiang, Zheng Ma, Xiongbin Yan2026-03-18🔢 math

Who Benchmarks the Benchmarks? A Case Study of LLM Evaluation in Icelandic

Dit artikel analyseert de tekortkomingen van bestaande benchmarks voor het IJslands, waarbij het waarschuwt dat ongeverifieerde synthetische of machinaal vertaalde data de resultaten kan vertekenen, en pleit voor betere evaluatiemethoden voor talen met een beperkte of gemiddelde hoeveelheid data.

Finnur Ágúst Ingimundarson, Steinunn Rut Fri{\dh}riksdóttir, Bjarki Ármannsson, Iris Edda Nowenstein, Stein{\th}ór Steingrímsson2026-03-18💬 cs.CL

PlotTwist: A Creative Plot Generation Framework with Small Language Models

Het paper introduceert PlotTwist, een gestructureerd raamwerk dat kleine taalmodellen (≤5B parameters) via een combinatie van een beloningsmodel, een MoE-generator en een agentische evaluatie in staat stelt om hoogwaardige, voorkeur-gealigneerde verhaallijnen te genereren die concurreren met veel grotere frontier-modellen.

Abhinav Thorat, Ravi Kolla, Jyotin Goel, Niranjan Pedanekar2026-03-18💬 cs.CL

Trained Persistent Memory for Frozen Encoder--Decoder LLMs: Six Architectural Methods

Dit paper presenteert een proof-of-concept studie die aantoont dat het mogelijk is om een persistente, continue latent-memorybank te trainen voor een bevroren encoder-decoder LLM via zes architecturale methoden, waardoor conversatie-leren mogelijk wordt zonder de achterliggende modelparameters aan te passen.

Hong Jeong2026-03-18🤖 cs.LG

IndexRAG: Bridging Facts for Cross-Document Reasoning at Index Time

IndexRAG is een nieuwe aanpak die cross-document redenering voor meerstaps-vraagbeantwoording verplaatst van online inferentie naar offline indexering door bruggende feiten te genereren, waardoor prestaties op meerdere benchmarks aanzienlijk verbeteren zonder extra training of complexe grafische structuren.

Zhenghua Bao, Yi Shi2026-03-18💬 cs.CL

Via Negativa for AI Alignment: Why Negative Constraints Are Structurally Superior to Positive Preferences

Dit paper stelt dat negatieve beperkingen structureel superieur zijn aan positieve voorkeuren voor AI-uitlijning, omdat ze discrete, verifieerbare grenzen definiëren die het sycophantische gedrag voorkomen dat ontstaat bij het leren van continu gekoppelde menselijke waarden.

Quan Cheng2026-03-18🤖 cs.AI

SF-Mamba: Rethinking State Space Model for Vision

Het paper introduceert SF-Mamba, een nieuw visueel Mamba-model dat door middel van hulpstuk-uitwisseling en batch-vouwen de beperkingen van eerdere scanstrategieën overwint en zo superieure prestaties en doorvoer boekt ten opzichte van de state-of-the-art baselines.

Masakazu Yoshimura, Teruaki Hayashi, Yuki Hoshino, Wei-Yao Wang, Takeshi Ohashi2026-03-18🤖 cs.AI

An Efficient Heterogeneous Co-Design for Fine-Tuning on a Single GPU

SlideFormer is een innovatief systeem dat door middel van een lichtgewicht asynchrone engine, efficiënt heterogeen geheugenbeheer en geoptimaliseerde Triton-kernen het fijnafstemmen van zeer grote taalmodellen (tot 123B+ parameters) op één enkele GPU mogelijk maakt met aanzienlijk hogere doorvoer en verminderd geheugengebruik.

Ruijia Yang, Zeyi Wen2026-03-18🤖 cs.AI

LenghuSky-8: An 8-Year All-Sky Cloud Dataset with Star-Aware Masks and Alt-Az Calibration for Segmentation and Nowcasting

Dit artikel introduceert LenghuSky-8, een uitgebreide achtjarige all-sky dataset met sterbewuste maskers en nauwkeurige alt-azimuth-calibratie die wordt gebruikt voor geavanceerde wolkensegmentatie en een benchmark voor korte-termijn weersvoorspelling ter ondersteuning van autonome astronomische observatoria.

Yicheng Rui, Xiao-Wei Duan, Licai Deng, Fan Yang, Zhengming Dang, Zhengjun Du, Junhao Peng, Wenhao Chu, Umut Mahmut, Kexin Li, Yiyun Wu, Fabo Feng2026-03-18🔭 astro-ph

EngGPT2: Sovereign, Efficient and Open Intelligence

EngGPT2-16B-A3B is een nieuw, open-source Mixture-of-Experts taalmodel dat door zijn efficiënte architectuur en sterke Italiaanse vaardigheden een kosteneffectief en EU-wetgeving-conform alternatief biedt voor grotere modellen.

G. Ciarfaglia, A. Rosanova, S. Cipolla, J. Bartoli, A. Di Domenico, C. Fioroni, A. Fontana, M. R. Scoleri, M. I. Mone, D. Franchi, M. C. Del Gaudio, F. Picariello, M. Gabusi, S. Bonura, V. Morreale, I. Bailo2026-03-18💬 cs.CL

From Natural Language to Executable Option Strategies via Large Language Models

Dit paper introduceert OQL, een domeinspecifieke tussenrepresentatie die grote taalmodellen in staat stelt om natuurlijke taalhandelintenties betrouwbaar om te zetten in uitvoerbare optiestrategieën via een neuro-symbolische pijplijn, waardoor de nauwkeurigheid en logische consistentie aanzienlijk worden verbeterd.

Haochen Luo, Zhengzhao Lai, Junjie Xu, Yifan Li, Tang Pok Hin, Yuan Zhang, Chen Liu2026-03-18💰 q-fin

CD-FKD: Cross-Domain Feature Knowledge Distillation for Robust Single-Domain Generalization in Object Detection

Dit paper introduceert CD-FKD, een methode voor cross-domein feature knowledge distillation die de generalisatie en robuustheid van objectdetectie verbetert in ongeziene domeinen door een studentnetwerk te trainen met gevarieerde, gecorrumpeerde data dat de features van een teachernetwerk nabootst.

Junseok Lee, Sungho Shin, Seongju Lee, Kyoobin Lee2026-03-18🤖 cs.AI

Visual Distraction Undermines Moral Reasoning in Vision-Language Models

Deze studie toont aan dat visuele input de morele redenering van geavanceerde Vision-Language Models fundamenteel verstoort en tekstgebaseerde veiligheidsmechanismen omzeilt, wat de dringende noodzaak benadrukt voor multimodale veiligheidsaanpassing.

Xinyi Yang, Chenheng Xu, Weijun Hong, Ce Mo, Qian Wang, Fang Fang, Yixin Zhu2026-03-18🤖 cs.AI

TRUST-SQL: Tool-Integrated Multi-Turn Reinforcement Learning for Text-to-SQL over Unknown Schemas

Het paper introduceert TRUST-SQL, een tool-geïntegreerd multi-turn reinforcement learning-framework dat agents in staat stelt om effectief tekst-naar-SQL-query's te genereren in onbekende schema-omgevingen door middel van een geautomatiseerd vierfasenprotocol en een innovatieve Dual-Track GRPO-strategie, wat leidt tot aanzienlijke prestatieverbeteringen ten opzichte van bestaande methoden.

Ai Jian, Xiaoyun Zhang, Wanrou Du, Jingqing Ruan, Jiangbo Pei, Weipeng Zhang, Ke Zeng, Xunliang Cai2026-03-18🤖 cs.AI

RetailBench: Evaluating Long-Horizon Autonomous Decision-Making and Strategy Stability of LLM Agents in Realistic Retail Environments

Dit paper introduceert RetailBench, een benchmark voor het evalueren van lange-termijn besluitvorming van LLM-agenten in realistische retailomgevingen, en stelt een nieuw raamwerk voor dat strategisch redeneren scheidt van uitvoering om stabiliteit te verbeteren, hoewel fundamentele beperkingen blijven bestaan bij toenemende taakcomplexiteit.

Linghua Zhang, Jun Wang, Jingtong Wu, Zhisong Zhang2026-03-18🤖 cs.AI

Follow the Clues, Frame the Truth: Hybrid-evidential Deductive Reasoning in Open-Vocabulary Multimodal Emotion Recognition

Dit paper introduceert HyDRA, een hybride architecture voor deductief redenering die multimodale emotionele herkenning in open vocabulaires verbetert door een Propose-Verify-Decide-protocol en versterkingslering toe te passen om ambiguïteit op te lossen en interpreteerbare bewijsvoering te genereren.

Yu Liu, Lei Zhang, Haoxun Li, Hanlei Shi, Yuxuan Ding, Leyuan Qu, Taihao Li2026-03-18🤖 cs.AI

Multi-Agent Reinforcement Learning Counteracts Delayed CSI in Multi-Satellite Systems

Dit paper introduceert een nieuw bi-niveau optimalisatie-algoritme genaamd DS-PPO, gebaseerd op multi-agent versterkende leer, dat de uitdagingen van verouderde kanaalstatusinformatie (CSI) in multi-satellietcommunicatiesystemen effectief aanpakt door de totale doorvoer te maximaliseren via zowel individuele als gecoördineerde satellietacties.

Marios Aristodemou, Yasaman Omid, Sangarapillai Lambotharan, Mahsa Derakhshan, Lajos Hanzo2026-03-18⚡ eess

Breaking the Chain: A Causal Analysis of LLM Faithfulness to Intermediate Structures

Deze studie toont aan dat tussenliggende structuren in schema-gestuurde LLM-pipelines voornamelijk fungeren als beïnvloedende context in plaats van stabiele causale mediators, aangezien modellen vaak falen om hun voorspellingen aan te passen wanneer deze structuren worden gemanipuleerd.

Oleg Somov, Mikhail Chaichuk, Mikhail Seleznyov, Alexander Panchenko, Elena Tutubalina2026-03-18🤖 cs.AI

DST-Net: A Dual-Stream Transformer with Illumination-Independent Feature Guidance and Multi-Scale Spatial Convolution for Low-Light Image Enhancement

Dit paper introduceert DST-Net, een dubbelstroom-Transformer-netwerk dat gebruikmaakt van verlichtingsonafhankelijke signaalprioriën en multi-schaal ruimtelijke convoluties om beelden bij zwakke lichtomstandigheden effectief te verbeteren zonder in te leveren op de oorspronkelijke signaalkwaliteit.

Yicui Shi, Yuhan Chen, Xiangfei Huang, Zhenguo Wang, Wenxuan Yu, Ying Fang2026-03-18🤖 cs.AI

← Vorige Volgende →