cs.AI papers | Gist.Science

ASDA: Automated Skill Distillation and Adaptation for Financial Reasoning

Dit paper introduceert ASDA, een trainingsvrij kader dat door middel van iteratief leerproces gestructureerde vaardigheidsartefacten genereert om grote taalmodellen zonder gewichts-aanpassing effectief te laten aanpassen aan complexe financiële redeneertaken, wat aanzienlijk betere resultaten oplevert dan bestaande methoden.

Tik Yu Yim, Wenting Tan, Sum Yee Chan, Tak-Wah Lam, Siu Ming Yiu2026-03-18💬 cs.CL

PathGLS: Evaluating Pathology Vision-Language Models without Ground Truth through Multi-Dimensional Consistency

Het artikel introduceert PathGLS, een referentievrij evaluatiekader dat pathologie Vision-Language-modellen beoordeelt op gronding, logica en stabiliteit om hallucinaties te detecteren en een betrouwbaarheidscore te genereren zonder gebruik te maken van grondwahrheid.

Minbing Chen, Zhu Meng, Fei Su2026-03-18🤖 cs.AI

Functorial Neural Architectures from Higher Inductive Types

Dit paper toont aan dat compositional generalisatie in neurale netwerken kan worden gegarandeerd door decoderarchitecturen te construeren als strikte monoidale functors afgeleid van Higher Inductive Types, wat leidt tot aanzienlijk betere prestaties dan bestaande methoden zoals self-attention.

Karen Sargsyan2026-03-18🤖 cs.LG

SWE-QA-Pro: A Representative Benchmark and Scalable Training Recipe for Repository-Level Code Understanding

Dit paper introduceert SWE-QA-Pro, een robuust benchmark voor repository-level codebegrip dat gebaseerd is op diverse, lange-staart repositories, en presenteert een schaalbaar trainingsrecept met synthetische data dat kleine open modellen in staat stelt om concurrentie aan te gaan met geavanceerde proprietary modellen.

Songcheng Cai, Zhiheng Lyu, Yuansheng Ni, Xiangchao Chen, Baichuan Zhou, Shenzhe Zhu, Yi Lu, Haozhe Wang, Chi Ruan, Benjamin Schneider, Weixu Zhang, Xiang Li, Andy Zheng, Yuyu Zhang, Ping Nie, Wenhu Chen2026-03-18💬 cs.CL

When Generative Augmentation Hurts: A Benchmark Study of GAN and Diffusion Models for Bias Correction in AI Classification Systems

Deze studie toont aan dat generatieve augmentatie met FastGAN bij zeer beperkte datasets de classifier-bias juist verergert door mode collapse, terwijl Stable Diffusion met LoRA de bias effectief verlaagt en de beste prestaties levert.

Shesh Narayan Gupta, Nik Bear Brown2026-03-18🤖 cs.LG

Structure-Aware Multimodal LLM Framework for Trustworthy Near-Field Beam Prediction

Deze paper presenteert een door een groot taalmodel (LLM) aangedreven multimodaal raamwerk dat historische GPS-data, RGB-afbeeldingen en LiDAR-data combineert om betrouwbare straalvoorspelling in complexe near-field XL-MIMO-systemen te realiseren door middel van geavanceerd ruimtelijk redeneren.

Mengyuan Li, Qianfan Lu, Jiachen Tian, Hongjun Hu, Yu Han, Xiao Li, Chao-kai Wen, Shi Jin2026-03-18⚡ eess

NeuronSpark: A Spiking Neural Network Language Model with Selective State Space Dynamics

Het paper introduceert NeuronSpark, een 0,9B-parameter spiking neural network taalmodel dat aantoont dat end-to-end taalmodellering zonder Transformer-distillatie haalbaar is door een combinatie van selectieve state-space dynamica, adaptieve tijdstappen en stabilisatietechnieken.

Zhengzheng Tang2026-03-18🤖 cs.AI

HIPO: Instruction Hierarchy via Constrained Reinforcement Learning

Dit paper introduceert HIPO, een nieuw uitlijningskader dat hiërarchische instructieopvolging aanpakt door systemprompt-compliance om te vormen tot een strikte algoritmische beperking binnen een Constrained Markov Decision Process, waardoor modellen zowel systeminstructies nauwkeuriger volgen als de nuttigheid voor de gebruiker maximaliseren.

Keru Chen, Jun Luo, Sen Lin, Yingbin Liang, Alvaro Velasquez, Nathaniel Bastian, Shaofeng Zou2026-03-18🤖 cs.LG

GATS: Gaussian Aware Temporal Scaling Transformer for Invariant 4D Spatio-Temporal Point Cloud Representation

Dit artikel introduceert GATS, een nieuw dubbel invariant framework dat door middel van Uncertainty Guided Gaussian Convolution en Temporal Scaling Attention robuuste 4D ruimtetijd-puntwolkrepresentaties biedt die onafhankelijk zijn van variaties in densiteit, ruis, occlusie en frame-rate.

Jiayi Tian, Jiaze Wang2026-03-18🤖 cs.AI

DyJR: Preserving Diversity in Reinforcement Learning with Verifiable Rewards via Dynamic Jensen-Shannon Replay

Het artikel introduceert DyJR, een efficiënt framework voor versterkt leren dat de diversiteit van Large Language Models behoudt door een dynamische buffer en Jensen-Shannon-divergentie-regulering te gebruiken, waardoor het de prestaties van bestaande methoden zoals GRPO verbetert zonder in te leveren op trainingsefficiëntie.

Long Li, Zhijian Zhou, Tianyi Wang, Weidi Xu, Zuming Huang, Wei Chu, Zhe Wang, Shirui Pan, Chao Qu, Yuan Qi2026-03-18🤖 cs.LG

SQL-ASTRA: Alleviating Sparse Feedback in Agentic SQL via Column-Set Matching and Trajectory Aggregation

Het paper introduceert SQL-ASTRA, een framework dat het probleem van schaarse feedback in Text-to-SQL verhelpt door een tweelaags beloningssysteem te gebruiken dat trajectaggregatie en kolommen-matching combineert om stabiele multi-turn agenten te realiseren die state-of-the-art prestaties behalen.

Long Li, Zhijian Zhou, Jiangxuan Long, Peiyang Liu, Weidi Xu, Zhe Wang, Shirui Pan, Chao Qu2026-03-18🤖 cs.AI

Homogeneous and Heterogeneous Consistency progressive Re-ranking for Visible-Infrared Person Re-identification

Dit paper introduceert een nieuwe methode voor zichtbaar-infrarood persoonsheridentificatie genaamd HHCR, die via twee modules voor heterogene en homogene consistentie de uitdagingen van modale verschillen en variaties aanpakt om state-of-the-art prestaties te bereiken.

Yiming Wang2026-03-18🤖 cs.AI

Open-Source Reproduction and Explainability Analysis of Corrective Retrieval Augmented Generation

Deze paper presenteert een volledig open-source reproductie van het Corrective Retrieval Augmented Generation (CRAG)-systeem met Wikipedia en Phi-3-mini, die vergelijkbare prestaties behaalt en voor het eerst inzicht biedt in de werking van de evaluatiecomponent via SHAP-analyse.

Surya Vardhan Yalavarthi2026-03-18💬 cs.CL

MemX: A Local-First Long-Term Memory System for AI Assistants

Het paper introduceert MemX, een lokaal geïmplementeerde, stabiel ontworpen langdurig geheugensysteem voor AI-assistenten dat gebruikmaakt van een hybride zoek- en herordeningpijplijn om zoekresultaten te verbeteren en valse recalls te onderdrukken.

Lizheng Sun2026-03-18🤖 cs.AI

360{\deg} Image Perception with MLLMs: A Comprehensive Benchmark and a Training-Free Method

Deze paper introduceert 360Bench, een benchmark voor het beoordelen van multimodale taalmodellen op 360-gradenbeelden, en presenteert Free360, een trainingsvrije methode die scene graphs en adaptieve transformaties gebruikt om de prestaties van deze modellen voor visuele vraag-antwoordtaken aanzienlijk te verbeteren.

Huyen T. T. Tran, Van-Quang Nguyen, Farros Alferro, Kang-Jun Liu, Takayuki Okatani2026-03-18🤖 cs.AI

Sample-Efficient Adaptation of Drug-Response Models to Patient Tumors under Strong Biological Domain Shift

Dit artikel presenteert een gefaseerd transfer-learningkader dat door het onafhankelijk leren van representaties uit ongelabelde data en daaropvolgende aanpassing met weinig gelabelde patiëntdata, de benodigde klinische supervisie voor het voorspellen van drugrespons significant verlaagt ondanks sterke biologische domeinverschillen.

Camille Jimenez Cortes, Philippe Lalanda, German Vega2026-03-18🧬 q-bio

Are Large Language Models Truly Smarter Than Humans?

Dit paper toont aan dat de schijnbare superioriteit van grote taalmodellen op publieke benchmarks grotendeels het gevolg is van dataverontreiniging, waarbij experimenten aantonen dat deze modellen vaak op de testvragen zijn getraind en hun prestaties aanzienlijk dalen wanneer vragen worden herschreven of indirect worden gesteld.

Eshwar Reddy M, Sourav Karmakar2026-03-18🤖 cs.AI

Robust Generative Audio Quality Assessment: Disentangling Quality from Spurious Correlations

Deze paper introduceert een robuuste methode voor de beoordeling van de kwaliteit van gegenereerde audio die, door middel van domein-adversariale training en aspect-specifieke domeindefinities, spurious correlaties elimineert en zo de generalisatie en correlatie met menselijke beoordelingen aanzienlijk verbetert.

Kuan-Tang Huang, Chien-Chun Wang, Cheng-Yeh Yang, Hung-Shin Lee, Hsin-Min Wang, Berlin Chen2026-03-18⚡ eess

A Scoping Review of AI-Driven Digital Interventions in Mental Health Care: Mapping Applications Across Screening, Support, Monitoring, Prevention, and Clinical Education

Deze scoping review schetst het landschap van door AI aangedreven digitale interventies in de geestelijke gezondheidszorg door de toepassing te analyseren in vijf fasen, de voordelen en uitdagingen te belichten en een nieuw vier-pijlerskader te introduceren voor veilige en effectieve zorg.

Yang Ni, Fanli Jia2026-03-18🤖 cs.AI

Proactive Rejection and Grounded Execution: A Dual-Stage Intent Analysis Paradigm for Safe and Efficient AIoT Smart Homes

Dit paper introduceert het Dual-Stage Intent-Aware (DS-IA) framework, dat de betrouwbaarheid en efficiëntie van AIoT-smarthomes verbetert door hoogwaardige intentie-analyse te scheiden van deterministische uitvoeringsverificatie, waardoor hallucinaties worden voorkomen en de interactiefrequentie met gebruikers wordt geoptimaliseerd.

Xinxin Jin, Zhengwei Ni, Zhengguo Sheng, Victor C. M. Leung2026-03-18🤖 cs.AI

← Vorige Volgende →