cs.AI papers | Gist.Science

Social-R1: Towards Human-like Social Reasoning in LLMs

Dit paper introduceert Social-R1, een versterkingsleerframework dat, ondersteund door het uitdagende ToMBench-Hard-benchmark, kleine taalmodellen in staat stelt om menselijk sociale redenering te overtreffen door het leerproces te aligneren met menselijke cognitie in plaats van alleen op uitkomsten te focussen.

Jincenzi Wu, Yuxuan Lei, Jianxun Lian, Yitian Huang, Lexin Zhou, Haotian Li, Xing Xie, Helen Meng2026-03-11🤖 cs.AI

Multi-model approach for autonomous driving: A comprehensive study on traffic sign-, vehicle- and lane detection and behavioral cloning

Dit onderzoek presenteert een veelzijdige aanpak voor autonoom rijden die gebruikmaakt van diep learning en computer vision voor taken zoals verkeersbord- en voertuigdetectie, rijstrookherkenning en gedragskloon, met als doel de robuustheid en betrouwbaarheid van zelfrijdende systemen te verbeteren.

Kanishkha Jaisankar, Pranav M. Pawar, Diana Susane Joseph, Raja Muthalagu, Mithun Mukherjee2026-03-11🤖 cs.AI

Logos: An evolvable reasoning engine for rational molecular design

Dit paper introduceert Logos, een compact en interpreteerbaar AI-model dat logisch redeneren combineert met strikte chemische consistentie om betrouwbare en menselijk controleerbare moleculaire ontwerpen te genereren.

Haibin Wen, Zhe Zhao, Fanfu Wang, Tianyi Xu, Hao Zhang, Chao Yang, Ye Wei2026-03-11🤖 cs.AI

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

Dit artikel introduceert DendroNN, een energiezuinig, niet-gedifferentieerd neuronaal netwerk dat inspiratie put uit dendritische sequentiedetectie om event-based data te verwerken en via een asynchrone hardware-architectuur een tot vier keer hogere efficiëntie bereikt dan bestaande neuromorfe systemen.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen Becker2026-03-11🤖 cs.AI

DenoiseSplat: Feed-Forward Gaussian Splatting for Noisy 3D Scene Reconstruction

DenoiseSplat is een feed-forward methode voor 3D Gaussian Splatting die robuuste 3D-scèneherconstructie mogelijk maakt uit ruisige multi-view beelden door te trainen op een groot schaalbaar benchmark met synthetische ruis, zonder gebruik te maken van 3D-ground truth.

Fuzhen Jiang, Zhuoran Li, Yinlin Zhang2026-03-11🤖 cs.AI

Rescaling Confidence: What Scale Design Reveals About LLM Metacognition

Dit onderzoek toont aan dat het ontwerp van de schaal voor verbaal geuite zekerheid, met name het gebruik van een 0–20 schaal in plaats van de standaard 0–100, de kwaliteit van de metacognitieve sensitiviteit van grote taalmodellen aanzienlijk beïnvloedt.

Yuyang Dai2026-03-11🤖 cs.AI

Curveball Steering: The Right Direction To Steer Isn't Always Linear

Dit paper introduceert "Curveball steering", een niet-lineaire methode voor het sturen van grote taalmodellen die de complexe geometrie van activatieruimtes beter respecteert dan traditionele lineaire benaderingen en daardoor consistent betere resultaten behaalt.

Shivam Raval, Hae Jin Song, Linlin Wu, Abir Harrasse, Jeff Phillips, Amirali Abdullah2026-03-11🤖 cs.AI

CLoE: Expert Consistency Learning for Missing Modality Segmentation

Het artikel introduceert CLoE, een consistentiegedreven raamwerk dat de segmentatieprestaties bij ontbrekende medische beeldmodaliteiten verbetert door experts op besluit- en regienniveau tot overeenstemming te brengen en modale betrouwbaarheid dynamisch te wegen.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao Li2026-03-11🤖 cs.AI

SpaceSense-Bench: A Large-Scale Multi-Modal Benchmark for Spacecraft Perception and Pose Estimation

Deze paper introduceert SpaceSense-Bench, een groot-schalig meer-modale benchmark met 136 satellietmodellen en nauwkeurige ground-truth annotaties gegenereerd in Unreal Engine 5, die dient om spacecraft-perceptie en pose-schatting te evalueren en aantoont dat het vergroten van de trainingsdiversiteit cruciaal is voor het verbeteren van prestaties op nieuwe doelen.

Aodi Wu, Jianhong Zuo, Zeyuan Zhao, Xubo Luo, Ruisuo Wang, Xue Wan2026-03-11🤖 cs.AI

Reading the Mood Behind Words: Integrating Prosody-Derived Emotional Context into Socially Responsive VR Agents

Dit onderzoek presenteert een VR-interactiesysteem dat door het integreren van stemgebaseerde emotieherkenning in de dialoogcontext van een LLM-agent de natuurlijkheid, betrokkenheid en menselijkheid van sociale interacties aanzienlijk verbetert, zoals bevestigd door een studie waarbij 93,3% van de deelnemers de emotiebewuste agent prefereerde.

SangYeop Jeong, Yeongseo Na, Seung Gyu Jeong, Jin-Woo Jeong, Seong-Eun Kim2026-03-11🤖 cs.AI

TimberAgent: Gram-Guided Retrieval for Executable Music Effect Control

Dit paper introduceert TimberAgent, een gram-geleide zoekmethode die Wav2Vec2-activaties gebruikt om de semantische kloof tussen gebruikersintentie en lage-niveau audio-effectparameters te overbruggen door de meest geschikte plugin-configuratie te vinden in plaats van een definitief geluid te genereren.

Shihao He, Yihan Xia, Fang Liu, Taotao Wang, Shengli Zhang2026-03-11🤖 cs.AI

Beyond Scaling: Assessing Strategic Reasoning and Rapid Decision-Making Capability of LLMs in Zero-sum Environments

Dit paper introduceert de STAR-benchmark, een multi-agent evaluatiekader dat het strategische redeneren en snelle besluitvorming van grote taalmodellen in nul-som omgevingen test, waarbij een significante kloof wordt blootgelegd tussen diep redeneren en effectieve uitvoering onder tijdsdruk.

Yang Li, Xing Chen, Yutao Liu, Gege Qi, Yanxian BI, Zizhe Wang, Yunjian Zhang, Yao Zhu2026-03-11🤖 cs.AI

TaSR-RAG: Taxonomy-guided Structured Reasoning for Retrieval-Augmented Generation

Dit paper introduceert TaSR-RAG, een framework dat taxonomie-gestuurde gestructureerde redenering toepast door queries en documenten om te zetten in relationele triples, waardoor de precisie en betrouwbaarheid van Retrieval-Augmented Generation voor complexe meerstapsvragen aanzienlijk wordt verbeterd zonder zware grafconstructie.

Jiashuo Sun, Yixuan Xie, Jimeng Shi, Shaowen Wang, Jiawei Han2026-03-11🤖 cs.AI

Robust Regularized Policy Iteration under Transition Uncertainty

Deze paper introduceert Robust Regularized Policy Iteration (RRPI), een methode voor offline versterkend leren die prestatie-degradatie door verdelingsverschuiving en transitie-onzekerheid aanpakt door het leerproces te formuleren als robuuste optimalisatie tegenover de slechtst mogelijke dynamica binnen een onzekerheidsset, wat resulteert in een efficiënt iteratief algoritme met theoretische convergentiegaranties en superieure prestaties op D4RL-benchmarks.

Hongqiang Lin, Zhenghui Fu, Weihao Tang, Pengfei Wang, Yiding Sun, Qixian Huang, Dongxu Zhang2026-03-11🤖 cs.AI

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

Dit paper introduceert TA-GGAD, een adaptief grafmodel dat het 'Anomaly Disassortativity'-probleem aanpakt om generalistische, domeinonafhankelijke anomaliedetectie te realiseren met state-of-the-art prestaties op diverse real-world grafen.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Dit artikel introduceert een differentieel-private, nulde-orde optimalisatieframework dat datasetcondensatie mogelijk maakt voor niet-differentieerbare klinische modellen, zoals beslisbomen en Cox-regressie, waardoor veilige en modelonafhankelijke datauitwisseling voor klinische voorspellingsopdrachten wordt gerealiseerd zonder de privacy van patiënten te schaden.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. Clifton2026-03-11🤖 cs.AI

M3GCLR: Multi-View Mini-Max Infinite Skeleton-Data Game Contrastive Learning For Skeleton-Based Action Recognition

Dit paper introduceert M3GCLR, een speltheoretisch contrastief leerframework dat een oneindig skelet-data-spel en een dual-loss optimizer gebruikt om de beperkingen van bestaande zelftoezichtmethoden voor skeletgebaseerde actieherkenning te overwinnen en state-of-the-art prestaties op meerdere benchmarks te bereiken.

Yanshan Li, Ke Ma, Miaomiao Wei, Linhui Dai2026-03-11🤖 cs.AI

MIL-PF: Multiple Instance Learning on Precomputed Features for Mammography Classification

Deze paper introduceert MIL-PF, een schaalbaar framework dat voorgecomputeerde features van gefixeerde foundation-modellen combineert met een lichtgewicht Multiple Instance Learning-kop om mammografie-classificatie efficiënt en nauwkeurig te maken zonder de zware backbones opnieuw te hoeven trainen.

Nikola Jovišic, Milica Škipina, Nicola Dall'Asen, Dubravko Culibrk2026-03-11🤖 cs.AI

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

SPAARS is een curriculumleerframework voor offline-naar-online versterkingsleer dat veilig online verkenning eerst beperkt tot een laagdimensionale latente ruimte om vervolgens naadloos over te schakelen naar de ruwe actieruimte, waardoor de prestatieplafond van decoder-bottlenecks wordt doorbroken en aanzienlijk betere sample-efficiëntie en prestaties worden bereikt.

Swaminathan S K, Aritra Hazra2026-03-11🤖 cs.AI

Physics-Informed Neural Engine Sound Modeling with Differentiable Pulse-Train Synthesis

Dit paper introduceert de Pulse-Train-Resonator (PTR), een differentieerbaar synthesemodel dat motorgeluiden nauwkeuriger nabootst door fysisch geïnformeerde pulsreeksen en resonatoren te gebruiken in plaats van traditionele harmonische benaderingen, wat resulteert in een significante verbetering in reconstructiekwaliteit en interpreteerbare parameters.

Robin Doerfler, Lonce Wyse2026-03-11🤖 cs.AI

← Vorige Volgende →