cs.AI papers | Gist.Science

Aligning Language Models from User Interactions

Dit paper introduceert een schaalbare zelfdistillatiemethode die taalmodellen in staat stelt om direct uit natuurlijke meer-draads gebruikersinteracties te leren, waardoor de modellen hun uitlijning, instructie-opvolging en personalisatie kunnen verbeteren zonder expliciete feedback.

Thomas Kleine Buening, Jonas Hübotter, Barna Pásztor, Idan Shenfeld, Giorgia Ramponi, Andreas Krause2026-03-16💬 cs.CL

Prompt Injection as Role Confusion

Dit artikel onthult dat prompt-injectie-aanvallen het gevolg zijn van rolverwarring in taalmodellen, waarbij onbetrouwbare tekst die een rol nabootst onterecht autoriteit krijgt, wat leidt tot succesvolle aanvalsmethoden die de interne rolidentificatie van het model uitbuiten.

Charles Ye, Jasmine Cui, Dylan Hadfield-Menell2026-03-16💬 cs.CL

Predictive Analytics for Foot Ulcers Using Time-Series Temperature and Pressure Data

Dit artikel presenteert een voorspellend analyseresframework voor diabetische voetzweren dat tijdreeksdata van temperatuur- en druksensoren combineert met onbewaakte machinelearning-algoritmen, zoals Isolation Forest en KNN, om vroegtijdige risicosignalen te detecteren en zo tijdige interventies mogelijk te maken.

Md Tanvir Hasan Turja2026-03-16🧬 q-bio

The DIME Architecture: A Unified Operational Algorithm for Neural Representation, Dynamics, Control and Integration

Dit paper introduceert de DIME-architectuur, een unificerend operationeel raamwerk dat perceptie, geheugen, waardering en bewustzijn integreert via vier interactieve componenten (engrams, uitvoerdraden, markersystemen en hyperengrams) om een gemeenschappelijke cyclus voor neurale representatie en dynamiek te bieden.

Ionel Cristian Vladu, Nicu Bizdoaca, Ionica Pirici, Tudor-Adrian Balseanu, Eduard Nicusor Bondoc2026-03-16✓ Author reviewed ⓘ🧬 q-bio

Context-Enriched Natural Language Descriptions of Vessel Trajectories

Dit artikel introduceert een contextbewust raamwerk dat ruwe AIS-gegevens van schepen omzet in gestructureerde, semantisch verrijkte representaties die geschikt zijn voor menselijke interpretatie en generatie van natuurlijke taalbeschrijvingen door grote taalmodellen.

Kostas Patroumpas, Alexandros Troupiotis-Kapeliaris, Giannis Spiliopoulos, Panagiotis Betchavas, Dimitrios Skoutas, Dimitris Zissis, Nikos Bikakis2026-03-16🤖 cs.AI

Detecting Miscitation on the Scholarly Web through LLM-Augmented Text-Rich Graph Learning

Deze paper introduceert LAGMiD, een nieuw framework dat large language models (LLMs) en graf-neurale netwerken combineert via kennisdistillatie en bewijsketen-resoneren om miscitaties op het wetenschappelijke web nauwkeurig en kostenefficiënt te detecteren.

Huidong Wu, Haojia Xiang, Jingtong Gao, Xiangyu Zhao, Dengsheng Wu, Jianping Li2026-03-16💻 cs

Synthetic Data Generation for Brain-Computer Interfaces: Overview, Benchmarking, and Future Directions

Dit overzichtspaper biedt een uitgebreide analyse van methoden voor het genereren van synthetische hersensignalen voor brain-computer interfaces, inclusief een systematische classificatie van bestaande algoritmen, benchmarkresultaten over vier BCI-paradigma's en een bespreking van toekomstige kansen en uitdagingen.

Ziwei Wang, Zhentao He, Xingyi He, Hongbin Wang, Tianwang Jia, Jingwei Luo, Siyang Li, Xiaoqing Chen, Dongrui Wu2026-03-16🤖 cs.LG

Global Evolutionary Steering: Refining Activation Steering Control via Cross-Layer Consistency

Dit paper introduceert GER-steer, een trainingsvrij raamwerk dat de controle over Large Language Models verbetert door ruwe stuurvectoren te verfijnen via cross-layer consistentie, waardoor robuuste semantische intentie wordt ontkoppeld van ruis en spurious correlaties.

Xinyan Jiang, Wenjing Yu, Di Wang, Lijie Hu2026-03-16🤖 cs.LG

A Geometrically-Grounded Drive for MDL-Based Optimization in Deep Learning

Dit artikel introduceert een nieuw optimalisatiekader dat het Minimum Description Length-principe fundamenteel integreert in het trainingsproces van diepe neurale netwerken door een meetkundig onderbouwde cognitieve variëteit te gebruiken die wordt gestuurd door een gekoppelde Ricci-stroming, waardoor een autonoom en robuust generaliserend AI-systeem ontstaat.

Ming Lei, Shufan Wu, Christophe Baehr2026-03-16🤖 cs.LG

HCP-DCNet: A Hierarchical Causal Primitive Dynamic Composition Network for Self-Improving Causal Understanding

Dit artikel introduceert HCP-DCNet, een unificerend raamwerk dat continue fysieke dynamiek en discrete symbolische causale redenering combineert via een hiërarchisch systeem van herbruikbare causale primitieven en een zelfverbeterende meta-evolutiestrategie, waardoor AI-systemen robuustere en interpreteerbare causale vaardigheden ontwikkelen.

Ming Lei, Shufan Wu, Christophe Baehr2026-03-16🤖 cs.LG

VQQA: An Agentic Approach for Video Evaluation and Quality Improvement

Dit paper introduceert VQQA, een multi-agent framework dat de kwaliteit van gegenereerde video's verbetert door visuele vragen te genereren en deze te gebruiken als semantische gradiënten voor een efficiënte, black-box promptoptimalisatie die aanzienlijk beter presteert dan bestaande methoden.

Yiwen Song, Tomas Pfister, Yale Song2026-03-16💻 cs

Thermodynamics of Reinforcement Learning Curricula

Dit artikel introduceert een geometrisch raamwerk voor curriculum learning in versterkingslearning, gebaseerd op niet-evenwichtsthermodynamica, waarbij optimale curricula worden gedefinieerd als geodeten op een taakmanifold en een algoritme genaamd MEW wordt voorgesteld voor het bepalen van temperatuur-afkoelschema's.

Jacob Adamczyk, Juan Sebastian Rojas, Rahul V. Kulkarni2026-03-16🤖 cs.LG

Maximum Entropy Exploration Without the Rollouts

Dit paper introduceert EVE, een nieuw algoritme dat het probleem van maximale entropie-exploratie in versterkingsleer oplost zonder dure rollouts, door gebruik te maken van spectrale eigenschappen van overgangsmatrices en een posterior-policy iteratie.

Jacob Adamczyk, Adam Kamoski, Rahul V. Kulkarni2026-03-16🤖 cs.LG

Optimizing Task Completion Time Updates Using POMDPs

Dit artikel presenteert een POMDP-gebaseerde aanpak, gebruikmakend van het MOMDP-framework, om het optimaliseren van updates voor taakvoltooiingstijden te modelleren, waardoor onnodige communicatie met belanghebbenden met tot 75% wordt verminderd terwijl de nauwkeurigheid behouden blijft.

Duncan Eddy, Esen Yel, Emma Passmore, Niles Egan, Grayson Armour, Dylan M. Asmar, Mykel J. Kochenderfer2026-03-16⚡ eess

Budget-Sensitive Discovery Scoring: A Formally Verified Framework for Evaluating AI-Guided Scientific Selection

Deze paper introduceert het formeel geverifieerde Budget-Sensitive Discovery Score (BSDS)-framework om AI-gestuurde selectiestrategieën te evalueren, en toont aan dat grote taalmodellen (LLMs) geen toegevoegde waarde bieden ten opzichte van een eenvoudige, getrainde machine learning-baseline bij het selecteren van kandidaat-moleculen voor drugontwikkeling.

Abhinaba Basu, Pavan Chakraborty2026-03-16🤖 cs.LG

Efficient Reasoning with Balanced Thinking

Dit paper introduceert ReBalance, een trainingsvrij raamwerk dat Large Reasoning Models efficiënter maakt door over- en onderdenken te corrigeren via dynamische sturing op basis van vertrouwen, waardoor redundantie wordt verminderd en de nauwkeurigheid op diverse taken wordt verbeterd.

Yulin Li, Tengyao Tu, Li Ding, Junjie Wang, Huiling Zhen, Yixin Chen, Yong Li, Zhuotao Tian2026-03-16🤖 cs.AI

SPARROW: Learning Spatial Precision and Temporal Referential Consistency in Pixel-Grounded Video MLLMs

Het paper introduceert SPARROW, een pixel-gebaseerd video-MLLM dat ruimtelijke precisie en temporale consistentie verbetert door middel van doelgerichte getrackte features en een dubbel-promptontwerp, wat leidt tot aanzienlijke prestatieverbeteringen op diverse videobenchmarks.

Mohamad Alansari, Naufal Suryanto, Divya Velayudhan, Sajid Javed, Naoufel Werghi, Muzammal Naseer2026-03-16🤖 cs.AI

Test-Time Strategies for More Efficient and Accurate Agentic RAG

Dit paper introduceert test-tijdstrategieën voor Agentic RAG die een contextualisatie- en een de-duplicatiemodule combineren om de Search-R1-pijplijn te optimaliseren, wat resulteert in een aanzienlijke verbetering van het antwoordkwaliteit en een vermindering van het aantal noodzakelijke ophaalrondes.

Brian Zhang, Deepti Guntur, Zhiyang Zuo, Abhinav Sharma, Shreyas Chaudhari, Wenlong Zhao, Franck Dernoncourt, Puneet Mathur, Ryan Rossi, Nedim Lipka2026-03-16🤖 cs.AI

Revisiting Model Stitching In the Foundation Model Era

Dit onderzoek toont aan dat heterogene Vision Foundation Models betrouwbaar kunnen worden samengevoegd door een eenvoudige feature-matching loss te gebruiken, waardoor een praktische methode ontstaat voor het integreren van complementaire modelsterktes en het creëren van een VFM Stitch Tree voor multimodale LLM's.

Zheda Mai, Ke Zhang, Fu-En Wang, Zixiao Ken Wang, Albert Y. C. Chen, Lu Xia, Min Sun, Wei-Lun Chao, Cheng-Hao Kuo2026-03-16🤖 cs.AI

Unmasking Biases and Reliability Concerns in Convolutional Neural Networks Analysis of Cancer Pathology Images

Deze studie onthult dat standaard evaluatiepraktijken voor CNN's in kankerpathologie onbetrouwbaar zijn, omdat modellen tot 93% nauwkeurigheid bereiken bij het classificeren van achtergrondafbeeldingen zonder klinische informatie, wat wijst op ernstige biases die de validiteit van bestaande benchmarks ondermijnen.

Michael Okonoda, Eder Martinez, Abhilekha Dalal, Lior Shamir2026-03-16⚡ eess

← Vorige Volgende →