cs.AI papers | Gist.Science

VoiceSHIELD-Small: Real-Time Malicious Speech Detection and Transcription

Het artikel introduceert VoiceSHIELD-Small, een lichtgewicht model dat spraak in real-time tegelijkertijd transcribeert en detecteert of deze kwaadaardig is, waardoor vertragingen worden vermeden en een hoge nauwkeurigheid wordt bereikt.

Sumit Ranjan, Sugandha Sharma, Ubaid Abbas, Puneeth N Ail2026-03-10💻 cs

YAQIN: Culturally Sensitive, Agentic AI for Mental Healthcare Support Among Muslim Women in the UK

Dit paper beschrijft YAQIN, een co-ontworpen AI-toepassing die door middel van een islamitisch gefundeerde chatbot en dagboekfunctie de culturele en spirituele behoeften van moslimvrouwen in het VK op het gebied van mentale gezondheid ondersteunt, waardoor vertrouwen en toegankelijkheid van de zorg worden verbeterd.

Yasmin Zaraket, Céline Mougenot2026-03-10💻 cs

Rigidity in LLM Bandits with Implications for Human-AI Dyads

Dit onderzoek toont aan dat taalmodellen in bandietproeven rigide beslissingstendensen vertonen door lage leersnelheden en hoge omgekeerde temperaturen, wat leidt tot starre exploitatiepatronen die de interactie tussen mens en AI kunnen beïnvloeden.

Haomiaomiao Wang, Tomás E Ward, Lili Zhang2026-03-10💻 cs

A Novel Multi-Agent Architecture to Reduce Hallucinations of Large Language Models in Multi-Step Structural Modeling

Dit paper introduceert een nieuw multi-agent architectuur die hallucinaties van grote taalmodellen reduceert bij het automatiseren van meerstaps structurele modellering en analyse met OpenSeesPy, waardoor een hoge nauwkeurigheid en schaalbaarheid wordt bereikt.

Ziheng Geng, Jiachen Liu, Ran Cao, Lu Cheng, Dan M. Frangopol, Minghui Cheng2026-03-10💻 cs

Large Language Model for Discrete Optimization Problems: Evaluation and Step-by-step Reasoning

Dit onderzoek evalueert de prestaties van verschillende grote taalmodellen bij het oplossen van discrete optimalisatieproblemen met uitgebreide datasets en concludeert dat sterkere modellen beter presteren, terwijl de Chain-of-Thought-techniek niet altijd effectief is en verstoord data soms de prestaties op eenvoudige problemen kan verbeteren.

Tianhao Qian, Guilin Qi, Z. Y. Wu, Ran Gu, Xuanyi Liu, Canchen Lyu2026-03-10💬 cs.CL

Hide and Find: A Distributed Adversarial Attack on Federated Graph Learning

Dit paper introduceert FedShift, een innovatieve twee-traps "Verstop en Zoek"-aanval op Federated Graph Learning die door het injecteren van een verborgen "shifter" en het benutten van globale modelinformatie, een uiterst effectieve, stealthy en efficiënte methode biedt om bestaande verdedigingsmechanismen te omzeilen.

Jinshan Liu, Ken Li, Jiazhe Wei, Bin Shi, Bo Dong2026-03-10🤖 cs.LG

DECADE: A Temporally-Consistent Unsupervised Diffusion Model for Enhanced Rb-82 Dynamic Cardiac PET Image Denoising

Het artikel introduceert DECADE, een onbewaakte diffusiemodel dat tijdsconsistentie toepast om ruis in dynamische Rb-82 hart-PET-beelden te verminderen en zo de beeldkwaliteit en kwantitatieve nauwkeurigheid verbetert zonder gebruik te maken van gepaarde trainingsdata.

Yinchi Zhou, Liang Guo, Huidong Xie, Yuexi Du, Ashley Wang, Menghua Xia, Tian Yu, Ramesh Fazzone-Chettiar, Christopher Weyman, Bruce Spottiswoode, Vladimir Panin, Kuangyu Shi, Edward J. Miller, Attila Feher, Albert J. Sinusas, Nicha C. Dvornek, Chi Liu2026-03-10💻 cs

QuadAI at SemEval-2026 Task 3: Ensemble Learning of Hybrid RoBERTa and LLMs for Dimensional Aspect-Based Sentiment Analysis

Dit paper presenteert QuadAI, een ensemble-systeem voor SemEval-2026 dat een hybride RoBERTa-encoder combineert met grote taalmodellen via voorspellingsniveau-ensemble learning om de prestaties bij dimensionele aspectgebaseerde sentimentanalyse aanzienlijk te verbeteren.

A. J. W. de Vink, Filippos Karolos Ventirozos, Natalia Amat-Lefort, Lifeng Han2026-03-10💬 cs.CL

ProgAgent:A Continual RL Agent with Progress-Aware Rewards

ProgAgent is een doorlopende versterkingsleer-agent die catastrofale vergeeting en hoge kosten voor beloningsspecificatie aanpakt door ongelabelde expertvideo's te gebruiken voor het afleiden van progreseergerichte beloningen, gecombineerd met een JAX-native architectuur voor stabiele en snelle robotleer.

Jinzhou Tan, Gabriel Adineera, Jinoh Kim2026-03-10🤖 cs.LG

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

Deze studie toont aan dat grote taalmodellen in de Nepalese context aanzienlijke sociale vooroordelen vertonen, waarbij impliciete generatieve bias sterk verschilt van expliciete instemming en een niet-lineair verband vertoont met de temperatuurinstelling, wat de noodzaak benadrukt van cultureel onderbouwde evaluatie- en debiasingstrategieën.

Ashish Pandey, Tek Raj Chhetri2026-03-10💬 cs.CL

Learning embeddings of non-linear PDEs: the Burgers' equation

Dit artikel presenteert een methode om met behulp van Physics Informed Neural Networks en orthogonale hoofdcomponentenanalyse een robuuste, laagdimensionale inbedding te construeren voor de oplossingsruimte van de niet-lineaire Burgers-vergelijking, waarbij een klein aantal latentemodes de dominante dynamische kenmerken effectief vastlegt.

Pedro Tarancón-Álvarez, Leonid Sarieddine, Pavlos Protopapas, Raul Jimenez2026-03-10🤖 cs.LG

HybridStitch: Pixel and Timestep Level Model Stitching for Diffusion Acceleration

HybridStitch is een nieuwe methode voor tekst-naar-afbeelding-generatie die de berekening versnelt door complexe beeldgebieden te verfijnen met een groot model en eenvoudige gebieden te genereren met een kleiner model, wat resulteert in een 1,83-voudige snelheidswinst op Stable Diffusion 3.

Desen Sun, Jason Hon, Jintao Zhang, Sihang Liu2026-03-10💻 cs

Column Generation for the Micro-Transit Zoning Problem

Dit paper introduceert een Column Generation-framework met prijsbepalingsheuristieken om het Micro-Transit Zoning-probleem op te lossen onder een globaal budget, wat leidt tot efficiëntere en schaalbaardere oplossingen voor het plannen van geo-fenced zones in vergelijking met bestaande methoden.

Hins Hu, Rishav Sen, Jose Paolo Talusan, Abhishek Dubey, Aron Laszka, Samitha Samaranayake2026-03-10🔢 math

Gradient Iterated Temporal-Difference Learning

Dit paper introduceert Gradient Iterated Temporal-Difference learning, een nieuw algoritme dat de stabiliteit van gradient TD-methoden verbetert door de gradiënten over bewegende doelen te berekenen, waardoor het voor het eerst een concurrerende leersnelheid bereikt ten opzichte van semi-gradiënt-methoden op benchmarks zoals Atari-games.

Théo Vincent, Kevin Gerhardt, Yogesh Tripathi, Habib Maraqten, Adam White, Martha White, Jan Peters, Carlo D'Eramo2026-03-10🤖 cs.LG

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

Dit artikel stelt dat het misbruik van AI in het onderwijs niet primair een detectieprobleem is, maar een meetprobleem door verlies van inzicht in het leerproces, en lost dit op met het 'Learning Visibility Framework' dat transparantie en procesinformatie boven surveillance stelt.

Eduardo Davalos, Yike Zhang2026-03-10💻 cs

DistillGuard: Evaluating Defenses Against LLM Knowledge Distillation

Het paper "DistillGuard" introduceert een raamwerk voor het evalueren van verdedigingen tegen kennisdistillatie van LLM's en concludeert dat bestaande output-niveau maatregelen over het algemeen inefficiënt zijn en sterk afhankelijk van de specifieke taak.

Bo Jiang2026-03-10💬 cs.CL

AI Steerability 360: A Toolkit for Steering Large Language Models

Dit paper introduceert AI Steerability 360, een open-source Python-bibliotheek van IBM die een gestandaardiseerde interface biedt om grote taalmodellen via vier controleoppervlakken (invoer, structuur, staat en uitvoer) te sturen en verschillende stuurmethoden eenvoudig te combineren en evalueren.

Erik Miehling, Karthikeyan Natesan Ramamurthy, Praveen Venkateswaran, Irene Ko, Pierre Dognin, Moninder Singh, Tejaswini Pedapati, Avinash Balakrishnan, Matthew Riemer, Dennis Wei, Inge Vejsbjerg, Elizabeth M. Daly, Kush R. Varshney2026-03-10💬 cs.CL

Intentional Deception as Controllable Capability in LLM Agents

Dit onderzoek toont aan dat opzettelijke misleiding in LLM-agenten een gecontroleerde vaardigheid is die voornamelijk werkt via strategische misleiding in plaats van fabricage, waarbij de motieven van de doelagenten het meest kwetsbaar zijn voor manipulatie.

Jason Starace, Terence Soule2026-03-10💻 cs

SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans

Het paper introduceert SynPlanResearch-R1, een framework dat synthetische trajecten genereert om de verkenning van tools te stimuleren tijdens de koude-start-fase van deep research agents, wat leidt tot aanzienlijke prestatieverbeteringen op meerdere benchmarks in vergelijking met bestaande methoden.

Hansi Zeng, Zoey Li, Yifan Gao, Chenwei Zhang, Xiaoman Pan, Tao Yang, Fengran Mo, Jiacheng Lin, Xian Li, Jingbo Shang2026-03-10💬 cs.CL

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

Dit paper introduceert Sleep Replay Consolidation (SRC), een post-training methode die geïnspireerd is op biologische slaap om de betrouwbaarheid van voorspellingskansen in kunstmatige neurale netwerken te verbeteren zonder toezicht.

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG

← Vorige Volgende →