cs.CL papers | Gist.Science

Aligning the True Semantics: Constrained Decoupling and Distribution Sampling for Cross-Modal Alignment

Dit artikel introduceert CDDS, een nieuw algoritme voor kruismodale uitlijning dat embeddings via een dubbel-pad UNet ontdoet van niet-semantische informatie en een modale kloof overbrugt door middel van distributiestalen, wat leidt tot een significante verbetering van de prestaties ten opzichte van de huidige beste methoden.

Xiang Ma, Lexin Fang, Litian Xu, Caiming Zhang2026-03-09🤖 cs.LG

CBR-to-SQL: Rethinking Retrieval-based Text-to-SQL using Case-based Reasoning in the Healthcare Domain

Het paper introduceert CBR-to-SQL, een framework dat Case-Based Reasoning toepast om de vertaling van natuurlijke taal naar SQL in de gezondheidszorg te verbeteren door een twee-staps zoekproces te gebruiken dat logischer en robuuster is dan standaard RAG-methoden, wat resulteert in state-of-the-art prestaties op de MIMICSQL-dataset.

Hung Nguyen, Hans Moen, Pekka Marttinen2026-03-09🤖 cs.AI

NOTAI.AI: Explainable Detection of Machine-Generated Text via Curvature and Feature Attribution

NOTAI.AI is een uitlegbaar framework dat Fast-DetectGPT uitbreidt met kromme-gebaseerde signalen en stylometrische kenmerken, verwerkt door een XGBoost-classificator met SHAP-analyse en een LLM-laag voor het genereren van gestructureerde, natuurlijke taal-argumenten ter ondersteuning van de detectie van door AI gegenereerde tekst.

Oleksandr Marchenko Breneur, Adelaide Danilov, Aria Nourbakhsh, Salima Lamsiyah2026-03-09💬 cs.CL

Safer Reasoning Traces: Measuring and Mitigating Chain-of-Thought Leakage in LLMs

Dit onderzoek analyseert hoe Chain-of-Thought-prompting de privacyrisico's van LLMs verhoogt door persoonsgegevens te onthullen, en evalueert verschillende lichtgewicht methoden om deze lekken tijdens de inferentie te detecteren en te beperken.

Patrick Ahrend, Tobias Eder, Xiyang Yang, Zhiyi Pan, Georg Groh2026-03-09💬 cs.CL

RACAS: Controlling Diverse Robots With a Single Agentic System

Het artikel introduceert RACAS, een robotonafhankelijk agentic systeem dat gebruikmaakt van drie op taal gebaseerde modules om diverse robotplatforms via natuurlijke taal te besturen zonder dat er aanpassingen aan de broncode of modelgewichten nodig zijn.

Dylan R. Ashley, Jan Przepióra, Yimeng Chen, Ali Abualsaud, Nurzhan Yesmagambet, Shinkyu Park, Eric Feron, Jürgen Schmidhuber2026-03-09🤖 cs.AI

The Fragility Of Moral Judgment In Large Language Models

Deze studie toont aan dat morele oordelen van grote taalmodellen kwetsbaar zijn voor manipulatie door veranderingen in het perspectief en de vraagstelling, wat aantoont dat deze oordelen meer worden beïnvloed door de vorm van de presentatie dan door de morele inhoud zelf.

Tom van Nuenen, Pratik S. Sachdeva2026-03-09🤖 cs.AI

FreeTxt-Vi: A Benchmarked Vietnamese-English Toolkit for Segmentation, Sentiment, and Summarisation

FreeTxt-Vi is een gratis, open-source webtoolkit die geavanceerde Vietnamese-Engelse tekstanalyse mogelijk maakt voor niet-programmatoren door een geïntegreerde pipeline te bieden voor segmentatie, sentimentanalyse en samenvatting, die in evaluaties concurrerende resultaten behaalt en zo de toegang tot meertalig onderzoek voor ondervertegenwoordigde talen zoals het Vietnamees vergemakkelijkt.

Hung Nguyen Huy, Mo El-Haj, Dawn Knight, Paul Rayson2026-03-09💬 cs.CL

Autonomous Algorithm Discovery for Ptychography via Evolutionary LLM Reasoning

Dit paper introduceert Ptychi-Evolve, een autonoom framework dat grote taalmodellen combineert met evolutionaire mechanismen om geavanceerde regularisatie-algoritmen voor ptychografie te ontdekken, wat leidt tot significante verbeteringen in beeldkwaliteit en reproduceerbare inzichten.

Xiangyu Yin, Ming Du, Junjing Deng, Zhi Yang, Yimo Han, Yi Jiang2026-03-09🤖 cs.AI

Towards Robust Retrieval-Augmented Generation Based on Knowledge Graph: A Comparative Analysis

Dit artikel presenteert een vergelijkende analyse die aantoont dat GraphRAG, een op kennisgrafieken gebaseerd systeem, robuustere Retrieval-Augmented Generation-resultaten levert dan de standaard RGB-baseline door middel van aangepaste strategieën voor ruisbestendigheid, informatieverwerking en afwijzing van negatieve of tegenstrijdige informatie.

Hazem Amamou, Stéphane Gagnon, Alan Davoust, Anderson R. Avila2026-03-09💬 cs.CL

Cultural Perspectives and Expectations for Generative AI: A Global Survey Approach

Dit artikel presenteert de resultaten van een wereldwijde enquête naar culturele perspectieven en verwachtingen betreffende generatieve AI, waarbij op basis van empirische data werkdefinities van cultuur worden afgeleid en aanbevelingen worden gedaan voor een meer participatieve en gevoelige ontwikkeling van GenAI-systemen.

Erin van Liemt, Renee Shelby, Andrew Smart, Sinchana Kumbale, Richard Zhang, Neha Dixit, Qazi Mamunur Rashid, Jamila Smith-Loud2026-03-09🤖 cs.AI

Structured Multidimensional Representation Learning for Large Language Models

Dit paper introduceert de L-Transformer, een architectuur die via gestructureerde spectrale factorisatie van de embedding-ruimte de encoderparameters aanzienlijk reduceert (tot 75%) terwijl de semantiek en prestaties van standaard Transformers behouden blijven.

Alaa El Ichi, Khalide Jbilou, Mohamed El Guide, Franck Dufrenois2026-03-09💬 cs.CL

Let's Talk, Not Type: An Oral-First Multi-Agent Architecture for Guaraní

Dit positionspaper pleit voor een mondelinge eerst-architectuur met meerdere agenten voor het Guaraní, die de standaard tekst-gebaseerde benadering van AI vervangt door een systeem dat de mondelinge praktijken, data-soevereiniteit en diglossie van inheemse gemeenschappen eerbiedigt.

Samantha Adorno, Akshata Kishore Moharir, Ratna Kandala2026-03-09💬 cs.CL

CodeScout: Contextual Problem Statement Enhancement for Software Agents

CodeScout is een nieuwe aanpak die ondertitelde softwareproblemen verrijkt met contextuele analyse van de codebasis, waardoor AI-agenten hun oplossingspercentage met 20% verhogen door mislukte trajecten te voorkomen en de gebruikersintentie te verduidelijken.

Manan Suri, Xiangci Li, Mehdi Shojaie, Songyang Han, Chao-Chun Hsu, Shweta Garg, Aniket Anand Deshmukh, Varun Kumar2026-03-09💬 cs.CL

NERdME: a Named Entity Recognition Dataset for Indexing Research Artifacts in Code Repositories

Dit artikel introduceert NERdME, een nieuw dataset van handmatig geannoteerde README-bestanden die de kloof overbrugt tussen bestaande wetenschappelijke informatiewinning en de extractie van implementatie-details uit code-repositories.

Genet Asefa Gesese, Zongxiong Chen, Shufan Jiang, Mary Ann Tan, Zhaotai Liu, Sonja Schimmler, Harald Sack2026-03-09💬 cs.CL

PVminerLLM: Structured Extraction of Patient Voice from Patient-Generated Text using Large Language Models

Deze paper introduceert PVminerLLM, een gesuperviseerd fijngetraind groot taalmodel dat structurele informatie uit patiëntengenerieke tekst haalt en hiermee prompt-based baselines significant overtreft, waardoor schaalbare analyse van niet-klinische gezondheidsdeterminanten mogelijk wordt.

Samah Fodeh, Linhai Ma, Ganesh Puthiaraju, Srivani Talakokkul, Afshan Khan, Ashley Hagaman, Sarah Lowe, Aimee Roundtree2026-03-09🤖 cs.AI

Tutor Move Taxonomy: A Theory-Aligned Framework for Analyzing Instructional Moves in Tutoring

Dit artikel introduceert een theorie-gebaseerde taxonomie voor tutorbewegingen, ontwikkeld via een hybride deductief-inductief proces, die instructieve acties in één-op-één tutoring classificeert om grootschalige analyse, AI-gestuurde annotatie en het modelleren van effectieve tutoringstrategieën mogelijk te maken.

Zhuqian Zhou, Kirk Vanacore, Tamisha Thompson, Jennifer St John, Rene Kizilcec2026-03-09💬 cs.CL

Proof-of-Guardrail in AI Agents and What (Not) to Trust from It

Dit paper introduceert Proof-of-Guardrail, een systeem dat ontwikkelaars in staat stelt met cryptografische bewijzen te verifiëren dat AI-agenten veiligheidsfilters daadwerkelijk hebben doorlopen via een Trusted Execution Environment, hoewel het ook waarschuwt voor het risico dat kwaadwillende ontwikkelaars deze filters toch kunnen omzeilen.

Xisen Jin, Michael Duan, Qin Lin, Aaron Chan, Zhenglun Chen, Junyi Du, Xiang Ren2026-03-09🤖 cs.AI

RouteGoT: Node-Adaptive Routing for Cost-Efficient Graph of Thoughts Reasoning

RouteGoT is een nieuw, budgetbeheersbaar framework dat de efficiëntie van redenering met een Graf van Gedachten (GoT) verbetert door dynamisch zware modellen toe te wijzen aan complexe planningstaken en lichtere modellen aan eenvoudigere subtaken, waardoor de tokenkosten aanzienlijk worden verlaagd zonder in te leveren op de nauwkeurigheid.

Yuhang Liu, Ruijie Wang, Yunlong Chu, Bing Hao, Yumeng Lin, Shengzhong Liu, Minglai Shao2026-03-09💬 cs.CL

HART: Data-Driven Hallucination Attribution and Evidence-Based Tracing for Large Language Models

Dit paper introduceert HART, een raamwerk voor gedetailleerde hallucinatie-attributie en bewijstraceerbaarheid in grote taalmodellen dat een gestructureerde aanpak combineert met een nieuw dataset om de interpretatie en betrouwbaarheid van hallucinaties te verbeteren.

Shize Liang, Hongzhi Wang2026-03-09💬 cs.CL

Test-Time Adaptation via Many-Shot Prompting: Benefits, Limits, and Pitfalls

Dit artikel onderzoekt de effectiviteit, beperkingen en valkuilen van testtijd-adaptatie via veel-shot prompting bij grote taalmodellen, en concludeert dat deze methode vooral nuttig is voor gestructureerde taken maar gevoelig is voor de selectiestrategie en vaak beperkt baat biedt bij open-ended generatie.

Shubhangi Upasani, Chen Wu, Jay Rainton, Bo Li, Changran Hu, Qizheng Zhang, Urmish Thakker2026-03-09🤖 cs.LG

← Vorige Volgende →