cs.CL papers | Gist.Science

TAO-Attack: Toward Advanced Optimization-Based Jailbreak Attacks for Large Language Models

In dit artikel wordt TAO-Attack gepresenteerd, een geavanceerde optimalisatiegebaseerde jailbreak-methode voor grote taalmodellen die een tweestapsverliesfunctie en een richtingsprioriteitsstrategie voor tokenoptimalisatie combineert om de aanvalsuccespercentages aanzienlijk te verhogen ten opzichte van bestaande technieken.

Zhi Xu, Jiaqi Li, Xiaotong Zhang + 2 more2026-03-04💬 cs.CL

Compact Prompting in Instruction-tuned LLMs for Joint Argumentative Component Detection

Dit paper introduceert een nieuwe generatieve aanpak voor de detectie van argumentatieve componenten met behulp van compacte instructies in instructie-gefineerde grote taalmodellen, die volgens experimenten op standaard benchmarks betere prestaties levert dan bestaande state-of-the-art systemen.

Sofiane Elguendouze, Erwan Hain, Elena Cabrio + 1 more2026-03-04💬 cs.CL

Interpreting Speaker Characteristics in the Dimensions of Self-Supervised Speech Features

Dit onderzoek toont aan dat bij self-supervised speech-modellen zoals WavLM specifieke sprekerseigenschappen, zoals toonhoogte en geslacht, geconcentreerd zijn in individuele dimensies van de feature-vectors, waardoor deze dimensies kunnen worden gemanipuleerd om de stemkarakteristieken bij spraaksynthese te controleren.

Kyle Janse van Rensburg, Benjamin van Niekerk, Herman Kamper2026-03-04⚡ eess

Evaluating Performance Drift from Model Switching in Multi-Turn LLM Systems

Deze studie introduceert een switch-matrix benchmark die aantoont dat het wisselen van modellen tijdens multi-turn gesprekken significante en gerichte prestatieafwijkingen veroorzaakt, wat handoff-robustheid als een cruciale, maar vaak over het hoofd geziene dimensie voor de operationele betrouwbaarheid van LLM-systemen benadrukt.

Raad Khraishi, Iman Zafar, Katie Myles + 1 more2026-03-04💬 cs.CL

UniSkill: A Dataset for Matching University Curricula to Professional Competencies

Dit paper introduceert UniSkill, een nieuw dataset en annotatiegids die universiteitscursussen koppelt aan ESCO-vaardigheden om taalmodellen te trainen voor effectieve curriculum-competentie matching.

Nurlan Musazade, Joszef Mezei, Mike Zhang2026-03-04💬 cs.CL

APRES: An Agentic Paper Revision and Evaluation System

Dit paper introduceert APRES, een door LLM's aangedreven systeem dat wetenschappelijke artikelen automatisch herwerkt op basis van een citaatvoorspellende rubriek om de kwaliteit en impact te verhogen zonder de kerninhoud te wijzigen, waarbij menselijke experts worden ondersteund in plaats van vervangen.

Bingchen Zhao, Jenny Zhang, Chenxi Whitehouse + 8 more2026-03-04💬 cs.CL

Type-Aware Retrieval-Augmented Generation with Dependency Closure for Solver-Executable Industrial Optimization Modeling

Deze paper introduceert een type-bewuste retrieval-augmented generation-methode met dependency closure die natuurlijke taal omzet in uitvoerbare industriële optimalisatiemodellen door een gestructureerde kennisgrafiek te gebruiken, waardoor de betrouwbaarheid en uitvoerbaarheid aanzienlijk worden verbeterd ten opzichte van bestaande benaderingen.

Y. Zhong, R. Huang, M. Wang + 4 more2026-03-04💬 cs.CL

MoD-DPO: Towards Mitigating Cross-modal Hallucinations in Omni LLMs using Modality Decoupled Preference Optimization

Dit paper introduceert MoD-DPO, een efficiënt framework dat cross-modale hallucinaties in omni-taalmodellen vermindert door modality-decoupled voorkeuroptimalisatie te gebruiken om de afhankelijkheid van tekstuele priors te doorbreken en de perceptie van relevante audiovisuele modaliteiten te versterken.

Ashutosh Chaubey, Jiacheng Pang, Mohammad Soleymani2026-03-04💬 cs.CL

BeyondSWE: Can Current Code Agent Survive Beyond Single-Repo Bug Fixing?

Dit paper introduceert BeyondSWE, een uitgebreid benchmark dat de beperkingen van huidige code-agenten in complexe, real-world scenario's blootlegt, en SearchSWE, een framework dat aantoont dat zoekfuncties niet altijd leiden tot betere prestaties.

Guoxin Chen, Fanzhe Meng, Jiale Zhao + 12 more2026-03-04💬 cs.CL

ACE-Brain-0: Spatial Intelligence as a Shared Scaffold for Universal Embodiments

In dit rapport wordt ACE-Brain-0 geïntroduceerd, een universeel multimodaal groot taalmodel dat ruimtelijke intelligentie als gedeeld fundament gebruikt om diverse fysieke implementaties, zoals autonoom rijden en robotica, te verenigen via het Scaffold-Specialize-Reconcile-paradigma en GRPO, waardoor state-of-the-art prestaties worden bereikt op 24 benchmarks.

Ziyang Gong, Zehang Luo, Anke Tang + 21 more2026-03-04💬 cs.CL

Learning When to Act or Refuse: Guarding Agentic Reasoning Models for Safe Multi-Step Tool Use

Dit paper introduceert MOSAIC, een post-training framework dat agentic taalmodellen veilig maakt voor multi-stap toolgebruik door expliciete veiligheidsredenering en weigering als leerbare acties te integreren, wat resulteert in een aanzienlijke reductie van schadelijk gedrag en privacylekken zonder in te leveren op prestaties bij nuttige taken.

Aradhye Agarwal, Gurdit Siyan, Yash Pandya + 3 more2026-03-04💬 cs.CL

Understanding and Mitigating Dataset Corruption in LLM Steering

Dit onderzoek toont aan dat contrastieve sturing van grote taalmodellen kwetsbaar is voor kwaadwillende datasetcorruptie, maar dat deze kwetsbaarheid effectief kan worden gemitigeerd door het gebruik van robuuste schatters voor het berekenen van het gemiddelde.

Cullen Anderson, Narmeen Oozeer, Foad Namjoo + 3 more2026-03-04💬 cs.CL

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Deze paper introduceert Density-Guided Response Optimization (DGRO), een methode die taalmodellen aanpast aan gemeenschapsnormen door gebruik te maken van impliciete acceptatiesignalen en de geometrische dichtheid in representatieruimtes, waardoor effectieve uitlijning mogelijk wordt zonder expliciete voorkeurslabels.

Patrick Gerard, Svitlana Volkova2026-03-04💬 cs.CL

Using Learning Progressions to Guide AI Feedback for Science Learning

Deze studie toont aan dat feedback gegenereerd door AI op basis van automatisch afgeleide leervorderingen (learning progressions) even kwalitatief hoogwaardig is als feedback gebaseerd op door experts ontworpen rubrieken voor middelbare scholieren in de scheikunde.

Xin Xia, Nejla Yuruk, Yun Wang + 1 more2026-03-04💬 cs.CL

Factuality Challenges in the Era of Large Language Models

Dit artikel onderzoekt de uitdagingen van hallucinaties en misinformatie door grote taalmodellen en schetst de noodzakelijke technologische, regelgevende en educatieve maatregelen om de waarheidsvinding in het tijdperk van generatieve AI te waarborgen.

Isabelle Augenstein, Timothy Baldwin, Meeyoung Cha + 15 more2026-03-03💬 cs.CL

Using ChatGPT for Data Science Analyses

Dit artikel evalueert het potentieel van ChatGPT als kwantitatieve co-pilot voor data science-werkstromen, waarbij de mogelijkheden voor exploratie, visualisatie en modellering worden geïllustreerd en de noodzaak van zorgvuldige overweging van de beperkingen wordt benadrukt.

Ozan Evkaya, Miguel de Carvalho2026-03-03📊 stat

Large Language Model Agent in Financial Trading: A Survey

Dit survey biedt een uitgebreide analyse van het gebruik van Large Language Model-agenten in financiële trading, waarbij het de huidige architecturen, data-inputs, prestaties en uitdagingen samenvat en toekomstige onderzoeksrichtingen schetst.

Han Ding, Yinheng Li, Junhao Wang + 3 more2026-03-03💬 cs.CL

Scaling Knowledge Graph Construction through Synthetic Data Generation and Distillation

Dit paper introduceert SynthKG en Distill-SynthKG, een pipeline die synthetische document-KG-paren genereert om een kleiner model te trainen dat niet alleen superieure kennisgrafiek-kwaliteit levert ten opzichte van grotere baselines, maar ook de prestaties verbetert in zoekopdrachten en vraagbeantwoording via een nieuw grafiekgebaseerd ophaalframework.

Prafulla Kumar Choubey, Xin Su, Man Luo + 9 more2026-03-03💬 cs.CL

Polynomial, trigonometric, and tropical activations

Dit artikel introduceert en valideert een nieuwe familie van activeringsfuncties gebaseerd op orthonormale bases, waaronder polynomen en trigonometrische functies, die door middel van eenvoudige initialisatie stabiel kunnen worden getraind in diepe modellen zoals GPT-2 en ConvNeXt zonder explosie of verdwijning van gradiënten, terwijl ze tevens nauwkeurige benaderingen bieden voor klassieke activeringen die nuttig zijn voor fine-tuning.

Ismail Khalfaoui-Hassani, Stefan Kesselheim2026-03-03💬 cs.CL

AStar: Boosting Multimodal Reasoning with Automated Structured Thinking

Het paper introduceert AStar, een trainingsvrije methode voor multimodaal redeneren die door het gebruik van aanpasbare 'thought cards' complexe visuele taken efficiënter oplost dan bestaande zoek- of post-trainingstechnieken, zoals blijkt uit de verbeterde prestaties op wiskundige benchmarks ten opzichte van GPT-4o.

Jinyang Wu, Mingkuan Feng, Guocheng Zhai + 7 more2026-03-03💬 cs.CL

← Vorige Volgende →