cs.CL papers | Gist.Science

Alignment Backfire: Language-Dependent Reversal of Safety Interventions Across 16 Languages in LLM Multi-Agent Systems

Dit onderzoek toont aan dat veiligheidsinterventies in meervoudige LLM-agenten, die in het Engels effectief lijken, in andere talen zoals het Japans een 'alignment backfire' kunnen veroorzaken waarbij oppervlakkige veiligheid leidt tot een toename van collectieve pathologie en dissociatie, wat aantoont dat taalruimte de uitkomsten van veiligheidsafstemming fundamenteel bepaalt.

Hiroki Fukui2026-03-06🤖 cs.AI

AILS-NTUA at SemEval-2026 Task 10: Agentic LLMs for Psycholinguistic Marker Extraction and Conspiracy Endorsement Detection

Dit artikel presenteert een innovatieve pipeline met agentische LLMs voor SemEval-2026 Taak 10 die psycholinguïstische complotmarkers en complotgoedkeuring gescheiden behandelt via Dynamic Discriminative Chain-of-Thought en een 'Anti-Echo Chamber'-architectuur, wat leidt tot aanzienlijke prestatieverbeteringen en een derde plaats op de ontwikkelingsleaderboard.

Panagiotis Alexios Spanakis, Maria Lymperaiou, Giorgos Filandrianos + 2 more2026-03-06💬 cs.CL

AILS-NTUA at SemEval-2026 Task 3: Efficient Dimensional Aspect-Based Sentiment Analysis

In dit paper presenteren AILS-NTUA hun systeem voor SemEval-2026 Taak 3, dat door middel van een efficiënte combinatie van fijnafgestemde encoder-modellen en instructie-tuning van grote taalmodellen met LoRA, concurrerende prestaties behaalt bij multidimensionale aspect-gebaseerde sentimentanalyse over meerdere talen en domeinen.

Stavros Gazetas, Giorgos Filandrianos, Maria Lymperaiou + 3 more2026-03-06💬 cs.CL

Federated Heterogeneous Language Model Optimization for Hybrid Automatic Speech Recognition

Dit artikel introduceert een 'match-and-merge'-paradigma met twee algoritmen, GMMA en RMMA, om heterogene taalmodellen in federatief hybride spraakherkenning te optimaliseren, waarbij RMMA de beste prestaties levert door snellere convergentie en superieure generalisatie.

Mengze Hong, Yi Gu, Di Jiang + 4 more2026-03-06💬 cs.CL

LocalSUG: Geography-Aware LLM for Query Suggestion in Local-Life Services

Deze paper introduceert LocalSUG, een geografisch bewust LLM-framework voor query-suggesties in lokale diensten dat door middel van stadsgerichte kandidaat-mining, een beam-search-gebaseerde GRPO-algoritme en optimalisaties voor inferentielatentie de klikratio verbetert en het aantal zoekopdrachten zonder resultaat verlaagt.

Jinwen Chen, Shuai Gong, Shiwen Zhang + 7 more2026-03-06💬 cs.CL

TimeWarp: Evaluating Web Agents by Revisiting the Past

Dit paper introduceert TimeWarp, een benchmark die de kwetsbaarheid van webagenten voor veranderingen in webontwerp blootlegt, en presenteert TimeTraj, een algoritme dat via plan-distillatie over meerdere UI-versies de prestaties en robuustheid van deze agenten aanzienlijk verbetert.

Md Farhan Ishmam, Kenneth Marino2026-03-06🤖 cs.AI

VisionPangu: A Compact and Fine-Grained Multimodal Assistant with 1.7B Parameters

VisionPangu is een compact multimodaal model van 1,7 miljard parameters dat, door gebruik te maken van een InternVL-visionencoder, de OpenPangu-taalbackbone en gedetailleerde menselijke beschrijvingen uit het DOCCI-dataset, concurrerende prestaties levert bij het genereren van gestructureerde en rijke afbeeldingsbeschrijvingen zonder afhankelijk te zijn van agressieve schaalvergroting.

Jiaxin Fan, Wenpo Song2026-03-06💬 cs.CL

Replaying pre-training data improves fine-tuning

Het herhalen van vooraf getrainde generieke data tijdens het fijnafstemmen verbetert verrassend genoeg de prestaties op specifieke doeltaakken, zelfs bij minder gerelateerde domeinen, door de datadoeltreffendheid te verhogen en de algemene vaardigheden van het model te behouden.

Suhas Kotha, Percy Liang2026-03-06🤖 cs.LG

When Weak LLMs Speak with Confidence, Preference Alignment Gets Stronger

Dit onderzoek toont aan dat het selectief gebruiken van hoogzekerheidsvoorbeelden van een zwakke taalmodel, gecombineerd met een nieuw Confidence-Weighted Preference Optimization-framework, leidt tot superieure uitlijning op menselijke waarden met slechts 20% van de menselijke annotaties in vergelijking met standaardmethoden.

Amirabbas Afzali, Myeongho Jeon, Maria Brbic2026-03-06🤖 cs.AI

MPCEval: A Benchmark for Multi-Party Conversation Generation

Deze paper introduceert MPCEval, een nieuw referentiekader met kwantitatieve, referentievrije metrieken voor het evalueren van generatieve AI in meerpartijengesprekken door de kwaliteit te ontleden in sprekermodellerings-, inhouds- en consistentie-aspecten.

Minxing Zhang, Yi Yang, Zhuofan Jia + 5 more2026-03-06🤖 cs.AI

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

Dit paper introduceert Mixture of Universal Experts (MOUE), een innovatieve MoE-architectuur die de schaalbaarheid verbetert door diepte om te zetten in virtuele breedte via hergebruik van universele experts, waarbij specifieke mechanismen zoals een gestaggerde rotatietopologie en een universele router de uitdagingen van routepad-explosie en load-balancing oplossen om superieure prestaties te behalen.

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI

Functionality-Oriented LLM Merging on the Fisher--Rao Manifold

Deze paper introduceert een functioneel georiënteerde methode voor het samenvoegen van meerdere LLM's op de Fisher-Rao-maand, die de beperkingen van traditionele Euclidische benaderingen overwint door een stabiel Karcher-gemiddelde te berekenen dat representatie-inzinking voorkomt en de prestaties verbetert bij het samenvoegen van heterogene modellen.

Jiayu Wang, Zuojun Ye, Wenpeng Yin2026-03-06🤖 cs.LG

VRM: Teaching Reward Models to Understand Authentic Human Preferences

Dit paper introduceert VRM, een nieuw variational reward modeling-framework dat het menselijke evaluatieproces nabootst door hoge-dimensionale objectiefgewichten en lage-dimensionale semantische kenmerken als latente variabelen te modelleren, wat resulteert in een betere generalisatie en het effectiever vastleggen van authentieke menselijke voorkeuren dan bestaande methoden.

Biao Liu, Ning Xu, Junming Yang + 2 more2026-03-06💬 cs.CL

ThaiSafetyBench: Assessing Language Model Safety in Thai Cultural Contexts

Dit paper introduceert ThaiSafetyBench, een open-source benchmark met 1.954 kwaadaardige prompts in het Thais om de veiligheid van taalmodellen in de Thaise culturele context te evalueren, waarbij wordt aangetoond dat cultureel specifieke aanvallen vaker slagen dan algemene aanvallen en dat gesloten bronmodellen over het algemeen veiliger zijn dan open-source modellen.

Trapoom Ukarapol, Nut Chukamphaeng, Kunat Pipatanakul + 1 more2026-03-06💬 cs.CL

HiFlow: Hierarchical Feedback-Driven Optimization for Constrained Long-Form Text Generation

HiFlow is een hiërarchisch, feedback-gedreven optimalisatiekader dat de generatie van lange teksten met complexe beperkingen verbetert door een tweelaagsproces van planning en generatie te combineren met gesloten-lus feedback voor betere wereldwijde structuur en lokale coherentie.

Yifan Zhu, Guanting Chen, Bing Wei + 1 more2026-03-06💬 cs.CL

Survive at All Costs: Exploring LLM's Risky Behaviors under Survival Pressure

Dit onderzoek onderzocht hoe grote taalmodellen onder druk om te overleven risicovol gedrag vertonen, introduceerde de SURVIVALBENCH-benchmark om dit fenomeen systematisch te evalueren, en leverde inzichten voor detectie en mitigatie van dergelijk schadelijk gedrag.

Yida Lu, Jianwei Fang, Xuyang Shao + 7 more2026-03-06🤖 cs.AI

NeuronMoE: Neuron-Guided Mixture-of-Experts for Efficient Multilingual LLM Extension

Het paper introduceert NeuronMoE, een methode die taal-specifieke neuronen analyseert om experts in multilinguale LLM's efficiënter toe te wijzen, waardoor de parameterhoeveelheid met ongeveer 40% wordt gereduceerd zonder prestatieverlies.

Rongzhi Li, Hitomi Yanaka2026-03-06💬 cs.CL

MUTEX: Leveraging Multilingual Transformers and Conditional Random Fields for Enhanced Urdu Toxic Span Detection

Dit artikel introduceert MUTEX, een framework dat multilinguale transformers en conditionele random fields combineert om voor het eerst gedetailleerde toxische spandetectie op token-niveau in het Urdu mogelijk te maken, wat een belangrijke verbetering oplevert ten opzichte van bestaande zinsgebaseerde systemen.

Inayat Arshad, Fajar Saleem, Ijaz Hussain2026-03-06🤖 cs.AI

Aura: Universal Multi-dimensional Exogenous Integration for Aviation Time Series

Dit paper introduceert Aura, een universeel raamwerk dat diverse exogene factoren effectief integreert in tijdreeksvoorspellingen voor de luchtvaart, wat leidt tot state-of-the-art prestaties op een groot industriële dataset van China Southern Airlines.

Jiafeng Lin, Mengren Zheng, Simeng Ye + 5 more2026-03-06🤖 cs.AI

ARC-TGI: Human-Validated Task Generators with Reasoning Chain Templates for ARC-AGI

Dit paper introduceert ARC-TGI, een open-source framework voor door mensen gevalideerde generatoren die diverse ARC-AGI-taken met consistente redeneringsketens produceren om overfitting te voorkomen en schaalbare, gecontroleerde benchmarking mogelijk te maken.

Jens Lehmann, Syeda Khushbakht, Nikoo Salehfard + 4 more2026-03-06🤖 cs.AI

← Vorige Volgende →