cs.CL papers | Gist.Science

Emotion Collider: Dual Hyperbolic Mirror Manifolds for Sentiment Recovery via Anti Emotion Reflection

Het artikel introduceert Emotion Collider (EC-Net), een hyperbolisch hypergraafkader dat hiërarchische modale relaties en bidirectionele berichtuitwisseling combineert met contrastief leren om robuuste en nauwkeurige sentimentherstelmodellen te realiseren, zelfs bij aanwezigheid van ruis of ontbrekende modaliteiten.

Rong Fu, Ziming Wang, Shuo Yin, Haiyun Wei, Kun Liu, Xianda Li, Zeli Su, Simon FongTue, 10 Ma🤖 cs.LG

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

Dit artikel introduceert ModalImmune, een trainingskader dat multimodale systemen robuust maakt tegen het verlies of de corruptie van invoerkanaal door middel van gecontroleerde, zelfdestructieve training die leidt tot stabiele en herstelbare gezamenlijke representaties.

Rong Fu, Jia Yee Tan, Zijian Zhang, Ziming Wang, Zhaolu Kang, Muge Qi, Shuning Zhang, Simon FongTue, 10 Ma🤖 cs.LG

Condition-Gated Reasoning for Context-Dependent Biomedical Question Answering

Dit paper introduceert CondMedQA, het eerste benchmark voor conditioneel biomedisch vragen beantwoorden, en Condition-Gated Reasoning (CGR), een nieuw raamwerk dat kennisgrafiek-paden selectief activeert of verwijdert op basis van patiëntspecifieke omstandigheden om de betrouwbaarheid van medische redenering te verbeteren.

Jash Rajesh Parekh, Wonbin Kweon, Joey Chan, Rezarta Islamaj, Robert Leaman, Pengcheng Jiang, Chih-Hsuan Wei, Zhizheng Wang, Zhiyong Lu, Jiawei HanTue, 10 Ma💬 cs.CL

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

Deze paper introduceert MrBERT, een familie van moderne meertalige encodermodellen die door middel van vocabulaire-, domein- en dimensionale aanpassing, inclusief Matryoshka Representation Learning, state-of-the-art prestaties bereikt op Catalaanse en Spaanse taken en gespecialiseerde domeinen zoals biomedische en juridische toepassingen.

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta VillegasTue, 10 Ma🤖 cs.LG

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

Dit paper introduceert CeRA, een parameter-efficiënte fine-tuning-methode die door middel van SiLU-gating en structurele dropout de lineaire beperkingen van LoRA doorbreekt en zo superieure prestaties bereikt op complexe redeneertaken door de dormantie van het singuliere waarden-spectrum te activeren.

Hung-Hsuan ChenTue, 10 Ma🤖 cs.LG

KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging

Dit paper introduceert KVSlimmer, een theoretisch onderbouwde en gradient-vrije methode voor asymmetrische KV-merging die de prestaties van grote taalmodellen verbetert door de spectrale energie van projectiegewichten te analyseren, waardoor zowel de geheugengebruik als de latentie aanzienlijk worden verlaagd zonder in te leveren op kwaliteit.

Lianjun Liu, Hongli An, Weiqi Yan, Xin Du, Shengchuan Zhang, Huazhong Liu, Yunshan ZhongTue, 10 Ma💬 cs.CL

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

Deze studie introduceert een conformal prediction-framework dat, ondanks variaties in modelkalibratie tussen gestructureerde FDA-documenten en vrije radiologieteksten, betrouwbare coverage-garanties biedt voor veilige medische entiteitsextractie met grote taalmodellen in klinische toepassingen.

Manil Shrestha, Edward KimTue, 10 Ma💬 cs.CL

CyclicJudge: Mitigating Judge Bias Efficiently in LLM-based Evaluation

Dit paper introduceert CyclicJudge, een efficiënte round-robin strategie die systematische beoordelaarsbias in LLM-evaluaties elimineert zonder extra kosten, door de variantie van benchmarkscores te ontleden en de bias precies op te heffen.

Ziyi Zhu, Olivier Tieleman, Alexey Bukhtiyarov, Jinghong ChenTue, 10 Ma💬 cs.CL

PrivMedChat: End-to-End Differentially Private RLHF for Medical Dialogue Systems

Dit paper introduceert PrivMedChat, een end-to-end framework voor differentieel private RLHF dat medische chatbots veilig en effectief afstemt op klinische dialogen zonder gevoelige patiëntgegevens te onthullen.

Sudip BhujelTue, 10 Ma💬 cs.CL

No Memorization, No Detection: Output Distribution-Based Contamination Detection in Small Language Models

Dit onderzoek concludeert dat de methode CDD voor het detecteren van datacontaminatie in kleine taalmodellen (70M-410M parameters) over het algemeen niet effectiever is dan willekeur en dat probabilistische methoden zoals perplexiteit en Min-k% Prob in alle geteste scenario's superieure resultaten leveren.

Omer Sela (Tel Aviv University)Tue, 10 Ma💬 cs.CL

vLLM Hook v0: A Plug-in for Programming Model Internals on vLLM

Dit paper introduceert vLLM Hook, een open-source plug-in die programmabele toegang biedt tot de interne staten van vLLM-modellen, waardoor zowel passieve analyse als actieve interventie mogelijk wordt voor toepassingen zoals het detecteren van prompt-injecties en het verbeteren van RAG-systemen.

Ching-Yun Ko, Pin-Yu ChenTue, 10 Ma🤖 cs.LG

ARC-AGI-2 Technical Report

Dit paper introduceert een transformer-gebaseerd systeem dat de prestaties op ARC-AGI-2 aanzienlijk verbetert door neurale inferentie te combineren met structurele priors, test-tijd training en symmetrie-bewuste decoding om generalisatie buiten patroonherkenning te bereiken.

Wallyson Lemes de Oliveira, Mekhron Bobokhonov, Matteo Caorsi, Aldo Podestà, Gabriele Beltramo, Luca Crosato, Matteo Bonotto, Federica Cecchetto, Hadrien Espic, Dan Titus Salajan, Stefan Taga, Luca Pana, Joe CarthyTue, 10 Ma💬 cs.CL

How Attention Sinks Emerge in Large Language Models: An Interpretability Perspective

Dit onderzoek identificeert de 'P0 Sink Circuit' als een semantiek-onafhankelijk mechanisme dat in de eerste twee lagen van grote taalmodellen zorgt voor de vorming van een aandachtssink op het eerste token, wat dient als een indicator voor de convergentie van pre-training.

Runyu Peng, Ruixiao Li, Mingshu Chen, Yunhua Zhou, Qipeng Guo, Xipeng QiuTue, 10 Ma🤖 cs.LG

Hierarchical Latent Structures in Data Generation Process Unify Mechanistic Phenomena across Scale

Dit artikel toont aan dat hiërarchische structuren in het data-generatieproces de onderliggende oorzaak zijn van de opkomst van diverse mechanistische fenomenen in taalmodellen, en biedt een unificerende verklaring en synthetische hulpmiddelen voor interpretatieonderzoek.

Jonas Rohweder, Subhabrata Dutta, Iryna GurevychTue, 10 Ma🤖 cs.LG

Hierarchical Embedding Fusion for Retrieval-Augmented Code Generation

Dit paper introduceert Hierarchical Embedding Fusion (HEF), een tweestapsmethode die repository-informatie comprimeert naar een vaste set pseudo-tokens, waardoor de latency voor repository-gebaseerde codegeneratie aanzienlijk wordt verlaagd zonder in te leveren op de nauwkeurigheid.

Nikita Sorokin, Ivan Sedykh, Valentin MalykhTue, 10 Ma🤖 cs.LG

A Coin Flip for Safety: LLM Judges Fail to Reliably Measure Adversarial Robustness

Deze studie toont aan dat bestaande LLM-judges de robuustheid van AI-veiligheid tegen adversariale aanvallen onbetrouwbaar meten door distributieveranderingen en semantische ambiguïteit, waardoor veel succespercentages kunstmatig worden opgeblazen in plaats van echte schadelijkheid weer te geven.

Leo Schwinn, Moritz Ladenburger, Tim Beyer, Mehrnaz Mofakhami, Gauthier Gidel, Stephan GünnemannTue, 10 Ma💬 cs.CL

Rethinking Personalization in Large Language Models at the Token Level

Dit paper introduceert PerContrast en de bijbehorende PerCE-loss, een token-niveau methode die gebruikmaakt van causale interventie om de relevantie van tokens voor personalisatie te schatten en deze tijdens het trainen adaptief te versterken, wat leidt tot aanzienlijke prestatieverbeteringen bij gepersonaliseerde grote taalmodellen.

Chenheng Zhang, Yijun Lu, Lizhe Fang, Chunyuan Zheng, Jiajun Chai, Xiaohan Wang, Guojun Yin, Wei Lin, Yisen Wang, Zhouchen LinTue, 10 Ma💬 cs.CL

Know When You're Wrong: Aligning Confidence with Correctness for LLM Error Detection

Dit paper introduceert een genormaliseerde betrouwbaarheidsscore die fouten en hallucinaties in grote taalmodellen detecteert, en onthult dat supervisie fine-tuning (SFT) betere kalibratie biedt dan versterkingsleermethoden, terwijl het een post-RL SFT-strategie voorstelt om deze betrouwbaarheid te herstellen en efficiëntere retrieval-augmented generation (RAG) mogelijk te maken.

Xie Xiaohu, Liu Xiaohu, Yao BenjaminTue, 10 Ma🤖 cs.LG

GraphSkill: Documentation-Guided Hierarchical Retrieval-Augmented Coding for Complex Graph Reasoning

Dit paper introduceert GraphSkill, een agentisch raamwerk dat hiërarchische documentretrieval en zelf-debugging combineert om de kwaliteit en efficiëntie van codegeneratie voor complexe grafenredenering te verbeteren, ondersteund door een nieuw evaluatiedataset.

Fali Wang, Chenglin Weng, Xianren Zhang, Siyuan Hong, Hui Liu, Suhang WangTue, 10 Ma🤖 cs.LG

SR-TTT: Surprisal-Aware Residual Test-Time Training

Het artikel introduceert SR-TTT, een verbeterde Test-Time Training-architectuur die het probleem van vergeten cruciale informatie oplost door een verlies-gedreven, sparsere geheugenmechanisme toe te passen dat alleen onverwachte tokens naar een traditionele cache routeert, waardoor de O(1)-geheugenvoordeel behouden blijft terwijl de nauwkeurigheid bij exacte herinneringstaken wordt hersteld.

Swamynathan V PTue, 10 Ma🤖 cs.LG

← Vorige Volgende →