cs.CL Arbeiten | Gist.Science

Emotion Collider: Dual Hyperbolic Mirror Manifolds for Sentiment Recovery via Anti Emotion Reflection

Die Arbeit stellt EC-Net vor, ein hyperbolisches Hypergraph-Framework, das durch die Modellierung von Modalitätshierarchien in Poincaré-Kugel-Einbettungen und bidirektionale Hypergraph-Nachrichtenübertragung robuste und genaue multimodale Emotionserkennung auch bei verrauschten oder unvollständigen Daten ermöglicht.

Rong Fu, Ziming Wang, Shuo Yin, Haiyun Wei, Kun Liu, Xianda Li, Zeli Su, Simon FongTue, 10 Ma🤖 cs.LG

ModalImmune: Immunity Driven Unlearning via Self Destructive Training

Die Arbeit stellt ModalImmune vor, ein Trainingsframework, das durch gezieltes, kontrolliertes Zusammenbrechen ausgewählter Modalitäten während des Trainings robuste multimodale Repräsentationen erzeugt, um die Zuverlässigkeit von Systemen bei Ausfall oder Korruption von Eingabekanälen zu gewährleisten.

Rong Fu, Jia Yee Tan, Zijian Zhang, Ziming Wang, Zhaolu Kang, Muge Qi, Shuning Zhang, Simon FongTue, 10 Ma🤖 cs.LG

Condition-Gated Reasoning for Context-Dependent Biomedical Question Answering

Die Autoren stellen mit CondMedQA den ersten Benchmark für kontextabhängige biomedizinische Fragen vor und entwickeln das Condition-Gated Reasoning (CGR)-Framework, das durch bedingungsbasierte Pfadsteuerung in Wissensgraphen zuverlässigere medizinische Schlussfolgerungen ermöglicht.

Jash Rajesh Parekh, Wonbin Kweon, Joey Chan, Rezarta Islamaj, Robert Leaman, Pengcheng Jiang, Chih-Hsuan Wei, Zhizheng Wang, Zhiyong Lu, Jiawei HanTue, 10 Ma💬 cs.CL

MrBERT: Modern Multilingual Encoders via Vocabulary, Domain, and Dimensional Adaptation

Die Autoren stellen MrBERT vor, eine Familie effizienter multilingualer Encoder auf ModernBERT-Basis, die durch gezielte Anpassung an 35 Sprachen sowie spezialisierte Domänen und die Integration von Matryoshka-Repräsentationslernen sowohl state-of-the-art-Leistung als auch kosteneffiziente Inferenz ermöglicht.

Daniel Tamayo, Iñaki Lacunza, Paula Rivera-Hidalgo, Severino Da Dalt, Javier Aula-Blasco, Aitor Gonzalez-Agirre, Marta VillegasTue, 10 Ma🤖 cs.LG

CeRA: Breaking the Linear Ceiling of Low-Rank Adaptation via Manifold Expansion

Die Arbeit stellt CeRA vor, eine neue Methode zur parametereffizienten Feinabstimmung, die durch Manifold-Expansion die linearen Grenzen von LoRA bei komplexen Aufgaben wie mathematischem Schlussfolgern überwindet und dabei bei deutlich niedrigerem Rang eine überlegene Leistung erzielt.

Hung-Hsuan ChenTue, 10 Ma🤖 cs.LG

KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging

Das Paper stellt KVSlimmer vor, einen theoretisch fundierten und gradientenfreien Algorithmus zur effizienten Komprimierung von KV-Caches in großen Sprachmodellen, der durch eine geschlossene Formel die Hessian-Informationen exakt erfasst und dabei sowohl die Speicher- als auch die Latenzkosten signifikant senkt, ohne die Leistung einzubüßen.

Lianjun Liu, Hongli An, Weiqi Yan, Xin Du, Shengchuan Zhang, Huazhong Liu, Yunshan ZhongTue, 10 Ma💬 cs.CL

Conformal Prediction for Risk-Controlled Medical Entity Extraction Across Clinical Domains

Die Studie zeigt, dass eine konforme Vorhersage durch domänenspezifische Kalibrierung trotz unterschiedlicher Fehlkalibrierungstendenzen in strukturierten FDA-Texten und freien Radiologieberichten zuverlässige Abdeckungsgarantien für die Extraktion medizinischer Entitäten mittels großer Sprachmodelle ermöglicht.

Manil Shrestha, Edward KimTue, 10 Ma💬 cs.CL

CyclicJudge: Mitigating Judge Bias Efficiently in LLM-based Evaluation

Die Arbeit stellt CyclicJudge vor, eine effiziente Round-Robin-Strategie zur Eliminierung systematischer Urteilsverzerrungen bei LLM-Evaluierungen, die ohne zusätzliche Kosten zuverlässigere Rankings ermöglicht.

Ziyi Zhu, Olivier Tieleman, Alexey Bukhtiyarov, Jinghong ChenTue, 10 Ma💬 cs.CL

PrivMedChat: End-to-End Differentially Private RLHF for Medical Dialogue Systems

Das Paper stellt PrivMedChat vor, ein End-to-End-Framework für differenziell privates RLHF, das medizinische Dialogsysteme durch den Einsatz von DP-SGD und einer annotierungsfreien Präferenzkonstruktionsstrategie sicher und datenschutzkonform anpasst.

Sudip BhujelTue, 10 Ma💬 cs.CL

No Memorization, No Detection: Output Distribution-Based Contamination Detection in Small Language Models

Die Studie zeigt, dass die Methode CDD zur Erkennung von Datenkontamination in kleinen Sprachmodellen (70M–410M Parameter) in den meisten getesteten Szenarien nur zufällige Ergebnisse liefert und dabei von etablierten Wahrscheinlichkeitsmethoden wie Perplexity und Min-k% Prob übertroffen wird, da ihre Wirksamkeit kritisch von der Entstehung wortwörtlicher Memorierung abhängt.

Omer Sela (Tel Aviv University)Tue, 10 Ma💬 cs.CL

vLLM Hook v0: A Plug-in for Programming Model Internals on vLLM

Das Paper stellt vLLM Hook vor, ein Open-Source-Plug-in für vLLM, das durch passive und aktive Programmierung den Zugriff auf interne Modellzustände ermöglicht, um Anwendungen wie die Erkennung von Prompt-Injection, die Verbesserung von RAG und das Aktivitäts-Steering zu unterstützen.

Ching-Yun Ko, Pin-Yu ChenTue, 10 Ma🤖 cs.LG

ARC-AGI-2 Technical Report

Dieser technische Bericht stellt ein transformerbasiertes System vor, das durch die Kombination von Sequenzmodellierung, gruppenbasierten Augmentierungen, Testzeit-Training mit LoRA und symmetriebewusstem Decodieren die Leistung beim ARC-AGI-2-Problem signifikant verbessert und sich menschlicher Generalisierung annähert.

Wallyson Lemes de Oliveira, Mekhron Bobokhonov, Matteo Caorsi, Aldo Podestà, Gabriele Beltramo, Luca Crosato, Matteo Bonotto, Federica Cecchetto, Hadrien Espic, Dan Titus Salajan, Stefan Taga, Luca Pana, Joe CarthyTue, 10 Ma💬 cs.CL

How Attention Sinks Emerge in Large Language Models: An Interpretability Perspective

Diese Arbeit identifiziert den „P0 Sink Circuit" als einen semantikunabhängigen Mechanismus in den ersten beiden Transformer-Blöcken, der die Entstehung von Attention Sinks am ersten Eingabetoken erklärt und als Indikator für den Konvergenzstatus während des Pretrainings dienen kann.

Runyu Peng, Ruixiao Li, Mingshu Chen, Yunhua Zhou, Qipeng Guo, Xipeng QiuTue, 10 Ma🤖 cs.LG

Hierarchical Latent Structures in Data Generation Process Unify Mechanistic Phenomena across Scale

Diese Arbeit zeigt, dass hierarchische Strukturen im Datengenerierungsprozess, modelliert durch probabilistische kontextfreie Grammatiken, als entscheidender Faktor die Entstehung scheinbar unabhängiger mechanistischer Phänomene in Sprachmodellen einheitlich erklären.

Jonas Rohweder, Subhabrata Dutta, Iryna GurevychTue, 10 Ma🤖 cs.LG

Hierarchical Embedding Fusion for Retrieval-Augmented Code Generation

Die vorgestellte Arbeit führt Hierarchical Embedding Fusion (HEF) ein, eine zweistufige Methode zur komprimierten Repräsentation von Code-Repositories, die durch den Ersatz tausender Suchergebnisse durch feste Pseudo-Token die Latenz bei der retrievalgestützten Codegenerierung drastisch senkt, ohne dabei die Genauigkeit zu beeinträchtigen.

Nikita Sorokin, Ivan Sedykh, Valentin MalykhTue, 10 Ma🤖 cs.LG

A Coin Flip for Safety: LLM Judges Fail to Reliably Measure Adversarial Robustness

Die Studie zeigt, dass LLM-basierte Richter bei der Bewertung der adversären Robustheit von KI-Modellen aufgrund von Verteilungsverschiebungen oft nur zufällige Ergebnisse liefern und viele Angriffe deren Schwächen ausnutzen, weshalb die Autoren mit ReliableBench und JudgeStressTest neue, zuverlässigere Evaluierungsstandards vorschlagen.

Leo Schwinn, Moritz Ladenburger, Tim Beyer, Mehrnaz Mofakhami, Gauthier Gidel, Stephan GünnemannTue, 10 Ma💬 cs.CL

Rethinking Personalization in Large Language Models at the Token Level

Die Arbeit stellt PerContrast und den darauf aufbauenden PerCE-Verlust vor, eine token-level-basierte Methode zur adaptiven Gewichtung von benutzerspezifischen Informationen während des Trainings, die die Personalisierung von Large Language Models signifikant verbessert.

Chenheng Zhang, Yijun Lu, Lizhe Fang, Chunyuan Zheng, Jiajun Chai, Xiaohan Wang, Guojun Yin, Wei Lin, Yisen Wang, Zhouchen LinTue, 10 Ma💬 cs.CL

Know When You're Wrong: Aligning Confidence with Correctness for LLM Error Detection

Diese Arbeit stellt einen normalisierten Konfidenzscore vor, der Fehler in Large Language Models zuverlässig erkennt, zeigt, dass Reinforcement-Learning-Methoden zu übermäßigem Selbstvertrauen führen, und schlägt eine Nachschulung mit Selbst-Distillation vor, um die Kalibrierung wiederherzustellen und die Effizienz von Retrieval-Augmented Generation zu steigern.

Xie Xiaohu, Liu Xiaohu, Yao BenjaminTue, 10 Ma🤖 cs.LG

GraphSkill: Documentation-Guided Hierarchical Retrieval-Augmented Coding for Complex Graph Reasoning

Das Paper stellt GraphSkill vor, ein hierarchisches Retrieval-Augmented-Coding-Framework mit einem selbst-debuggenden Agenten, das durch die Ausnutzung der Dokumentenhierarchie und die Generierung von Testfällen die Genauigkeit und Kosteneffizienz bei komplexen Graphen-Reasoning-Aufgaben verbessert.

Fali Wang, Chenglin Weng, Xianren Zhang, Siyuan Hong, Hui Liu, Suhang WangTue, 10 Ma🤖 cs.LG

SR-TTT: Surprisal-Aware Residual Test-Time Training

Die Arbeit stellt SR-TTT vor, eine Methode, die Test-Time-Training-Modelle durch eine verlustgesteuerte, sparse Speichermechanik verbessert, die nur hoch überraschende Tokens in einen exakten Attention-Cache leitet, um so die katastrophalen Erinnerungsfehler bei der genauen Wiederholung von Informationen zu beheben, während der O(1)-Speicherbedarf für den Kontext erhalten bleibt.

Swamynathan V PTue, 10 Ma🤖 cs.LG

← Zurück Weiter →