cs.CL Arbeiten | Gist.Science

Entropic-Time Inference: Self-Organizing Large Language Model Decoding Beyond Attention

Die Arbeit stellt ein neues Paradigma namens „entropic-time inference" vor, das die LLM-Inferenz durch eine selbstorganisierende Architektur steuert, welche Scheduling, Aufmerksamkeitsverdünnung und Temperatursteuerung über ein einheitliches Entropie-Ziel vereint, um die Berechnung dort zu priorisieren, wo die Unsicherheitsreduktion maximal ist.

Andrew Kiruluta2026-03-05🤖 cs.LG

The Logovista English-Japanese Machine Translation System

Dieser Artikel dokumentiert die Architektur, Entwicklung und bewahrten Artefakte des kommerziell eingesetzten, regelbasierten Logovista-Übersetzungssystems für Englisch-Japanisch, das von den frühen 1990er Jahren bis mindestens 2012 durch handgeschriebene Regeln, ein zentrales Wörterbuch und chart-basiertes Parsing kontinuierlich an praktische Anforderungen angepasst wurde.

Barton D. Wright2026-03-05💬 cs.CL

Escaping the BLEU Trap: A Signal-Grounded Framework with Decoupled Semantic Guidance for EEG-to-Text Decoding

Die Arbeit stellt SemKey vor, ein neuartiges Framework zur EEG-zu-Text-Decodierung, das durch die Entkopplung semantischer Ziele und eine signalgefundene Architektur die häufigen Probleme von Halluzinationen und der irreführenden BLEU-Metrik überwindet, um eine präzisere und diversere Sprachgenerierung aus neuronalen Signalen zu erreichen.

Yuchen Wang, Haonan Wang, Yu Guo + 2 more2026-03-05🤖 cs.AI

How does fine-tuning improve sensorimotor representations in large language models?

Die Studie zeigt, dass eine aufgabenspezifische Feinabstimmung die sensorischen und motorischen Repräsentationen in großen Sprachmodellen verbessern und die Lücke zu menschlichen Erfahrungen schließen kann, wobei diese Verbesserungen zwar sprachübergreifend generalisieren, aber stark vom Lernziel abhängen und nicht auf völlig unterschiedliche Aufgabenformate übertragbar sind.

Minghua Wu, Javier Conde, Pedro Reviriego + 1 more2026-03-05🤖 cs.AI

Towards Self-Robust LLMs: Intrinsic Prompt Noise Resistance via CoIPO

Die Autoren stellen CoIPO, eine kontrastive Lernmethode zur Inverse Direct Preference Optimization, vor, die die inhärente Robustheit von Large Language Models gegenüber Prompt-Rauschen erhöht und dabei externe Vorverarbeitung vermeidet.

Xin Yang, Letian Li, Abudukelimu Wuerkaixi + 5 more2026-03-05🤖 cs.AI

M-QUEST -- Meme Question-Understanding Evaluation on Semantics and Toxicity

Die Arbeit stellt M-QUEST vor, ein semantisches Framework und Benchmark mit 609 Frage-Antwort-Paaren, das die automatische Extraktion von Wissen aus Memes zur Bewertung von Toxizität und Semantik ermöglicht und die Leistung von Large Language Models in diesem multimodalen Kontext evaluiert.

Stefano De Giorgis, Ting-Chih Chen, Filip Ilievski2026-03-05🤖 cs.AI

The Influence of Iconicity in Transfer Learning for Sign Language Recognition

Die Studie zeigt, dass der Transferlernen-Ansatz für die Gebärdenzeichenerkennung durch die Nutzung ikonischer Ähnlichkeiten zwischen verschiedenen Zeichensprachen (z. B. Chinesisch zu Arabisch und Griechisch zu Flämisch) signifikante Leistungsverbesserungen erzielt, wobei Mediapipe-Features mit MLP- und GRU-Architekturen verarbeitet wurden.

Keren Artiaga, Conor Lynch, Haithem Afli + 1 more2026-03-05🤖 cs.AI

Retcon -- a Prompt-Based Technique for Precise Control of LLMs in Conversations

Die Arbeit stellt Retcon vor, eine Few-Shot-Prompting-Technik, die eine präzise Steuerung von Large Language Models auf Ebene einzelner Gesprächsdurchgänge ermöglicht und dabei deutlich besser abschneidet als Zero-Shot- oder traditionelle Few-Shot-Ansätze.

David Kogan, Sam Nguyen, Masanori Suzuki + 1 more2026-03-05💬 cs.CL

Quantum-Inspired Self-Attention in a Large Language Model

Die Autoren stellen einen klassischen, quanteninspirierten Selbstaufmerksamkeitsmechanismus (QISA) vor, der erstmals in ein GPT-1-Sprachmodell integriert wurde und im Vergleich zum Standardansatz eine deutlich verbesserte Leistung bei gleichzeitig moderat erhöhter Inferenzzeit erzielt.

Nikita Kuznetsov, Niyaz Ismagilov, Ernesto Campos2026-03-05⚛️ quant-ph

Automated Concept Discovery for LLM-as-a-Judge Preference Analysis

Diese Arbeit stellt eine Methode zur automatischen Entdeckung von Konzepten mittels Sparse Autoencodern vor, die es ermöglicht, die systematischen Verzerrungen und Präferenzen von LLMs als Richter ohne vordefinierte Taxonomien zu analysieren und dabei sowohl bekannte als auch neue Bias-Trends im Vergleich zu menschlichen Bewertungen aufzudecken.

James Wedgwood, Chhavi Yadav, Virginia Smith2026-03-05🤖 cs.AI

From We to Me: Theory Informed Narrative Shift with Abductive Reasoning

Die Autoren stellen einen neurosymbolischen Ansatz vor, der soziale Wissenschaftstheorien und abduktives Reasoning nutzt, um Large Language Models bei der präzisen und inhaltsgetreuen Transformation von Texten zwischen kollektivistischen und individualistischen Narrativen signifikant zu verbessern.

Jaikrishna Manojkumar Patil, Divyagna Bavikadi, Kaustuv Mukherji + 5 more2026-03-05🤖 cs.AI

DIALEVAL: Automated Type-Theoretic Evaluation of LLM Instruction Following

Das Paper stellt DIALEVAL vor, ein auf Typentheorie basierendes Framework mit dualen LLM-Agenten, das Anweisungen automatisch in verifizierbare Prädikate zerlegt und durch differenzierte, dem menschlichen Urteil entsprechende Kriterien sowie kontextbewusste Funktionen eine präzisere und korrelierendere Evaluierung von LLM-Anweisungsfolgen in komplexen Dialogen ermöglicht.

Nardine Basta, Dali Kaafar2026-03-05🤖 cs.AI

Can Large Language Models Derive New Knowledge? A Dynamic Benchmark for Biological Knowledge Discovery

Die Studie stellt DBench-Bio vor, ein dynamisches und vollautomatisiertes Benchmark-System, das die Fähigkeit von KI-Modellen zur Entdeckung neuen biologischen Wissens durch einen monatlich aktualisierten, dreistufigen Pipeline-Ansatz bewertet und dabei die Grenzen bestehender statischer Datensätze überwindet.

Chaoqun Yang, Xinyu Lin, Shulin Li + 4 more2026-03-05🤖 cs.AI

Discern Truth from Falsehood: Reducing Over-Refusal via Contrastive Refinement

Die Arbeit stellt DCR (Discernment via Contrastive Refinement) vor, eine neue Ausrichtungsphase, die durch kontrastives Feinabstimmen die Überverweigerung von Large Language Models reduziert, indem sie zwischen tatsächlich toxischen und nur scheinbar toxischen Eingaben präziser unterscheidet, ohne dabei die allgemeine Sicherheit oder Leistungsfähigkeit des Modells zu beeinträchtigen.

Yuxiao Lu, Lin Xu, Yang Sun + 2 more2026-03-05🤖 cs.AI

Controlling Chat Style in Language Models via Single-Direction Editing

Diese Arbeit stellt eine rechnerisch effiziente, trainingsfreie Methode vor, die auf der Entdeckung linearer Richtungen im Aktivierungsraum von Sprachmodellen basiert, um stilistische Attribute präzise zu steuern, ohne die Kernfähigkeiten der Modelle zu beeinträchtigen.

Zhenyu Xu, Victor S. Sheng2026-03-05🤖 cs.AI

IntPro: A Proxy Agent for Context-Aware Intent Understanding via Retrieval-conditioned Inference

Das Paper stellt IntPro vor, einen Proxy-Agenten, der durch retrieval-basierte Inferenz und gezieltes Training den Kontext sowie individuelle Intentionsmuster nutzt, um das Intentionsverständnis von Large Language Models in Mensch-KI-Interaktionen zu verbessern.

Guanming Liu, Meng Wu, Peng Zhang + 8 more2026-03-05🤖 cs.AI

Controllable and explainable personality sliders for LLMs at inference time

Diese Arbeit stellt einen modularen Rahmen mit Sequential Adaptive Steering (SAS) vor, der durch die Orthogonalisierung von Lenkvektoren eine effiziente, parametrische und gleichzeitig erklärbare Steuerung mehrerer Persönlichkeitsmerkmale in LLMs zur Inferenzzeit ermöglicht, ohne dass ein erneutes Training erforderlich ist.

Florian Hoppe, David Khachaturov, Robert Mullins + 1 more2026-03-05🤖 cs.AI

A benchmark for joint dialogue satisfaction, emotion recognition, and emotion state transition prediction

Dieses Paper stellt ein neues mehrsprachiges, mehrstufiges chinesisches Dialogdatenset vor, das die gleichzeitige Vorhersage von Zufriedenheit, Emotionserkennung und emotionalen Zustandsübergängen ermöglicht, um die Limitationen bestehender Ressourcen zu überwinden und die Dynamik von Benutzeremotionen in Dialogsystemen besser zu erfassen.

Jing Bian, Haoxiang Su, Liting Jiang + 6 more2026-03-05🤖 cs.AI

StructLens: A Structural Lens for Language Models via Maximum Spanning Trees

Die Arbeit stellt StructLens vor, ein analytisches Framework, das mittels maximaler Spannbaumstrukturen in den semantischen Restströmen von Sprachmodellen globale inter-layer Beziehungen aufdeckt und damit sowohl ein neues Ähnlichkeitsmaß als auch praktische Vorteile für Aufgaben wie das Layer-Pruning bietet.

Haruki Sakajo, Frederikus Hudi, Yusuke Sakai + 2 more2026-03-05🤖 cs.AI

AutoHarness: improving LLM agents by automatically synthesizing a code harness

Die Arbeit stellt AutoHarness vor, ein Verfahren, bei dem ein kleineres Sprachmodell durch automatische Synthese und iterative Verfeinerung eines Code-Harnesses oder einer vollständigen Policy so verbessert wird, dass es in TextArena-Spielen größere Modelle wie Gemini-2.5-Pro und GPT-5.2-High sowohl in der Leistung als auch in der Kosteneffizienz übertrifft.

Xinghua Lou, Miguel Lázaro-Gredilla, Antoine Dedieu + 3 more2026-03-05🤖 cs.AI

← Zurück Weiter →