cs.CL Arbeiten | Gist.Science

Understanding and Mitigating Dataset Corruption in LLM Steering

Diese Studie untersucht die Robustheit von Contrastive Steering bei LLMs gegenüber Datenkorruption und zeigt, dass der Austausch der herkömmlichen Mittelwertberechnung durch einen robusten Schätzer die meisten negativen Auswirkungen böswilliger Manipulationen wirksam verhindert.

Cullen Anderson, Narmeen Oozeer, Foad Namjoo + 3 more2026-03-04💬 cs.CL

Density-Guided Response Optimization: Community-Grounded Alignment via Implicit Acceptance Signals

Die vorgestellte Arbeit führt die „Density-Guided Response Optimization" (DGRO) ein, eine Methode, die Sprachmodelle durch die Analyse impliziter Akzeptanzsignale und der daraus resultierenden geometrischen Dichtestrukturen im Repräsentationsraum an die Normen spezifischer Online-Communities anpasst, ohne dabei auf explizite Präferenzlabels angewiesen zu sein.

Patrick Gerard, Svitlana Volkova2026-03-04💬 cs.CL

Using Learning Progressions to Guide AI Feedback for Science Learning

Die Studie zeigt, dass ein von Lernprogressionen abgeleiteter automatischer Rubrik-Ansatz für KI-gestütztes Feedback in der Chemie vergleichbare Qualitätsmerkmale wie von Experten erstellte, aufgabenspezifische Rubriken liefert und somit eine skalierbare Alternative darstellt.

Xin Xia, Nejla Yuruk, Yun Wang + 1 more2026-03-04💬 cs.CL

Factuality Challenges in the Era of Large Language Models

Dieser Beitrag untersucht die durch Large Language Models verursachten Herausforderungen wie Halluzinationen und gezielte Desinformation und skizziert notwendige technologische, regulatorische und bildungspolitische Maßnahmen, um die Verlässlichkeit von Informationen im Zeitalter der generativen KI zu gewährleisten.

Isabelle Augenstein, Timothy Baldwin, Meeyoung Cha + 15 more2026-03-03💬 cs.CL

Using ChatGPT for Data Science Analyses

Diese Arbeit bewertet das Potenzial von ChatGPT als quantitativer Co-Pilot für Datenwissenschafts-Workflows, indem sie dessen Fähigkeiten in den Bereichen Datenexploration, Visualisierung sowie überwachtes und unüberwachtes Modellieren untersucht und dabei sowohl die Stärken als auch die Grenzen des Tools beleuchtet.

Ozan Evkaya, Miguel de Carvalho2026-03-03📊 stat

Large Language Model Agent in Financial Trading: A Survey

Diese Übersichtsarbeit bietet eine umfassende Analyse des aktuellen Forschungsstands zur Verwendung von Large-Language-Model-Agenten im Finanzhandel, indem sie deren Architekturen, Eingabedaten, Backtesting-Ergebnisse und Herausforderungen zusammenfasst sowie zukünftige Forschungsrichtungen aufzeigt.

Han Ding, Yinheng Li, Junhao Wang + 3 more2026-03-03💬 cs.CL

Scaling Knowledge Graph Construction through Synthetic Data Generation and Distillation

Die Arbeit stellt SynthKG und Distill-SynthKG vor, eine Pipeline zur synthetischen Datengenerierung und Modell-Distillation, die durch das Feinabstimmen kleinerer Modelle hochwertige Dokumenten-Wissensgraphen erzeugt und damit sowohl die Qualität als auch die Effizienz von Wissensgraphen-Konstruktion und Retrieval-Aufgaben im Vergleich zu größeren Baseline-Modellen signifikant verbessert.

Prafulla Kumar Choubey, Xin Su, Man Luo + 9 more2026-03-03💬 cs.CL

Polynomial, trigonometric, and tropical activations

Diese Arbeit stellt neue Aktivierungsfunktionen auf Basis orthogonaler Polynome, trigonometrischer Funktionen und tropischer Algebra vor, die durch varianzausgleichende Initialisierung das Training tiefer Modelle wie GPT-2 und ConvNeXt ohne Gradientenprobleme ermöglichen und sich zudem durch Hermite-Interpolation nahtlos zur Feinabstimmung an klassische Aktivierungen anpassen lassen.

Ismail Khalfaoui-Hassani, Stefan Kesselheim2026-03-03💬 cs.CL

AStar: Boosting Multimodal Reasoning with Automated Structured Thinking

Das Paper stellt AStar vor, ein trainingsfreies Paradigma für multimodales Reasoning, das durch adaptive, automatische Strukturierung mittels „Thought Cards" die Effizienz und Genauigkeit komplexer visueller Schlussfolgerungen ohne aufwendige Suche oder Nachtraining signifikant verbessert.

Jinyang Wu, Mingkuan Feng, Guocheng Zhai + 7 more2026-03-03💬 cs.CL

Enhancing Hallucination Detection through Noise Injection

Die Autoren stellen einen einfachen, trainingfreien Ansatz vor, der durch gezieltes Rauschen in Modellparametern oder Aktivierungen während des Sampling-Prozesses die Unsicherheit von Large Language Models besser erfasst und damit die Erkennung von Halluzinationen im Vergleich zu herkömmlichen Methoden signifikant verbessert.

Litian Liu, Reza Pourreza, Sunny Panchal + 4 more2026-03-03💬 cs.CL

LLM-ProS: Analyzing Large Language Models' Performance in Competitive Problem Solving

Die Studie stellt LLM-ProS vor, eine neue Evaluierungsmethode, die die Leistung führender Large Language Models bei der Lösung von 166 ICPC-Weltmeisterschaftsaufgaben analysiert, um deren Fähigkeiten im algorithmischen Problemlösen sowie den Einfluss von Trainingsmethoden und Denkstrategien zu bewerten.

Md Sifat Hossain, Anika Tabassum, Md. Fahim Arefin + 1 more2026-03-03💬 cs.CL

Robust Adaptation of Large Multimodal Models for Retrieval Augmented Hateful Meme Detection

Die Autoren stellen einen robusten Anpassungsrahmen für große multimodale Modelle vor, der durch Retrieval-Augmentation die Genauigkeit, Generalisierungsfähigkeit und Erklärbarkeit bei der Erkennung von Hass-Memes verbessert und dabei die Leistungsfähigkeit bestehender Methoden übertrifft.

Jingbiao Mei, Jinghong Chen, Guangyu Yang + 2 more2026-03-03💬 cs.CL

MemeIntel: Explainable Detection of Propagandistic and Hateful Memes

Die Arbeit stellt mit MemeXplain den ersten groß angelegten Datensatz für erklärbare Erkennung von Propaganda und Hassmemes vor und schlägt einen mehrstufigen Optimierungsansatz für Vision-Language-Modelle vor, der sowohl die Klassifizierungsgenauigkeit als auch die Qualität der Erklärungen im Vergleich zum State-of-the-Art signifikant verbessert.

Mohamed Bayan Kmainasi, Abul Hasnat, Md Arid Hasan + 2 more2026-03-03💬 cs.CL

Rewarding Doubt: A Reinforcement Learning Approach to Calibrated Confidence Expression of Large Language Models

Die Autoren stellen eine neue Reinforcement-Learning-Methode vor, die große Sprachmodelle durch Optimierung einer logarithmischen Belohnungsfunktion direkt darauf trainiert, ihre Antworten mit genau kalibrierten Konfidenzschätzungen zu versehen, wodurch eine zuverlässige und generalisierbare Unsicherheitswahrnehmung erreicht wird.

David Bani-Harouni, Chantal Pellegrini, Paul Stangel + 4 more2026-03-03💬 cs.CL

Not-Just-Scaling Laws: Towards a Better Understanding of the Downstream Impact of Language Model Design Decisions

Diese Studie zeigt durch eine Meta-Analyse von 92 Open-Source-Modellen, dass die Vorhersagekraft für die downstream-Leistung von Sprachmodellen um 3–28 % gesteigert werden kann, wenn neben Größe und Trainingsdaten auch spezifische Designentscheidungen wie die Datenzusammensetzung und Architekturmerkmale berücksichtigt werden.

Emmy Liu, Amanda Bertsch, Lintang Sutawika + 9 more2026-03-03💬 cs.CL

Large Language Models in Bioinformatics: A Survey

Diese Übersichtsarbeit beleuchtet, wie Large Language Models die Bioinformatik revolutionieren, indem sie die Analyse genomischer Sequenzen, RNA-Strukturen, Proteinfunktionen und Einzelzell-Daten ermöglichen, gleichzeitig zentrale Herausforderungen wie Datenknappheit und Rechenkomplexität diskutieren und zukünftige Richtungen für die Präzisionsmedizin aufzeigen.

Zhenyu Wang, Zikang Wang, Jiyue Jiang + 3 more2026-03-03🧬 q-bio

LLaVE: Large Language and Vision Embedding Models with Hardness-Weighted Contrastive Learning

Das Paper stellt LLaVE vor, ein skalierbares multimodales Embedding-Modell, das durch einen Hardness-Weighted Contrastive Learning-Ansatz die Unterscheidung schwieriger Negativpaare verbessert und damit auf dem MMEB-Benchmark neue State-of-the-Art-Ergebnisse erzielt, die sogar größere Modelle übertreffen.

Zhibin Lan, Liqiang Niu, Fandong Meng + 2 more2026-03-03💬 cs.CL

Vision-R1: Incentivizing Reasoning Capability in Multimodal Large Language Models

Das Paper stellt Vision-R1 vor, ein multimodales Sprachmodell, das durch die Kombination eines selbstgenerierten Cold-Start-Datensatzes und einer fortschrittlichen Reinforcement-Learning-Strategie (PTST mit GRPO) überlegene multimodale Schlussfolgerungsfähigkeiten erreicht und auf dem MathVista-Benchmark mit OpenAI O1 konkurrieren kann.

Wenxuan Huang, Bohan Jia, Zijie Zhai + 7 more2026-03-03💬 cs.CL

I Predict Therefore I Am: Is Next Token Prediction Enough to Learn Human-Interpretable Concepts from Data?

Die Arbeit stellt ein theoretisches Modell vor, das zeigt, wie Next-Token-Prediction in LLMs latente, menschlich interpretierbare Konzepte als diskrete Zufallsvariablen erfasst, und validiert diese Identifizierbarkeitsergebnisse sowohl theoretisch als auch empirisch an verschiedenen Modellfamilien.

Yuhang Liu, Dong Gong, Yichao Cai + 6 more2026-03-03💬 cs.CL

A Foundational Individual Mobility Prediction Model based on Open-Source Large Language Models

Die Studie stellt MoBLLM vor, ein kosteneffizientes, auf Open-Source-LLMs basierendes Fundamentmodell für die Vorhersage individueller Mobilität, das durch Parameter-Effizientes Fine-Tuning überlegene Genauigkeit, Robustheit und Transferierbarkeit auf verschiedenen Datensätzen im Vergleich zu bestehenden Deep-Learning-Modellen und kommerziellen LLMs erreicht.

Zhenlin Qin, Leizhen Wang, Yancheng Ling + 2 more2026-03-03💬 cs.CL

← Zurück Weiter →