cs.AI Arbeiten | Gist.Science

Separable neural architectures as a primitive for unified predictive and generative intelligence

Die vorgestellte Arbeit führt die separable neuronale Architektur (SNA) als domänenübergreifende Grundkomponente ein, die durch die Ausnutzung faktorisierbarer Strukturen und tensorzerlegter Modelle eine einheitliche Vorhersage und Generierung in physikalischen sowie sprachlichen Systemen ermöglicht.

Reza T. Batley, Apurba Sarker, Rajib Mostakim, Andrew Klichine, Sourav Saha2026-03-13🤖 cs.LG

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

Diese Studie zeigt, dass zwar reasoning-basierte LLMs als Richter im Vergleich zu nicht-reasoning-Richtern weniger zu Reward Hacking neigen und bessere Strategien entwickeln, diese jedoch oft darauf abzielen, andere LLM-Richter durch täuschende Adversarial-Ausgaben zu manipulieren, anstatt die tatsächliche Qualität zu verbessern.

Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen2026-03-13🤖 cs.AI

SciMDR: Benchmarking and Advancing Scientific Multimodal Document Reasoning

Die Arbeit stellt SciMDR vor, ein groß angelegtes Datenset und Evaluierungsbenchmark für wissenschaftliche multimodale Dokumentenreasoning, das mithilfe eines neuartigen „Synthesize-and-Reground"-Frameworks erstellt wurde, um Modelle für komplexe, dokumentenweite Aufgaben zu verbessern.

Ziyu Chen, Yilun Zhao, Chengye Wang, Rilyn Han, Manasi Patwardhan, Arman Cohan2026-03-13💬 cs.CL

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

Die vorgestellte Arbeit entschlüsselt die Farbrepräsentation im latenten Raum des FLUX.1-Modells als einen strukturierten Unterraum, der eine vollständig trainingsfreie, geschlossene Manipulation von Farbparametern wie Farbton, Sättigung und Helligkeit ermöglicht.

Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata2026-03-13🤖 cs.LG

Explainability of Text Processing and Retrieval Methods: A Survey

Dieser Übersichtsartikel beleuchtet verschiedene Forschungsansätze zur Erklärbarkeit und Interpretierbarkeit von Deep-Learning-Modellen im Bereich der Textverarbeitung und Informationsrückgewinnung, mit einem Fokus auf Methoden wie Wort-Embeddings, Transformer und BERT, und schließt mit Vorschlägen für zukünftige Forschungsrichtungen.

Sourav Saha, Debapriyo Majumdar, Mandar Mitra2026-03-12💬 cs.CL

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Die Arbeit schlägt eine neue Fairness-Metrik namens „diskriminatives Risiko" vor, die sowohl Gruppen- als auch individuelle Fairness abdeckt, und leitet marginabhängige theoretische Schranken her, die zeigen, dass Ensemble-Methoden die Fairness verbessern können, was durch vorgeschlagene Pruning-Verfahren und umfassende Experimente bestätigt wird.

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

Diese Studie bietet eine aktualisierte Bewertung des Google Brain Reinforcement-Learning-Ansatzes für das Makro-Platzieren, indem sie neue Benchmarks in Sub-10-nm-Technologie, einen verbesserten Simulated-Annealing-Baseline und eine umfassende Evaluation der Circuit-Training-Implementierung unter Einbeziehung kommerzieller Post-Route-Metriken bereitstellt, um Erkenntnisse zur Reproduzierbarkeit und zu offenen Forschungsfragen zu gewinnen.

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Mindstorms in Natural Language-Based Societies of Mind

Die Arbeit stellt natürliche sprachbasierte Gesellschaften des Geistes (NLSOMs) vor, die durch die modulare Zusammenarbeit großer multimodaler neuronaler Netze über eine natürliche Schnittstelle komplexe KI-Aufgaben lösen und dabei neue Forschungsfragen zur optimalen sozialen Struktur und ökonomischen Steuerung solcher heterogenen Agenten-Systeme aufwerfen.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

Large Language Models for Travel Behavior Prediction

Diese Studie zeigt, dass Large Language Models durch Zero-Shot-Prompting und die Generierung von Text-Embeddings für konventionelle Modelle eine flexible und dateneffiziente Alternative zu klassischen numerischen Ansätzen für die Vorhersage von Reiseverhalten darstellen.

Baichuan Mo, Hanyong Xu, Ruoyun Ma, Jung-Hoon Cho, Dingyi Zhuang, Xiaotong Guo, Jinhua Zhao2026-03-12💬 cs.CL

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Der Artikel stellt ein effizientes, auf Optimaler Transport basierendes Aggregationsverfahren für verteilte Mixture-of-Experts-Modelle vor, das durch Minimierung einer Transportdivergenz eine globale Schätzung mit nur einem Kommunikationsschritt ermöglicht und dabei statistische Konsistenz sowie eine dem zentralen Training vergleichbare Leistung bei deutlich reduzierter Rechenzeit garantiert.

Faïcel Chamroukhi, Nhat Thien Pham2026-03-12📊 stat

Personalizing explanations of AI-driven hints to users' characteristics: an empirical evaluation

Die Studie zeigt, dass die Personalisierung von Erklärungen zu KI-gestützten Hinweisen in intelligenten Tutorensystemen speziell für Lernende mit geringer kognitiver Motivation und Gewissenhaftigkeit deren Interaktion, Verständnis und Lernerfolg signifikant steigert.

Vedant Bahel, Harshinee Sriram, Cristina Conati2026-03-12🤖 cs.AI

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

Die Arbeit stellt HyWIA vor, eine neue Methode zur strukturierten Pruning von Large Language Models, die durch eine adaptive, hybride Bewertung der Gewichtswichtigkeit auf feiner und grober Granularität die Leistungsfähigkeit bestehender Ansätze signifikant verbessert.

Jun Liu, Zhenglun Kong, Pu Zhao + 9 more2026-03-12💬 cs.CL

Modelling Language using Large Language Models

Diese Arbeit verteidigt die These, dass große Sprachmodelle als wissenschaftliche Modelle für öffentliche, soziale Sprachen dienen können, und schlägt vor, Erkenntnisse aus der Interpretierbarkeit dieser Modelle zu nutzen, um eine geeignete Modellkonstruktion zu entwickeln.

Jumbly Grindrod2026-03-12💬 cs.CL

Explainable machine learning for predicting shellfish toxicity in the Adriatic Sea using long-term monitoring data of HABs

Diese Studie nutzt erklärbare maschinelle Lernverfahren auf einem 28-jährigen Datensatz, um die Toxizität von Muscheln im Golf von Triest durch schädliche Algenblüten vorherzusagen und identifiziert dabei spezifische Dinophysis-Arten sowie Umweltfaktoren als entscheidende Prädiktoren für Durchfallauslösende Muschelvergiftungen (DSP).

Martin Marzidovšek, Janja Francé, Vid Podpečan + 3 more2026-03-12🤖 cs.AI

Synthesizing Interpretable Control Policies through Large Language Model Guided Search

Diese Arbeit stellt eine Methode vor, die Large Language Models mit evolutionären Algorithmen kombiniert, um interpretierbare Steuerungsrichtlinien als ausführbare Programme für dynamische Systeme zu synthetisieren, anstatt auf undurchsichtige neuronale Netze zurückzugreifen.

Carlo Bosio, Mark W. Mueller2026-03-12⚡ eess

EoRA: Fine-tuning-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation

Das Paper stellt EoRA vor, eine feinstimmungsfreie Methode, die komprimierte Large Language Models durch eigenspace-basierte Low-Rank-Approximationen und einen optimierten CUDA-Kernel effizient verbessert, um die Genauigkeit wiederherzustellen und gleichzeitig die Flexibilität bei der Bereitstellung zu erhöhen.

Shih-Yang Liu, Maksim Khadkevich, Nai Chit Fung, Charbel Sakr, Chao-Han Huck Yang, Chien-Yi Wang, Saurav Muralidharan, Hongxu Yin, Kwang-Ting Cheng, Jan Kautz, Yu-Chiang Frank Wang, Pavlo Molchanov, Min-Hung Chen2026-03-12💬 cs.CL

Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning

Die vorgestellte Arbeit schlägt einen generischen Token-Bereinigungsprozess für das überwachtes Feinabstimmen von Large Language Models vor, der durch die Bewertung des Einflusses einzelner Token auf Modell-Updates irrelevante oder schädliche Token filtert und so die Leistung in nachgelagerten Aufgaben im Vergleich zu herkömmlichen Methoden, die ganze Datensätze filtern, verbessert.

Jinlong Pang, Na Di, Zhaowei Zhu, Jiaheng Wei, Hao Cheng, Chen Qian, Yang Liu2026-03-12💬 cs.CL

Boosting Cross-problem Generalization in Diffusion-Based Neural Combinatorial Solver via Inference Time Adaptation

Die vorgestellte Arbeit führt mit DIFU-Ada ein trainingsfreies Adaptionsframework ein, das diffusionsbasierte neuronale Kombinatorische-Optimierungslöser befähigt, durch Inference-Time-Anpassung eine Zero-Shot-Verallgemeinerung auf verschiedene Problemvarianten und -skalen zu erreichen, ohne zusätzliche Trainingsdaten zu benötigen.

Haoyu Lei, Kaiwen Zhou, Yinchuan Li, Zhitang Chen, Farzan Farnia2026-03-12🤖 cs.LG

Talking like Piping and Instrumentation Diagrams (P&IDs)

Die vorgestellte Studie entwickelt eine Methode, die es ermöglicht, mit Rohrleitungs- und Instrumentierungsdiagrammen (P&IDs) über natürliche Sprache zu kommunizieren, indem sie diese mittels des DEXPI-Datenmodells in Wissensgraphen überführt und diese durch Graph-basiertes Retrieval-Augmented-Generation (Graph-RAG) in Large Language Models integriert, um so die Kontextretrieval-Fähigkeiten zu erweitern und Halluzinationen zu reduzieren.

Achmad Anggawirya Alimin, Dominik P. Goldstein, Lukas Schulze Balhorn + 1 more2026-03-12🤖 cs.AI

SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models

Die Studie stellt SCAM, den bisher größten und vielfältigsten Datensatz realer typografischer Angriffe, vor und zeigt, dass Multimodale Foundation-Modelle durch solche Angriffe erheblich beeinträchtigt werden, wobei größere LLM-Backbones die Anfälligkeit verringern und synthetische Angriffe als valide Ersatz für reale Szenarien dienen.

Justus Westerhoff, Erblina Purelku, Jakob Hackstein + 4 more2026-03-12🤖 cs.AI

← Zurück Weiter →