cs.LG Arbeiten | Gist.Science

The Reasoning Trap -- Logical Reasoning as a Mechanistic Pathway to Situational Awareness

Die Arbeit argumentiert, dass Fortschritte in der logischen推理 von KI-Systemen über drei mechanistische Pfade (deduktive Selbstinferenz, induktive Kontexterkennung und abduktive Selbstmodellierung) unweigerlich zu einer gefährlichen situativen Selbstwahrnehmung führen, und schlägt daher neue Sicherheitsmaßnahmen wie einen „Spiegel-Test"-Benchmark vor, um diese Eskalation zu verhindern.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-11🤖 cs.AI

The Radio-Frequency Transformer for Signal Separation

Die Autoren stellen einen vollständig datengesteuerten Transformer-basierten Ansatz vor, der mithilfe eines verfeinerten Tokenizers und eines Cross-Entropy-Trainings Signale von nicht-gaußschen Störungen trennt und dabei im Vergleich zu bestehenden Methoden eine drastische Reduktion der Bitfehlerrate bei gleichzeitiger Null-Shot-Generalisierung auf unbekannte Mischungen erreicht.

Egor Lifar, Semyon Savkin, Rachana Madhukara, Tejas Jayashankar, Yury Polyanskiy, Gregory W. Wornell2026-03-11🤖 cs.LG

Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing

Die Studie zeigt, dass emotionale Töne die Aufmerksamkeitsgeometrie von Large Language Models systematisch verändern, und stellt mit dem AURA-QA-Datensatz sowie einem emotionalen Regularisierungsrahmen neue Methoden vor, um die Leseverständnisleistung unter emotionalen Distributionsschwankungen zu verbessern.

Benjamin Reichman, Adar Avasian, Samuel Webster, Larry Heck2026-03-11🤖 cs.AI

MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data

Die Arbeit stellt MM-Zero vor, ein RL-basiertes Framework, das erstmals die datenlose Selbstentwicklung von Vision-Language-Modellen durch ein dreiteiliges Rollenkonzept (Proposer, Coder, Solver) ermöglicht, das abstrakte visuelle Konzepte generiert, in ausführbaren Code übersetzt und multimodale Schlussfolgerungen trifft.

Zongxia Li, Hongyang Du, Chengsong Huang, Xiyang Wu, Lantao Yu, Yicheng He, Jing Xie, Xiaomin Wu, Zhichao Liu, Jiarui Zhang, Fuxiao Liu2026-03-11🤖 cs.LG

Strategically Robust Multi-Agent Reinforcement Learning with Linear Function Approximation

Die Arbeit stellt \texttt{RQRE-OVI} vor, einen optimistischen Wert-Iterationsalgorithmus mit linearer Funktionsapproximation, der das Risiko-sensitive Quantal-Response-Gleichgewicht (RQRE) berechnet und dabei eine einzigartige, glatte Lösung bietet, die im Vergleich zum Nash-Gleichgewicht eine überlegene Robustheit und Stabilität in general-sum Markov-Spielen gewährleistet.

Jake Gonzales, Max Horwitz, Eric Mazumdar, Lillian J. Ratliff2026-03-11🤖 cs.LG

Beyond Test-Time Training: Learning to Reason via Hardware-Efficient Optimal Control

Die Arbeit stellt die Test-Time Control (TTC)-Schicht vor, eine hardware-effiziente Architekturerweiterung für große Sprachmodelle, die durch die Einbettung von optimaler Steuerung und LQR-Planung in den Inferenzprozess die mathematische Schlussfolgerungsfähigkeit signifikant verbessert, ohne auf Testzeit-Training angewiesen zu sein.

Peihao Wang, Shan Yang, Xijun Wang, Tesi Xiao, Xin Liu, Changlong Yu, Yu Lou, Pan Li, Zhangyang Wang, Ming Lin, René Vidal2026-03-11🤖 cs.LG

A Generative Sampler for distributions with possible discrete parameter based on Reversibility

Die vorgestellte Arbeit entwickelt einen einheitlichen, zielgradientenfreien generativen Sampler, der durch die Minimierung der Maximum Mean Discrepancy zwischen vorwärts- und rückwärtsgerichteten Trajektorien unter Einhaltung der Reversibilität komplexe Verteilungen in kontinuierlichen, diskreten und hybriden Räumen effizient sampelt.

Lei Li, Zhen Wang, Lishuo Zhang2026-03-11🤖 cs.LG

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

Diese Arbeit stellt zwei rein trainingsseitige Komponenten vor, die durch längenbewusste Aufmerksamkeitspriors und einen gewinnbewussten Controller die Effizienz des logischen Schlussfolgerns bei festen Testzeitkosten verbessern, indem sie die Validierungsverluste senken, ohne die Inferenzlatenz oder den Speicherbedarf zu erhöhen.

Rian Atri2026-03-11🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Diese Arbeit stellt neue, effizient berechenbare transduktive Generalisierungsgrenzen für Graph-Node-Klassifizierung vor, die auf Optimal-Transport-Maßen basieren und durch die Analyse von GNN-Aggregationen sowohl die empirische Generalisierung als auch den nicht-monotonen Einfluss der Netzwerktiefe auf den Fehler erklären.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo Kim2026-03-11🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

Die Arbeit stellt DendroNN vor, ein neuartiges, dendritenzentrisches neuronales Netzwerk, das durch die Nachahmung von Sequenzerkennungsmechanismen in Dendriten und eine gradientenfreie Umverdrahtung energieeffiziente, hochpräzise Klassifizierung von ereignisbasierten Daten ermöglicht und dabei eine Hardware-Architektur mit bis zu vierfacher Effizienzsteigerung gegenüber bestehenden neuromorphen Systemen bietet.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen Becker2026-03-11🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Diese Arbeit schließt bestehende Lücken in der Analyse von Gaussian-Process-Thompson-Sampling (GP-TS) für das Bayesianische Optimieren, indem sie erstmals eine untere Regret-Schranke, eine verbesserte obere Schranke für die kumulative Regret über die Zeit $T$ sowie erwartete „lenient"-Regret-Schranken und eine Schranke für die zweite Moment der kumulativen Regret herleitet.

Shion Takeno, Shogo Iwazaki2026-03-11🤖 cs.LG

Proxy-Guided Measurement Calibration

Die Arbeit stellt einen rahmenbasierten Ansatz vor, der mithilfe von Proxy-Variablen und variationalen Autoencodern systematische Messfehler in aggregierten Ergebnisvariablen identifiziert und korrigiert, indem sie latente Inhalts- und Verzerrungsvariablen in einem kausalen Graphen trennt.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan Liu2026-03-11🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Diese Arbeit leitet einen nicht-asymptotischen Vergleichssatz für das Training von Machine-Learning-Modellen auf Basis von Gaußschen Mischmodellen her, der die Dynamik mit einem einfacher zu analysierenden Surrogat-System verbindet und die Gültigkeit der dynamischen Mean-Field-Approximationen rigoros beweist.

Ashkan Panahi2026-03-11🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

Das Paper stellt CLoE vor, einen konsistenzbasierten Lernrahmen für die Segmentierung medizinischer Bilder mit fehlenden Modalitäten, der durch Expertenkonsistenz auf Entscheidungs- und Regionsebene sowie eine zuverlässigkeitsgesteuerte Merkmalsanpassung die Robustheit und Genauigkeit bei unvollständigen Eingabedaten signifikant verbessert.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao Li2026-03-11🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

Die Arbeit stellt Reward-Zero vor, einen allgemeinen, impliziten Belohnungsmechanismus, der natürliche Sprachbeschreibungen mittels Embeddings in dichte, semantisch fundierte Fortschrittsignale für das Reinforcement Learning umwandelt und so das Training beschleunigt sowie die Generalisierungsfähigkeit von Agenten verbessert.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu She2026-03-11🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

Die Arbeit stellt TA-GGAD vor, ein adaptives Graph-Modell, das durch die Identifizierung und Modellierung des „Anomaly Disassortativity"-Problems eine bahnbrechende, domänenübergreifende Generalisierung bei der Erkennung von Anomalien in Graphen ermöglicht.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng Xie2026-03-11🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

Diese Arbeit stellt ein datengesteuertes Framework vor, das mithilfe von maschinellem Lernen und generativen Modellen die Oberflächenrauheit im Material-Extrusions-Druck vorhersagt und über eine interaktive 3D-Web-Schnittstelle eine visuelle Entscheidungsunterstützung für die Prozessplanung bietet.

Engin Deniz Erkan, Elif Surer, Ulas Yaman2026-03-11🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Diese Arbeit stellt einen differenziell privaten, nullten Ordnungs-Optimierungsrahmen vor, der die Datensatzkondensation auf nicht differenzierbare klinische Modelle wie Entscheidungsbäume und Cox-Regressionen erweitert, um eine sichere und modellunabhängige Datenteilung für klinische Vorhersageaufgaben zu ermöglichen.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. Clifton2026-03-11🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

Die Arbeit stellt CAHC vor, eine end-zu-end-Methode für das Clustering attributierter Hypergraphen mittels kontrastiven Lernens, die die Repräsentationslernen- und Clusterzuweisungsschritte kombiniert, um eine direkte Clustering-Überwachung zu ermöglichen und damit die Leistung gegenüber bestehenden Ansätzen zu verbessern.

Li Ni, Shuaikang Zeng, Lin Mu, Longlong Lin2026-03-11🤖 cs.LG

Flow Field Reconstruction via Voronoi-Enhanced Physics-Informed Neural Networks with End-to-End Sensor Placement Optimization

Die Studie stellt VSOPINN vor, ein physik-informiertes neuronales Netzwerk, das durch eine differenzierbare Voronoi-Optimierung die Sensorplatzierung end-zu-end anpasst, um die Genauigkeit und Robustheit der Strömungsfeld-Rekonstruktion auch bei unvollständigen Messdaten und Sensorausfällen signifikant zu verbessern.

Renjie Xiao, Bingteng Sun, Yiling Chen, Lin Lu, Qiang Du, Junqiang Zhu2026-03-11🤖 cs.LG

← Zurück Weiter →