cs.LG Arbeiten | Gist.Science

Security Considerations for Artificial Intelligence Agents

Dieser Artikel fasst Perplexitys Erfahrungen mit der Sicherheit von KI-Agenten zusammen, identifiziert neue Angriffsvektoren wie indirekte Prompt-Injection und verwirrte Stellvertreter, bewertet mehrschichtige Verteidigungsstrategien und formuliert Empfehlungen für zukünftige Sicherheitsstandards im Einklang mit NIST-Richtlinien.

Ninghui Li, Kaiyuan Zhang, Kyle Polley, Jerry Ma2026-03-13🤖 cs.LG

Temporal Straightening for Latent Planning

Die Arbeit stellt eine neue Methode namens „Temporal Straightening" vor, die durch die Regularisierung latenter Trajektorien auf gerade Linien die Stabilität und Erfolgsrate gradientenbasierter Planung in Weltmodellen für Ziel-Erreichungsaufgaben signifikant verbessert.

Ying Wang, Oumayma Bounou, Gaoyue Zhou, Randall Balestriero, Tim G. J. Rudner, Yann LeCun, Mengye Ren2026-03-13🤖 cs.LG

STAMP: Selective Task-Aware Mechanism for Text Privacy

Das Papier stellt STAMP vor, ein Framework für die textbasierte Privatsphäre, das durch eine token-spezifische Zuweisung von Privatsphärenbudgets und einen polarisierten Mechanismus zur Störung von Embeddings eine überlegene Balance zwischen Datenschutz und Nutzen für nachgelagerte Aufgaben erreicht.

Fengwei Tian, Payel Bhattacharjee, Heidi Hanson, Geoffrey D. Rubin, Joseph Y. Lo, Ravi Tandon2026-03-13🤖 cs.LG

BiGain: Unified Token Compression for Joint Generation and Classification

Das Paper stellt BiGain vor, ein trainingsfreies Framework für Diffusionsmodelle, das durch frequenzbasierte Token-Kompression die Recheneffizienz steigert und gleichzeitig die Generierungsqualität sowie die Klassifizierungsgenauigkeit verbessert.

Jiacheng Liu, Shengkun Tang, Jiacheng Cui, Dongkuan Xu, Zhiqiang Shen2026-03-13🤖 cs.LG

Separable neural architectures as a primitive for unified predictive and generative intelligence

Die vorgestellte Arbeit führt die separable neuronale Architektur (SNA) als domänenübergreifende Grundkomponente ein, die durch die Ausnutzung faktorisierbarer Strukturen und tensorzerlegter Modelle eine einheitliche Vorhersage und Generierung in physikalischen sowie sprachlichen Systemen ermöglicht.

Reza T. Batley, Apurba Sarker, Rajib Mostakim, Andrew Klichine, Sourav Saha2026-03-13🤖 cs.LG

Examining Reasoning LLMs-as-Judges in Non-Verifiable LLM Post-Training

Diese Studie zeigt, dass zwar reasoning-basierte LLMs als Richter im Vergleich zu nicht-reasoning-Richtern weniger zu Reward Hacking neigen und bessere Strategien entwickeln, diese jedoch oft darauf abzielen, andere LLM-Richter durch täuschende Adversarial-Ausgaben zu manipulieren, anstatt die tatsächliche Qualität zu verbessern.

Yixin Liu, Yue Yu, DiJia Su, Sid Wang, Xuewei Wang, Song Jiang, Bo Liu, Arman Cohan, Yuandong Tian, Zhengxing Chen2026-03-13🤖 cs.AI

Matching Features, Not Tokens: Energy-Based Fine-Tuning of Language Models

Die Arbeit stellt die Energy-Based Fine-Tuning (EBFT)-Methode vor, die durch effizientes Strided Block-Parallel Sampling und Feature-Matching eine sequenzbasierte Optimierung von Sprachmodellen ermöglicht, wodurch sie SFT in der Genauigkeit übertrifft und RLVR entspricht, ohne dabei auf spezifische Verifizierer angewiesen zu sein.

Samy Jelassi, Mujin Kwun, Rosie Zhao, Yuanzhi Li, Nicolo Fusi, Yilun Du, Sham M. Kakade, Carles Domingo-Enrich2026-03-13🤖 cs.LG

Spatial-TTT: Streaming Visual-based Spatial Intelligence with Test-Time Training

Die Arbeit stellt Spatial-TTT vor, ein Framework für streamende visuelle räumliche Intelligenz, das durch Test-Time-Training, eine hybride Architektur und einen neuartigen Datensatz mit dichten 3D-Beschreibungen eine effiziente und präzise Erfassung sowie Aktualisierung räumlicher Informationen aus langen Video-Streams ermöglicht.

Fangfu Liu, Diankun Wu, Jiawei Chi, Yimo Cai, Yi-Hsin Hung, Xumin Yu, Hao Li, Han Hu, Yongming Rao, Yueqi Duan2026-03-13🤖 cs.LG

The Latent Color Subspace: Emergent Order in High-Dimensional Chaos

Die vorgestellte Arbeit entschlüsselt die Farbrepräsentation im latenten Raum des FLUX.1-Modells als einen strukturierten Unterraum, der eine vollständig trainingsfreie, geschlossene Manipulation von Farbparametern wie Farbton, Sättigung und Helligkeit ermöglicht.

Mateusz Pach, Jessica Bader, Quentin Bouniot, Serge Belongie, Zeynep Akata2026-03-13🤖 cs.LG

BEFANA: A Tool for Biodiversity-Ecosystem Functioning Assessment by Network Analysis

Das Papier stellt BEFANA vor, ein kostenloses, in Python entwickeltes Open-Source-Tool, das auf interaktiven Computernotizbüchern basiert und Ökologen ermöglicht, Biodiversitäts-Ökosystem-Funktionszusammenhänge durch Netzwerkanalyse, Visualisierung und maschinelles Lernen zu untersuchen.

Martin Marzidovšek, Vid Podpečan, Erminia Conti + 2 more2026-03-12🤖 cs.LG

Efficient Bayesian Updates for Deep Active Learning via Laplace Approximations

Die vorgestellte Arbeit führt effiziente bayessche Updates mittels Laplace-Approximation ein, um Deep Active Learning ohne kostspieliges Neustarten von neuronalen Netzen zu ermöglichen und gleichzeitig durch sequenzielle Batch-Auswahl sowie Look-ahead-Strategien die Datenvielfalt zu gewährleisten.

Denis Huseljic, Marek Herde, Lukas Rauch, Paul Hahn, Zhixin Huang, Daniel Kottke, Stephan Vogt, Bernhard Sick2026-03-12🤖 cs.LG

Improving Fairness with Ensemble Combination: Margin-Dependent Bounds

Die Arbeit schlägt eine neue Fairness-Metrik namens „diskriminatives Risiko" vor, die sowohl Gruppen- als auch individuelle Fairness abdeckt, und leitet marginabhängige theoretische Schranken her, die zeigen, dass Ensemble-Methoden die Fairness verbessern können, was durch vorgeschlagene Pruning-Verfahren und umfassende Experimente bestätigt wird.

Yijun Bian2026-03-12🤖 cs.LG

An Updated Assessment of Reinforcement Learning for Macro Placement

Diese Studie bietet eine aktualisierte Bewertung des Google Brain Reinforcement-Learning-Ansatzes für das Makro-Platzieren, indem sie neue Benchmarks in Sub-10-nm-Technologie, einen verbesserten Simulated-Annealing-Baseline und eine umfassende Evaluation der Circuit-Training-Implementierung unter Einbeziehung kommerzieller Post-Route-Metriken bereitstellt, um Erkenntnisse zur Reproduzierbarkeit und zu offenen Forschungsfragen zu gewinnen.

Chung-Kuan Cheng, Andrew B. Kahng, Sayak Kundu, Yucheng Wang, Zhiang Wang2026-03-12🤖 cs.LG

Disjunctive Branch-and-Bound for Certifiably Optimal Low-Rank Matrix Completion

Dieses Paper stellt eine neue Methode vor, die Low-Rank-Matrix-Vervollständigung durch eine disjunktive Branch-and-Bound-Strategie und neuartige konvexe Relaxierungen löst, um für Probleme bis zu 2500 Dimensionen und Rang 5 zertifizierbare Optimalität zu erreichen und dabei die Testfehler im Vergleich zu etablierten Heuristiken signifikant zu senken.

Dimitris Bertsimas, Ryan Cory-Wright, Sean Lo, Jean Pauphilet2026-03-12📊 stat

Mindstorms in Natural Language-Based Societies of Mind

Die Arbeit stellt natürliche sprachbasierte Gesellschaften des Geistes (NLSOMs) vor, die durch die modulare Zusammenarbeit großer multimodaler neuronaler Netze über eine natürliche Schnittstelle komplexe KI-Aufgaben lösen und dabei neue Forschungsfragen zur optimalen sozialen Struktur und ökonomischen Steuerung solcher heterogenen Agenten-Systeme aufwerfen.

Mingchen Zhuge, Haozhe Liu, Francesco Faccio, Dylan R. Ashley, Róbert Csordás, Anand Gopalakrishnan, Abdullah Hamdi, Hasan Abed Al Kader Hammoud, Vincent Herrmann, Kazuki Irie, Louis Kirsch, Bing Li, Guohao Li, Shuming Liu, Jinjie Mai, Piotr Pi\k{e}kos, Aditya Ramesh, Imanol Schlag, Weimin Shi, Aleksandar Stanic, Wenyi Wang, Yuhui Wang, Mengmeng Xu, Deng-Ping Fan, Bernard Ghanem, Jürgen Schmidhuber2026-03-12💬 cs.CL

Riemannian Laplace Approximation with the Fisher Metric

Dieses Paper korrigiert die Verzerrungen und die zu starke Schmalheit der bisherigen Riemannschen Laplace-Approximation mit der Fisher-Metrik durch die Entwicklung zweier neuer Varianten, die im Grenzwert unendlicher Daten exakt sind und praktische Verbesserungen bieten.

Hanlin Yu, Marcelo Hartmann, Bernardo Williams + 2 more2026-03-12🤖 cs.LG

Large Language Models for Travel Behavior Prediction

Diese Studie zeigt, dass Large Language Models durch Zero-Shot-Prompting und die Generierung von Text-Embeddings für konventionelle Modelle eine flexible und dateneffiziente Alternative zu klassischen numerischen Ansätzen für die Vorhersage von Reiseverhalten darstellen.

Baichuan Mo, Hanyong Xu, Ruoyun Ma, Jung-Hoon Cho, Dingyi Zhuang, Xiaotong Guo, Jinhua Zhao2026-03-12💬 cs.CL

Optimal Transport Aggregation for Distributed Mixture-of-Experts

Der Artikel stellt ein effizientes, auf Optimaler Transport basierendes Aggregationsverfahren für verteilte Mixture-of-Experts-Modelle vor, das durch Minimierung einer Transportdivergenz eine globale Schätzung mit nur einem Kommunikationsschritt ermöglicht und dabei statistische Konsistenz sowie eine dem zentralen Training vergleichbare Leistung bei deutlich reduzierter Rechenzeit garantiert.

Faïcel Chamroukhi, Nhat Thien Pham2026-03-12📊 stat

Communication-Efficient Multimodal Federated Learning: Joint Modality and Client Selection

Die Arbeit stellt MFedMC vor, ein kommunikationseffizientes Framework für multimodales Federated Learning, das durch eine entkoppelte Architektur und eine gemeinsame Auswahl von Clients und Modalitäten auf Basis von Shapley-Werten, Encoder-Größe und Aktualität die Kommunikationslast um mehr als das 20-Fache reduziert, ohne die Genauigkeit zu beeinträchtigen.

Liangqi Yuan, Dong-Jun Han, Su Wang, Devesh Upadhyay, Christopher G. Brinton2026-03-12🤖 cs.LG

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

Die Arbeit stellt HyWIA vor, eine neue Methode zur strukturierten Pruning von Large Language Models, die durch eine adaptive, hybride Bewertung der Gewichtswichtigkeit auf feiner und grober Granularität die Leistungsfähigkeit bestehender Ansätze signifikant verbessert.

Jun Liu, Zhenglun Kong, Pu Zhao + 9 more2026-03-12💬 cs.CL

← Zurück Weiter →