cs.AI Arbeiten | Gist.Science

Social Knowledge for Cross-Domain User Preference Modeling

Diese Arbeit demonstriert, dass sich Benutzerpräferenzen über verschiedene Domänen hinweg durch eine Projektion in einen auf großen Twitter-Daten basierenden sozialen Embedding-Raum modellieren lassen, wodurch eine effektive Zero-Shot-Personalisierung und die Entdeckung von Zusammenhängen zwischen soziodemografischen Faktoren und Präferenzen ermöglicht wird.

Nir Lotan, Adir Solomon, Ido Guy, Einat Minkov2026-03-12🤖 cs.AI

Mashup Learning: Faster Finetuning by Remixing Past Checkpoints

Der vorgestellte Ansatz „Mashup Learning" beschleunigt das Feinabstimmen von Sprachmodellen und verbessert die Genauigkeit, indem er die relevantesten historischen Checkpoints durch Modell-Merging zu einer optimierten Initialisierung für neue Aufgaben kombiniert.

Sofia Maria Lo Cicero Vaina, Artem Chumachenko, Max Ryabinin2026-03-12🤖 cs.LG

Compatibility at a Cost: Systematic Discovery and Exploitation of MCP Clause-Compliance Vulnerabilities

Diese Arbeit stellt ein systematisches Framework vor, das mithilfe einer sprachunabhängigen Zwischendarstellung und LLM-gestützter statischer Analyse erstmals verwundbare Nichtkonformitäten in MCP-SDKs aufdeckt, die Angreifer für Kompatibilitätsmissbrauch nutzen können.

Nanzi Yang, Weiheng Bai, Kangjie Lu2026-03-12🤖 cs.AI

MCP-in-SoS: Risk assessment framework for open-source MCP servers

Die Studie stellt einen Risikobewertungsrahmen für Open-Source-MCP-Server vor, der durch statische Codeanalyse und die Zuordnung von Schwachstellen zu realen Bedrohungen systematisch Sicherheitsrisiken identifiziert und die Notwendigkeit einer sicheren Entwicklung unterstreicht.

Pratyay Kumar, Miguel Antonio Guirao Aguilera, Srikathyayani Srikanteswara, Satyajayant Misra, Abu Saleh Md Tayeen2026-03-12🤖 cs.AI

Adaptive Activation Cancellation for Hallucination Mitigation in Large Language Models

Die Arbeit stellt Adaptive Activation Cancellation (AAC) vor, ein Echtzeit-Inferenz-Verfahren, das Halluzinationen in großen Sprachmodellen durch die gezielte Unterdrückung spezifischer neuronaler Aktivierungen ohne Nachtraining oder externe Wissensquellen reduziert und dabei gleichzeitig die allgemeine Sprachfähigkeit und das logische Denken des Modells vollständig erhält.

Eric Yocam, Varghese Vaidyan, Gurcan Comert, Paris Kalathas, Yong Wang, Judith L. Mwakalonge2026-03-12💬 cs.CL

Delta-K: Boosting Multi-Instance Generation via Cross-Attention Augmentation

Delta-K ist ein trainingsfreies, plug-and-play-Inferenzframework, das durch die Extraktion und gezielte Injektion semantischer Differenzschlüssel ( $\Delta K$ ) in den gemeinsamen Cross-Attention-Key-Raum die Konzeptionstreue bei der Multi-Instance-Bildgenerierung in Diffusionsmodellen verbessert, ohne dabei zusätzliche Trainingsdaten oder Architekturänderungen zu benötigen.

Zitong Wang, Zijun Shen, Haohao Xu, Zhengjie Luo, Weibin Wu2026-03-12🤖 cs.AI

Multilingual AI-Driven Password Strength Estimation with Similarity-Based Detection

Diese Studie entwickelt einen multilingualen, KI-gestützten Passwortstärkenmesser mit Jaro-Ähnlichkeitsprüfung, der durch die Nutzung von ChatGPT-generierten Daten und die Einbeziehung indischer Sprachdaten eine hohe Erkennungsgenauigkeit für schwache Passwörter erreicht und dabei PassGAN-Modelle als überflüssig erweist.

Nikitha M. Palaniappan, Ying He2026-03-12🤖 cs.AI

A Diffusion Analysis of Policy Gradient for Stochastic Bandits

Diese Arbeit analysiert eine Diffusionsapproximation des Policy-Gradient-Verfahrens für stochastische Banditen, indem sie zeigt, dass bei einer Lernrate von $\eta = O(\Delta^2/\log(n))$ ein logarithmisches Regret von $O(k \log(k) \log(n) / \eta)$ erreicht wird, während für bestimmte Instanzen mit logarithmisch vielen Armen eine lineare Lernrate $\eta = O(\Delta^2)$ erforderlich ist, um lineares Regret zu vermeiden.

Tor Lattimore2026-03-12📊 stat

Robotic Ultrasound Makes CBCT Alive

Die vorgestellte Arbeit entwickelt einen deformationsbewussten Rahmen zur Echtzeit-Aktualisierung statischer intraoperativer CBCT-Bilder mithilfe eines robotergesteuerten Ultraschalls und eines speziell trainierten USCorUNet-Netzwerks, um weichteilbedingte Navigationsabweichungen ohne zusätzliche Strahlenbelastung zu korrigieren.

Feng Li, Ziyuan Li, Zhongliang Jiang, Nassir Navab, Yuan Bi2026-03-12🤖 cs.AI

Rethinking the Harmonic Loss via Non-Euclidean Distance Layers

Diese Arbeit erweitert den harmonischen Verlust über die reine euklidische Geometrie hinaus, indem sie systematisch verschiedene nicht-euklidische Distanzmetriken untersucht und nachweist, dass insbesondere kosinus-basierte Ansätze in Vision- und Sprachmodellen die Genauigkeit, Interpretierbarkeit und Nachhaltigkeit im Vergleich zur herkömmlichen Kreuzentropie verbessern.

Maxwell Miller-Golub, Kamil Faber, Marcin Pietron, Panpan Zheng, Pasquale Minervini, Roberto Corizzo2026-03-12🤖 cs.LG

Learning from Radio using Variational Quantum RF Sensing

Diese Arbeit demonstriert, dass ein mit einem Quantenschaltkreis optimierter Quantensensor Umgebungen mittels Radiowellen effizient lokalisieren kann, indem er selbst bei starkem Informationsmangel und ohne Kanalmessungen während des Betriebs empfindlich auf schwache oder verdeckte Signale reagiert.

Ivana Nikoloska2026-03-12⚛️ quant-ph

Intrinsic Numerical Robustness and Fault Tolerance in a Neuromorphic Algorithm for Scientific Computing

Die Studie zeigt, dass ein neuromorpher Algorithmus zur Lösung partieller Differentialgleichungen eine außergewöhnliche inhärente Fehlertoleranz aufweist, da er bis zu 32 % der Neuronen und 90 % der Spikes verlieren kann, ohne dass die Genauigkeit signifikant beeinträchtigt wird.

Bradley H. Theilman, James B. Aimone2026-03-12🤖 cs.AI

DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice

Die Arbeit stellt DUCTILE vor, ein von einem LLM-Agenten gesteuertes Orchestrierungssystem, das in der Produktentwicklung adaptive Analysen durchführt, während Ingenieure die Aufsicht behalten, und demonstriert dessen Fähigkeit, in einer industriellen Anwendung robuste, fehlerfreie Ergebnisse trotz variierender Eingabeformate zu liefern.

Alejandro Pradas-Gomez, Arindam Brahma, Ola Isaksson2026-03-12🤖 cs.AI

Joint Imaging-ROI Representation Learning via Cross-View Contrastive Alignment for Brain Disorder Classification

Die vorgestellte Studie stellt ein einheitliches kontrastives Lernframework vor, das globale Bildvolumen- und lokale ROI-Graphen-Repräsentationen für die Klassifizierung von Hirnerkrankungen kombiniert, wodurch durch die Ausnutzung komplementärer Merkmale eine verbesserte Leistung im Vergleich zu einzelnen Ansätzen erreicht wird.

Wei Liang, Lifang He2026-03-12🤖 cs.AI

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

Diese Arbeit stellt ADMM-PnP mit dem neuartigen AC-DC-Denoiser vor, der durch eine dreistufige Korrektur die Diskrepanz zwischen Trainingsdaten und ADMM-Iterationen überbrückt und unter definierten Bedingungen die Konvergenz von Score-basierten Denoisern in ADMM-Rahmenwerken garantiert.

Rajesh Shrestha, Xiao Fu2026-03-12🤖 cs.LG

Conversational AI-Enhanced Exploration System to Query Large-Scale Digitised Collections of Natural History Museums

Dieses Paper stellt ein menschenzentriertes System vor, das konversationelle KI nutzt, um über natürliche Sprache und interaktive Karten auf die etwa 1,7 Millionen digitalen Sammlungsdaten des Australian Museum zuzugreifen und so die Erschließung großer naturhistorischer Bestände für die Öffentlichkeit erleichtert.

Yiyuan Wang, Andrew Johnston, Zoë Sadokierski, Rhiannon Stephens, Shane T. Ahyong2026-03-12🤖 cs.AI

Quantum entanglement provides a competitive advantage in adversarial games

Die Studie zeigt, dass Quantenverschränkung in einem hybriden Quanten-Klassischen-Agenten für das Spiel Pong zu einer konsistenten Leistungssteigerung gegenüber separablen Quantenschaltungen und klassischen neuronalen Netzen führt, was die Verschränkung als wertvolle Ressource für das Repräsentationslernen in kompetitiven Reinforcement-Learning-Szenarien etabliert.

Peiyong Wang, Kieran Hymas, James Quach2026-03-12⚛️ quant-ph

Hybrid Self-evolving Structured Memory for GUI Agents

Die Arbeit stellt HyMEM vor, ein hybrides, selbstentwickelndes, graphbasiertes Gedächtnis, das diskrete symbolische Knoten mit kontinuierlichen Embeddings kombiniert, um GUI-Agenten durch strukturierte Mehrhop-Abfragen und dynamische Aktualisierungen zu verbessern und so Open-Source-Modelle mit 7B/8B-Parametern in die Lage zu versetzen, leistungsstarke geschlossene Modelle wie Gemini 2.5 Pro Vision und GPT-4o zu übertreffen.

Sibo Zhu, Wenyi Wu, Kun Zhou, Stephen Wang, Biwei Huang2026-03-12🤖 cs.AI

Simulation-in-the-Reasoning (SiR): A Conceptual Framework for Empirically Grounded AI in Autonomous Transportation

Dieses Paper stellt Simulation-in-the-Reasoning (SiR) als ein konzeptionelles Rahmenwerk vor, das domainspezifische Simulatoren direkt in den Denkprozess von Large Language Models integriert, um die reasoning von rein narrativer Plausibilität zu einem überprüfbaren, empirisch fundierten Workflow für autonome Transportsysteme zu transformieren.

Wuping Xin2026-03-12⚡ eess

Is this Idea Novel? An Automated Benchmark for Judgment of Research Ideas

Die Arbeit stellt RINoBench vor, den ersten umfassenden Benchmark zur automatisierten Bewertung der Neuheit von Forschungsideen, und zeigt, dass aktuelle Large Language Models zwar menschliche Begründungen nachahmen, aber dennoch keine zuverlässigen Neuheitsurteile im Vergleich zu menschlichen Experten liefern.

Tim Schopf, Michael Färber2026-03-12💬 cs.CL

← Zurück Weiter →