cs.AI Arbeiten | Gist.Science

Distributed Legal Infrastructure for a Trustworthy Agentic Web

Der Artikel schlägt eine verteilte Rechtsinfrastruktur vor, die aus fünf miteinander verknüpften Schichten besteht, um im auf KI-Agenten basierenden Web durch interoperable Protokolle für Identität, Entscheidungsfindung und Streitbeilegung eine vertrauenswürdige und rechenschaftspflichtige Governance zu gewährleisten.

Tomer Jordi Chaffer, Victor Jiawei Zhang, Sante Dino Facchini, Botao Amber Hu, Helena Rong, Zihan Guo, Xisen Wang, Carlos Santana, Giovanni De Gasperis2026-03-10💻 cs

Enhancing the Detection of Coronary Artery Disease Using Machine Learning

Diese Studie zeigt, dass ein hybrides Machine-Learning-Modell aus Bi-LSTM und GRU mit einer Genauigkeit von 97,07 % die Erkennung von koronarer Herzkrankheit im Vergleich zu herkömmlichen Diagnosemethoden verbessert und somit ein vielversprechendes Werkzeug für die personalisierte kardiovaskuläre Versorgung darstellt.

Karan Kumar Singh, Nikita Gajbhiye, Gouri Sankar Mishra2026-03-10💻 cs

Empowering Locally Deployable Medical Agent via State Enhanced Logical Skills for FHIR-based Clinical Tasks

Die Studie stellt SELSM vor, ein training-freies Framework, das durch die Ableitung entitätsunabhängiger logischer Regeln aus simulierten klinischen Trajektorien und eine abfragegesteuerte Zwei-Phasen-Wiederherstellung die Null-Shot-Fähigkeiten lokal einsetzbarer medizinischer Agenten (30–32 Mrd. Parameter) für FHIR-basierte Aufgaben unter strikten Datenschutzbedingungen signifikant verbessert und dabei eine 100%ige Erfolgsrate bei der Aufgabenerfüllung erreicht.

Wanrong Yang, Zhengliang Liu, Yuan Li, Bingjie Yan, Lingfang Li, Mingguang He, Dominik Wojtczak, Yalin Zheng, Danli Shi2026-03-10💻 cs

MindfulAgents: Personalizing Mindfulness Meditation via an Expert-Aligned Multi-Agent System

Die Studie stellt MindfulAgents vor, ein auf Large Language Models basierendes Multi-Agenten-System, das durch personalisierte, expertenkonforme Meditationsskripte und Echtzeit-Anpassungen nachweislich das Engagement, das Stressniveau und das Achtsamkeitsniveau der Nutzer sowohl kurz- als auch langfristig verbessert.

Mengyuan (Millie), Wu, Zhihan Jiang, Yuang Fan, Richard Feng, Sahiti Dharmavaram, Mathew Polowitz, Shawn Fallon, Bashima Islam, Lizbeth Benson, Irene Tung, David Creswell, Xuhai Xu2026-03-10💻 cs

How Private Are DNA Embeddings? Inverting Foundation Model Representations of Genomic Sequences

Diese Studie zeigt, dass DNA-Embeddings aus Foundation-Modellen wie Evo 2 und NTv2 durch Inversionsangriffe leicht rekonstruiert werden können, was die Privatsphäre von Genomdaten in „Embeddings-as-a-Service"-Szenarien gefährdet und dringende Maßnahmen für einen privatsphärenbewussten Designansatz erfordert.

Sofiane Ouaari, Jules Kreuer, Nico Pfeifer2026-03-10🤖 cs.LG

Post-Training with Policy Gradients: Optimality and the Base Model Barrier

Die Arbeit zeigt, dass Policy-Gradient-Methoden beim Nachtrainieren von linearen autoregressiven Modellen mit Ergebnisbelohnungen eine fundamentale Barriere bezüglich der Unterstützung des Basismodells aufweisen, die durch den Einsatz von Prozessbelohnungen überwunden werden kann, um die Dimensionalität zu vermeiden.

Alireza Mousavi-Hosseini, Murat A. Erdogdu2026-03-10🤖 cs.LG

Learning Quadruped Walking from Seconds of Demonstration

Die Arbeit zeigt, dass eine neue Nachahmungslernmethode, die auf der Analyse von Grenzzyklen und Poincaré-Abbildungen basiert, es ermöglicht, robuste Laufpolicies für Vierbeiner ausschließlich offline und nur mit wenigen Sekunden Demonstrationsdaten zu trainieren.

Ruipeng Zhang, Hongzhan Yu, Ya-Chien Chang, Chenghao Li, Henrik I. Christensen, Sicun Gao2026-03-10🤖 cs.LG

Elenchus: Generating Knowledge Bases from Prover-Skeptic Dialogues

Das Paper stellt Elenchus vor, ein dialogbasiertes System, das mithilfe von Inferentialismus und der NMMS-Logik Wissensbasen durch die strukturierte Auflösung von Spannungen zwischen einem Experten und einem LLM-gestützten Skeptiker konstruiert und dabei die Inferenzbeziehungen formal verifiziert.

Bradley P. Allen2026-03-10💬 cs.CL

A Systematic Investigation of Document Chunking Strategies and Embedding Sensitivity

Diese Studie präsentiert die erste groß angelegte, domänenübergreifende Evaluierung von Dokumenten-Chunking-Strategien für die dichte Suche und zeigt, dass inhaltsbewusste Methoden wie Paragraph-Gruppierung die Retrieval-Leistung im Vergleich zu naiven festen Längen-Splitting-Verfahren erheblich verbessern, wobei sich optimale Strategien je nach Fachgebiet und Embedding-Modell unterscheiden.

Muhammad Arslan Shaukat, Muntasir Adnan, Carlos C. N. Kuhn2026-03-10💬 cs.CL

NePPO: Near-Potential Policy Optimization for General-Sum Multi-Agent Reinforcement Learning

Die vorgestellte Arbeit stellt NePPO vor, einen neuen MARL-Ansatz zur Berechnung approximierter Nash-Gleichgewichte in allgemeinen-summen-Spielen, der durch das Erlernen einer spielerspezifischen Potentialfunktion eine stabile Konvergenz in gemischt kooperativ-kompetitiven Umgebungen ermöglicht und dabei bestehende Baselines wie MAPPO übertrifft.

Addison Kalanther, Sanika Bharvirkar, Shankar Sastry, Chinmay Maheshwari2026-03-10🤖 cs.LG

Diffusion Controller: Framework, Algorithms and Parameterization

Die Arbeit stellt Diffusion Controller (DiffCon) vor, ein einheitliches regelungstheoretisches Framework, das reverse Diffusions-Sampling als stochastische Steuerung in LS-MDPs formuliert und daraus effiziente Reinforcement-Learning-Methoden sowie eine parametrisierte Seiten-Netzwerk-Architektur ableitet, die bei der Feinabstimmung von Diffusionsmodellen zu verbesserten Ergebnissen führt.

Tong Yang, Moonkyung Ryu, Chih-Wei Hsu, Guy Tennenholtz, Yuejie Chi, Craig Boutilier, Bo Dai2026-03-10🤖 cs.LG

Masked Unfairness: Hiding Causality within Zero ATE

Die Arbeit zeigt, dass regulatorische Maßnahmen, die sich ausschließlich auf den durchschnittlichen Behandlungseffekt (ATE) stützen, durch kausales Maskieren getäuscht werden können, was zu erheblicher Ungleichbehandlung führt und eine Regulierung auf Modellebene statt auf Entscheidungsebene erfordert.

Zou Yang, Sophia Xiao, Bijan Mazaheri2026-03-10🤖 cs.LG

Foundational World Models Accurately Detect Bimanual Manipulator Failures

Diese Arbeit stellt einen effizienten, auf einem Weltmodell basierenden Ansatz vor, der mithilfe von Unsicherheitsschätzungen und konformaler Vorhersage bimanuelle Manipulationsfehler zuverlässig erkennt und dabei sowohl die Genauigkeit als auch die Parameter-Effizienz im Vergleich zu bestehenden Methoden deutlich verbessert.

Isaac R. Ward, Michelle Ho, Houjun Liu, Aaron Feldman, Joseph Vincent, Liam Kruse, Sean Cheong, Duncan Eddy, Mykel J. Kochenderfer, Mac Schwager2026-03-10💻 cs

SuperSkillsStack: Agency, Domain Knowledge, Imagination, and Taste in Human-AI Design Education

Die Studie zeigt, dass generative KI im Designunterricht vor allem als kognitiver Beschleuniger in frühen Phasen dient, während menschliche Kompetenzen wie Urteilsvermögen, Domänenwissen und Geschmack entscheidend bleiben, um KI-Ergebnisse zu validieren und zu verfeinern.

Qian Huang, King Wang Poon2026-03-10💻 cs

Can Safety Emerge from Weak Supervision? A Systematic Analysis of Small Language Models

Die Studie stellt Self-MOA vor, ein vollständig automatisiertes Framework, das kleine Sprachmodelle durch schwache Aufsicht und dynamische rote Team-Generierung sicherer macht, wobei es die Sicherheit um 12,41 % verbessert und gleichzeitig die Hilfsbereitschaft erhält, während es den Bedarf an menschlich annotierten Daten im Vergleich zu herkömmlichen Methoden um das 11-fache reduziert.

Punyajoy Saha, Sudipta Halder, Debjyoti Mondal, Subhadarshi Panda2026-03-10🤖 cs.LG

RESCHED: Rethinking Flexible Job Shop Scheduling from a Transformer-based Architecture with Simplified States

Die Arbeit stellt \textsc{ReSched} vor, ein minimalistisches Deep-Reinforcement-Learning-Framework, das den Flexible Job Shop Scheduling Problem durch eine auf vier essenziellen Merkmalen basierende Zustandsdarstellung und eine angepasste Transformer-Architektur löst und dabei sowohl klassische Heuristiken als auch aktuelle neuronale Methoden übertreift.

Xiangjie Xiao, Cong Zhang, Wen Song, Zhiguang Cao2026-03-10🤖 cs.LG

Hit-RAG: Learning to Reason with Long Contexts via Preference Alignment

Die Arbeit stellt Hit-RAG vor, ein mehrstufiges Präferenz-Alignierungs-Framework, das durch eine progressive Optimierung aus Feinabstimmung, diskriminativer Präferenzanpassung und gruppenbasierter Politikoptimierung die Fähigkeit von Multimodalen Large Language Models verbessert, in langen Kontexten relevante Beweise zu identifizieren und logische Schlussfolgerungen ohne Halluzinationen zu treffen.

Junming Liu, Yuqi Li, Shiping Wen, Zhigang Zeng, Tingwen Huang2026-03-10💬 cs.CL

Enhancing Web Agents with a Hierarchical Memory Tree

Die Arbeit stellt den Hierarchical Memory Tree (HMT) vor, ein dreistufiges Gedächtnisframework, das durch die Entkopplung von logischer Planung und Aktionsausführung die Generalisierungsfähigkeit von Web-Agenten auf neuen Websites signifikant verbessert.

Yunteng Tan, Zhi Gao, Xinxiao Wu2026-03-10💻 cs

Self-Supervised Multi-Modal World Model with 4D Space-Time Embedding

Die Arbeit stellt DeepEarth vor, ein selbstüberwachtes multimodales Weltmodell, das den neuartigen 4D-Raumzeit-Positionscodierer Earth4D nutzt, um durch submetergenaue und subsekundenscharfe planetare Vorhersagen über Jahrhunderte hinweg ökologische Prognosen mit State-of-the-Art-Leistung zu ermöglichen.

Lance Legel, Qin Huang, Brandon Voelker, Daniel Neamati, Patrick Alan Johnson, Favyen Bastani, Jeff Rose, James Ryan Hennessy, Robert Guralnick, Douglas Soltis, Pamela Soltis, Shaowen Wang2026-03-10💻 cs

Looking Back and Forth: Cross-Image Attention Calibration and Attentive Preference Learning for Multi-Image Hallucination Mitigation

Die Arbeit stellt CAPL vor, ein Framework zur Reduzierung von Halluzinationen in Large Vision-Language Models bei Multi-Image-Aufgaben, das durch eine kalibrierte Cross-Image-Attention und eine präferenzbasierte Lernstrategie die modellübergreifende Interaktion verbessert und die Modellierung auf echte visuelle Evidenz statt auf textuelle Priors ausrichtet.

Xiaochen Yang, Hao Fang, Jiawei Kong, Yaoxin Mao, Bin Chen, Shu-Tao Xia2026-03-10💻 cs

← Zurück Weiter →