Emulating Clinician Cognition via Self-Evolving Deep Clinical Research

Die Studie stellt DxEvolve vor, einen sich selbst weiterentwickelnden diagnostischen Agenten, der durch einen interaktiven klinischen Forschungsprozess die menschliche klinische Kognition nachahmt und die Diagnosegenauigkeit signifikant verbessert, indem er klinische Erfahrung in ein steuerbares Lernasset umwandelt.

Ruiyang Ren, Yuhao Wang, Yunsen Liang, Lan Luo, Jing Liu, Haifeng Wang, Cong Feng, Yinan Zhang, Chunyan Miao, Ji-Rong Wen, Wayne Xin Zhao2026-03-12🤖 cs.AI

A Platform-Agnostic Multimodal Digital Human Modelling Framework: Neurophysiological Sensing in Game-Based Interaction

Dieser Beitrag stellt ein plattformunabhängiges Framework für die digitale Menschmodellierung vor, das mithilfe des OpenBCI Galea-Headsets multimodale Neurophysiologiedaten in einer reproduzierbaren SuperTux-Spielumgebung erfasst und strukturiert bereitstellt, um zukünftige ethisch genehmigte KI-Forschung im Bereich Barrierefreiheit und Interaktionsdesign zu ermöglichen, ohne dabei eigene KI-Inferenzmodelle zu integrieren.

Daniel J. Buxton, Mufti Mahmud, Jordan J. Bird, Thomas Hughes-Roberts, David J. Brown2026-03-12🤖 cs.AI

EvoSchema: Towards Text-to-SQL Robustness Against Schema Evolution

Das Paper stellt EvoSchema vor, ein umfassendes Benchmark-Tool mit einer neuen Taxonomie von Schema-Änderungen, das die Robustheit von Text-to-SQL-Modellen gegenüber realen Datenbank-Evolutionen bewertet und zeigt, dass Modelle, die auf solchen vielfältigen Schemata trainiert werden, deutlich widerstandsfähiger gegen Leistungsabfall sind.

Tianshu Zhang, Kun Qian, Siddhartha Sahai, Yuan Tian, Shaddy Garg, Huan Sun, Yunyao Li2026-03-12💬 cs.CL

AlphaFlowTSE: One-Step Generative Target Speaker Extraction via Conditional AlphaFlow

Das Paper stellt AlphaFlowTSE vor, ein einstufiges generatives Modell für die Extraktion von Zielsprechern aus Mehrsprecher-Mischungen, das durch einen JVP-freien AlphaFlow-Zielwert und eine Lehrer-Schüler-Struktur Latenz reduziert und gleichzeitig die Ähnlichkeit zum Zielsprecher sowie die Robustheit für die automatische Spracherkennung verbessert.

Duojia Li, Shuhan Zhang, Zihan Qian, Wenxuan Wu, Shuai Wang, Qingyang Hong, Lin Li, Haizhou Li2026-03-12🤖 cs.AI

UAV traffic scene understanding: A cross-spectral guided approach and a unified benchmark

Die Arbeit stellt CTCNet vor, ein neuartiges, cross-spektrales Netzwerk mit Wissens-Einbettung und spektraler Kompensation für eine robuste UAV-Verkehrsszenenanalyse unter schwierigen Lichtverhältnissen, und stellt gleichzeitig Traffic-VQA, den ersten großskaligen optisch-thermischen Benchmark für kognitive Verkehrsverständnis-Aufgaben, vor.

Yu Zhang, Zhicheng Zhao, Ze Luo, Chenglong Li, Jin Tang2026-03-12🤖 cs.AI

Towards Robust Speech Deepfake Detection via Human-Inspired Reasoning

Die Arbeit stellt HIR-SDD vor, ein neuartiges Framework zur Erkennung von Sprach-Deepfakes, das Large Audio Language Models mit menschenähnlichem Chain-of-Thought-Reasoning auf Basis eines neu annotierten Datensatzes kombiniert, um sowohl die Generalisierungsfähigkeit als auch die Interpretierbarkeit der Vorhersagen zu verbessern.

Artem Dvirniak, Evgeny Kushnir, Dmitrii Tarasov, Artem Iudin, Oleg Kiriukhin, Mikhail Pautov, Dmitrii Korzh, Oleg Y. Rogov2026-03-12🤖 cs.AI