Sparse Variational Student-t Processes for Heavy-tailed Modeling

Die vorgestellte Arbeit führt Sparse Variational Student-t Processes (SVTP) ein, ein skalierbares Framework, das durch zwei neue Inferenzalgorithmen und eine natürliche Gradientenoptimierung robuste und effiziente Modellierungen für Daten mit Ausreißern und schweren Verteilungsenden ermöglicht und dabei Sparse Gaussian Processes in Genauigkeit und Konvergenzgeschwindigkeit übertrifft.

Jian Xu, Delu Zeng, John Paisley2026-03-11🤖 cs.AI

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

Die Arbeit stellt ein einheitliches Framework vor, das Quantisierung und Sparsifizierung als additives Rauschen modelliert und durch eine prinzipiengeleitete Denoisings-Transformation eine stabile Gradientenbahn schafft, wodurch das Training von neuronalen Netzen mit beliebiger Präzision und Sparsity, einschließlich sub-1-Bit-Architekturen, ermöglicht wird.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew Howard2026-03-11🤖 cs.AI

MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs

Das Paper stellt MKE-Coder vor, ein neuartiges Framework zur automatischen ICD-Codierung in chinesischen elektronischen Patientenakten, das durch die Nutzung multi-axialer Krankheitswissen und eine evidenzbasierte Verifizierung die Herausforderungen bei der Extraktion relevanter Informationen und die Verbesserung der Codiergenauigkeit und -geschwindigkeit adressiert.

Xinxin You, Xien Liu, Xue Yang, Ziyi Wang, Ji Wu2026-03-11🤖 cs.AI

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

Die Arbeit stellt LLM-Advisor vor, ein Prompt-basiertes Framework, das große Sprachmodelle als nicht-entscheidende Nachbearbeitungsberater nutzt, um die Kosteneffizienz von Pfadplanungen über verschiedene Geländetypen zu verbessern und dabei durch spezielle Strategien Halluzinationen minimiert, was in Experimenten zu signifikanten Verbesserungen bestehender Planungsalgorithmen führte.

Ling Xiao, Toshihiko Yamasaki2026-03-11🤖 cs.AI

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Der Artikel stellt HyConEx vor, einen neuartigen Deep-Learning-Klassifikator für tabellarische Daten, der dank seiner Hypernetzwerk-Architektur sowohl präzise Vorhersagen trifft als auch gleichzeitig lokale, erklärbare Gegenbeispiele (Counterfactuals) generiert, um die Entscheidungsfindung des Modells transparent zu machen.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek Smieja2026-03-11🤖 cs.AI

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Das Paper stellt GateLens vor, ein LLM-basiertes System für die Automobilsoftware-Analyse, das durch die Verwendung relationaler Algebra als formale Zwischenrepräsentation zwischen natürlicher Sprache und ausführbarem Code die Zuverlässigkeit und Geschwindigkeit bei der Verarbeitung komplexer tabellarischer Daten im Vergleich zu herkömmlichen Ansätzen signifikant verbessert.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan Yu2026-03-11🤖 cs.AI

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Diese Arbeit kritisiert die vorherrschende Abhängigkeit von binären Klassifikationsmetriken in der ML-Praxis, plädiert für einen konsequentialistischen Ansatz mit angemessenen Scoring-Regeln wie dem Brier-Score, und stellt dazu einen theoretischen Rahmen sowie das Python-Paket \texttt{briertools} vor, um die Bewertung probabilistischer Vorhersagen praxisnah zu verbessern.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. Wilson2026-03-11🤖 cs.AI

MCP Bridge: A Lightweight, LLM-Agnostic RESTful Proxy for Model Context Protocol Servers

Die Arbeit stellt MCP Bridge vor, einen leichtgewichtigen, LLM-agnostischen RESTful-Proxy, der die Einschränkungen lokaler MCP-Server umgeht und durch eine sichere, plattformübergreifende Schnittstelle sowie ein speziell für strenge Protokollkonformität optimiertes Qwen3-Modell die Integration von LLMs in ressourcenbeschränkten Umgebungen ermöglicht.

Arash Ahmadi, Sarah Sharif, Yaser M. Banad2026-03-11🤖 cs.AI

Let's Verify Math Questions Step by Step

Die Arbeit stellt MathQ-Verify vor, eine neuartige Fünf-Phasen-Pipeline, die mathematische Fragen durch formale Validierung, Zerlegung in atomare Bedingungen und logische Konsistenzprüfung rigoros auf Fehler hin überprüft, um die Qualität von Trainingsdaten für Large Language Models zu verbessern.

Chengyu Shen, Zhen Hao Wong, Runming He, Hao Liang, Meiyi Qiang, Zimo Meng, Zhengyang Zhao, Bohan Zeng, Zhengzhou Zhu, Bin Cui, Wentao Zhang2026-03-11🤖 cs.AI

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Das Paper stellt UltraEdit vor, eine hocheffiziente, speicher- und trainingsfreie Methode für das lebenslange Editieren von Sprachmodellen, die durch eine einstufige Parameteranpassung und Normalisierungsstrategie eine bisher unerreichte Skalierbarkeit auf Consumer-Hardware ermöglicht und durch den neu eingeführten UltraEditBench-Datensatz mit über 2 Millionen Editierungen validiert wird.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai Zhang2026-03-11🤖 cs.AI

Daily-Omni: Towards Audio-Visual Reasoning with Temporal Alignment across Modalities

Die Arbeit stellt Daily-Omni vor, ein neues Audio-Visuelles-QA-Benchmark mit 684 Videos und 1.197 Fragen, das die Fähigkeit von Multimodalen Large Language Models zur synchronen Verarbeitung und temporalen Ausrichtung über Modalitäten hinweg evaluiert und dabei zeigt, dass viele aktuelle Modelle bei solchen Aufgaben noch erhebliche Schwierigkeiten haben.

Ziwei Zhou, Rui Wang, Zuxuan Wu, Yu-Gang Jiang2026-03-11🤖 cs.AI

Embodied AI with Foundation Models for Mobile Service Robots: A Systematic Review

Diese systematische Übersicht untersucht die Integration von Foundation-Modellen in mobile Serviceroboter, indem sie technische Fortschritte bei der Aufgabenausführung und multimodalen Wahrnehmung analysiert, reale Anwendungsbereiche beleuchtet und ethische sowie zukünftige Forschungsfragen im Kontext sicherer und vertrauenswürdiger Mensch-Roboter-Interaktionen diskutiert.

Matthew Lisondra, Beno Benhabib, Goldie Nejat2026-03-11💬 cs.CL