PnLCalib: Sports Field Registration via Points and Lines Optimization

Der Artikel stellt PnLCalib vor, eine optimierungsbasierte Methode zur Kalibrierung von Sportkameras in Übertragungsvideos, die durch die Kombination eines 3D-Fußballfeldmodils mit einer nichtlinearen Verfeinerung mittels erkannten Feldlinien eine robustere und präzisere Registrierung unter schwierigen Bedingungen wie variierenden Kamerawinkeln und Verdeckungen ermöglicht.

Marc Gutiérrez-Pérez, Antonio AgudoWed, 11 Ma🤖 cs.AI

Sparse Variational Student-t Processes for Heavy-tailed Modeling

Die vorgestellte Arbeit führt Sparse Variational Student-t Processes (SVTP) ein, ein skalierbares Framework, das durch zwei neue Inferenzalgorithmen und eine natürliche Gradientenoptimierung robuste und effiziente Modellierungen für Daten mit Ausreißern und schweren Verteilungsenden ermöglicht und dabei Sparse Gaussian Processes in Genauigkeit und Konvergenzgeschwindigkeit übertrifft.

Jian Xu, Delu Zeng, John PaisleyWed, 11 Ma🤖 cs.AI

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

Die Arbeit stellt ein einheitliches Framework vor, das Quantisierung und Sparsifizierung als additives Rauschen modelliert und durch eine prinzipiengeleitete Denoisings-Transformation eine stabile Gradientenbahn schafft, wodurch das Training von neuronalen Netzen mit beliebiger Präzision und Sparsity, einschließlich sub-1-Bit-Architekturen, ermöglicht wird.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs

Das Paper stellt MKE-Coder vor, ein neuartiges Framework zur automatischen ICD-Codierung in chinesischen elektronischen Patientenakten, das durch die Nutzung multi-axialer Krankheitswissen und eine evidenzbasierte Verifizierung die Herausforderungen bei der Extraktion relevanter Informationen und die Verbesserung der Codiergenauigkeit und -geschwindigkeit adressiert.

Xinxin You, Xien Liu, Xue Yang, Ziyi Wang, Ji WuWed, 11 Ma🤖 cs.AI

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

Die Arbeit stellt LLM-Advisor vor, ein Prompt-basiertes Framework, das große Sprachmodelle als nicht-entscheidende Nachbearbeitungsberater nutzt, um die Kosteneffizienz von Pfadplanungen über verschiedene Geländetypen zu verbessern und dabei durch spezielle Strategien Halluzinationen minimiert, was in Experimenten zu signifikanten Verbesserungen bestehender Planungsalgorithmen führte.

Ling Xiao, Toshihiko YamasakiWed, 11 Ma🤖 cs.AI

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Der Artikel stellt HyConEx vor, einen neuartigen Deep-Learning-Klassifikator für tabellarische Daten, der dank seiner Hypernetzwerk-Architektur sowohl präzise Vorhersagen trifft als auch gleichzeitig lokale, erklärbare Gegenbeispiele (Counterfactuals) generiert, um die Entscheidungsfindung des Modells transparent zu machen.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Das Paper stellt GateLens vor, ein LLM-basiertes System für die Automobilsoftware-Analyse, das durch die Verwendung relationaler Algebra als formale Zwischenrepräsentation zwischen natürlicher Sprache und ausführbarem Code die Zuverlässigkeit und Geschwindigkeit bei der Verarbeitung komplexer tabellarischer Daten im Vergleich zu herkömmlichen Ansätzen signifikant verbessert.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Diese Arbeit kritisiert die vorherrschende Abhängigkeit von binären Klassifikationsmetriken in der ML-Praxis, plädiert für einen konsequentialistischen Ansatz mit angemessenen Scoring-Regeln wie dem Brier-Score, und stellt dazu einen theoretischen Rahmen sowie das Python-Paket \texttt{briertools} vor, um die Bewertung probabilistischer Vorhersagen praxisnah zu verbessern.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

MCP Bridge: A Lightweight, LLM-Agnostic RESTful Proxy for Model Context Protocol Servers

Die Arbeit stellt MCP Bridge vor, einen leichtgewichtigen, LLM-agnostischen RESTful-Proxy, der die Einschränkungen lokaler MCP-Server umgeht und durch eine sichere, plattformübergreifende Schnittstelle sowie ein speziell für strenge Protokollkonformität optimiertes Qwen3-Modell die Integration von LLMs in ressourcenbeschränkten Umgebungen ermöglicht.

Arash Ahmadi, Sarah Sharif, Yaser M. BanadWed, 11 Ma🤖 cs.AI

Let's Verify Math Questions Step by Step

Die Arbeit stellt MathQ-Verify vor, eine neuartige Fünf-Phasen-Pipeline, die mathematische Fragen durch formale Validierung, Zerlegung in atomare Bedingungen und logische Konsistenzprüfung rigoros auf Fehler hin überprüft, um die Qualität von Trainingsdaten für Large Language Models zu verbessern.

Chengyu Shen, Zhen Hao Wong, Runming He, Hao Liang, Meiyi Qiang, Zimo Meng, Zhengyang Zhao, Bohan Zeng, Zhengzhou Zhu, Bin Cui, Wentao ZhangWed, 11 Ma🤖 cs.AI

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Das Paper stellt UltraEdit vor, eine hocheffiziente, speicher- und trainingsfreie Methode für das lebenslange Editieren von Sprachmodellen, die durch eine einstufige Parameteranpassung und Normalisierungsstrategie eine bisher unerreichte Skalierbarkeit auf Consumer-Hardware ermöglicht und durch den neu eingeführten UltraEditBench-Datensatz mit über 2 Millionen Editierungen validiert wird.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

Daily-Omni: Towards Audio-Visual Reasoning with Temporal Alignment across Modalities

Die Arbeit stellt Daily-Omni vor, ein neues Audio-Visuelles-QA-Benchmark mit 684 Videos und 1.197 Fragen, das die Fähigkeit von Multimodalen Large Language Models zur synchronen Verarbeitung und temporalen Ausrichtung über Modalitäten hinweg evaluiert und dabei zeigt, dass viele aktuelle Modelle bei solchen Aufgaben noch erhebliche Schwierigkeiten haben.

Ziwei Zhou, Rui Wang, Zuxuan Wu, Yu-Gang JiangWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Die Arbeit stellt CORA vor, eine Methode zur Kreditvergabe im kooperativen Multi-Agenten-Reinforcement-Learning, die mithilfe des Kerns der kooperativen Spieltheorie und zufälliger Koalitionsstichproben globale Vorteile effizient auf Agenten verteilt, um koordiniertes Verhalten zu fördern und die Leistung gegenüber bestehenden Baselines zu verbessern.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI