cs.AI Arbeiten | Gist.Science

PnLCalib: Sports Field Registration via Points and Lines Optimization

Der Artikel stellt PnLCalib vor, eine optimierungsbasierte Methode zur Kalibrierung von Sportkameras in Übertragungsvideos, die durch die Kombination eines 3D-Fußballfeldmodils mit einer nichtlinearen Verfeinerung mittels erkannten Feldlinien eine robustere und präzisere Registrierung unter schwierigen Bedingungen wie variierenden Kamerawinkeln und Verdeckungen ermöglicht.

Marc Gutiérrez-Pérez, Antonio AgudoWed, 11 Ma🤖 cs.AI

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

Die vorgestellte Arbeit stellt CoHet vor, einen dezentralen Multi-Agenten-Reinforcement-Learning-Algorithmus, der mittels graphbasierten intrinsischen Belohnungen die Zusammenarbeit heterogener Agenten unter Bedingungen partieller Beobachtbarkeit und seltener Umweltbelohnungen effektiv verbessert.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Sparse Variational Student-t Processes for Heavy-tailed Modeling

Die vorgestellte Arbeit führt Sparse Variational Student-t Processes (SVTP) ein, ein skalierbares Framework, das durch zwei neue Inferenzalgorithmen und eine natürliche Gradientenoptimierung robuste und effiziente Modellierungen für Daten mit Ausreißern und schweren Verteilungsenden ermöglicht und dabei Sparse Gaussian Processes in Genauigkeit und Konvergenzgeschwindigkeit übertrifft.

Jian Xu, Delu Zeng, John PaisleyWed, 11 Ma🤖 cs.AI

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

Die Arbeit stellt ein einheitliches Framework vor, das Quantisierung und Sparsifizierung als additives Rauschen modelliert und durch eine prinzipiengeleitete Denoisings-Transformation eine stabile Gradientenbahn schafft, wodurch das Training von neuronalen Netzen mit beliebiger Präzision und Sparsity, einschließlich sub-1-Bit-Architekturen, ermöglicht wird.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

DRUPI: Dataset Reduction Using Privileged Information

Die Arbeit stellt DRUPI vor, eine Methode zur Datensatzkondensation, die durch die Synthese privilegierter Informationen wie Feature- oder Attention-Labels die Leistung von reduzierten Datensätzen erheblich verbessert.

Shaobo Wang, Youxin Jiang, Tianle Niu, Yantai Yang, Ruiji Zhang, Shuhao Hu, Shuaiyu Zhang, Chenghao Sun, Weiya Li, Conghui He, Xuming Hu, Linfeng ZhangWed, 11 Ma🤖 cs.AI

On the Impact of the Utility in Semivalue-based Data Valuation

Diese Arbeit führt das Konzept der räumlichen Signatur von Datensätzen ein, um die Robustheit semivalu-basierter Datenbewertung gegenüber Änderungen der Nutzenfunktion zu analysieren und eine praktische Methodik zur Quantifizierung dieser Stabilität zu entwickeln.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs

Das Paper stellt MKE-Coder vor, ein neuartiges Framework zur automatischen ICD-Codierung in chinesischen elektronischen Patientenakten, das durch die Nutzung multi-axialer Krankheitswissen und eine evidenzbasierte Verifizierung die Herausforderungen bei der Extraktion relevanter Informationen und die Verbesserung der Codiergenauigkeit und -geschwindigkeit adressiert.

Xinxin You, Xien Liu, Xue Yang, Ziyi Wang, Ji WuWed, 11 Ma🤖 cs.AI

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

Die Arbeit stellt LLM-Advisor vor, ein Prompt-basiertes Framework, das große Sprachmodelle als nicht-entscheidende Nachbearbeitungsberater nutzt, um die Kosteneffizienz von Pfadplanungen über verschiedene Geländetypen zu verbessern und dabei durch spezielle Strategien Halluzinationen minimiert, was in Experimenten zu signifikanten Verbesserungen bestehender Planungsalgorithmen führte.

Ling Xiao, Toshihiko YamasakiWed, 11 Ma🤖 cs.AI

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Der Artikel stellt HyConEx vor, einen neuartigen Deep-Learning-Klassifikator für tabellarische Daten, der dank seiner Hypernetzwerk-Architektur sowohl präzise Vorhersagen trifft als auch gleichzeitig lokale, erklärbare Gegenbeispiele (Counterfactuals) generiert, um die Entscheidungsfindung des Modells transparent zu machen.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Das Paper stellt GateLens vor, ein LLM-basiertes System für die Automobilsoftware-Analyse, das durch die Verwendung relationaler Algebra als formale Zwischenrepräsentation zwischen natürlicher Sprache und ausführbarem Code die Zuverlässigkeit und Geschwindigkeit bei der Verarbeitung komplexer tabellarischer Daten im Vergleich zu herkömmlichen Ansätzen signifikant verbessert.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Diese Arbeit kritisiert die vorherrschende Abhängigkeit von binären Klassifikationsmetriken in der ML-Praxis, plädiert für einen konsequentialistischen Ansatz mit angemessenen Scoring-Regeln wie dem Brier-Score, und stellt dazu einen theoretischen Rahmen sowie das Python-Paket \texttt{briertools} vor, um die Bewertung probabilistischer Vorhersagen praxisnah zu verbessern.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

MCP Bridge: A Lightweight, LLM-Agnostic RESTful Proxy for Model Context Protocol Servers

Die Arbeit stellt MCP Bridge vor, einen leichtgewichtigen, LLM-agnostischen RESTful-Proxy, der die Einschränkungen lokaler MCP-Server umgeht und durch eine sichere, plattformübergreifende Schnittstelle sowie ein speziell für strenge Protokollkonformität optimiertes Qwen3-Modell die Integration von LLMs in ressourcenbeschränkten Umgebungen ermöglicht.

Arash Ahmadi, Sarah Sharif, Yaser M. BanadWed, 11 Ma🤖 cs.AI

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

Die Arbeit stellt SGPO vor, einen neuen Ansatz, der die Lernfähigkeit von GRPO verbessert, indem er durch einen schrittweisen Bewertungsmodell die Lernsignale aus Gruppen vollständig falscher Antworten nutzbar macht, anstatt sie zu verwerfen.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi LinWed, 11 Ma🤖 cs.AI

Let's Verify Math Questions Step by Step

Die Arbeit stellt MathQ-Verify vor, eine neuartige Fünf-Phasen-Pipeline, die mathematische Fragen durch formale Validierung, Zerlegung in atomare Bedingungen und logische Konsistenzprüfung rigoros auf Fehler hin überprüft, um die Qualität von Trainingsdaten für Large Language Models zu verbessern.

Chengyu Shen, Zhen Hao Wong, Runming He, Hao Liang, Meiyi Qiang, Zimo Meng, Zhengyang Zhao, Bohan Zeng, Zhengzhou Zhu, Bin Cui, Wentao ZhangWed, 11 Ma🤖 cs.AI

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Das Paper stellt UltraEdit vor, eine hocheffiziente, speicher- und trainingsfreie Methode für das lebenslange Editieren von Sprachmodellen, die durch eine einstufige Parameteranpassung und Normalisierungsstrategie eine bisher unerreichte Skalierbarkeit auf Consumer-Hardware ermöglicht und durch den neu eingeführten UltraEditBench-Datensatz mit über 2 Millionen Editierungen validiert wird.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

Das Paper stellt SATURN vor, ein Reinforcement-Learning-Framework, das mithilfe von SAT-Problemen (Boolean Satisfiability) eine skalierbare, verifizierbare und präzise steuerbare Lernkurve ermöglicht, um die reasoning-Fähigkeiten von LLMs von einfachen zu komplexen Aufgaben systematisch zu verbessern.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong DongWed, 11 Ma🤖 cs.AI

Daily-Omni: Towards Audio-Visual Reasoning with Temporal Alignment across Modalities

Die Arbeit stellt Daily-Omni vor, ein neues Audio-Visuelles-QA-Benchmark mit 684 Videos und 1.197 Fragen, das die Fähigkeit von Multimodalen Large Language Models zur synchronen Verarbeitung und temporalen Ausrichtung über Modalitäten hinweg evaluiert und dabei zeigt, dass viele aktuelle Modelle bei solchen Aufgaben noch erhebliche Schwierigkeiten haben.

Ziwei Zhou, Rui Wang, Zuxuan Wu, Yu-Gang JiangWed, 11 Ma🤖 cs.AI

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

Das Paper stellt TSRating vor, ein neuartiges Meta-Learning-Framework, das die Qualität von Zeitreihendaten aus unterschiedlichen Domänen bewertet, indem es die Urteilsfähigkeit von Large Language Models nutzt und durch effiziente Meta-Learning-Verfahren in eine skalierbare Bewertungsmethode überführt.

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong NgWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Die Arbeit stellt CORA vor, eine Methode zur Kreditvergabe im kooperativen Multi-Agenten-Reinforcement-Learning, die mithilfe des Kerns der kooperativen Spieltheorie und zufälliger Koalitionsstichproben globale Vorteile effizient auf Agenten verteilt, um koordiniertes Verhalten zu fördern und die Leistung gegenüber bestehenden Baselines zu verbessern.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

Die Arbeit stellt ChannelTokenFormer vor, ein Transformer-basiertes Framework, das durch die gleichzeitige Modellierung von Kanalabhängigkeiten, asynchroner Abtastung und fehlenden Werten eine robuste multivariate Zeitreihenvorhersage unter realen Bedingungen ermöglicht.

Jinkwan Jang, Hyungjin Park, Jinmyeong Choi, Taesup KimWed, 11 Ma🤖 cs.AI

Weiter →