cs.AI papers | Gist.Science

PnLCalib: Sports Field Registration via Points and Lines Optimization

Dit artikel introduceert PnLCalib, een op optimalisatie gebaseerde kalibratiemethode voor sportvelden die gebruikmaakt van een 3D-soccerfield-model en lijndetectie om nauwkeurigere camera-calibratie te bereiken in broadcast-sportvideo's dan bestaande zoekmethoden.

Marc Gutiérrez-Pérez, Antonio AgudoWed, 11 Ma🤖 cs.AI

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

Deze paper introduceert CoHet, een algoritme dat graph neural networks gebruikt om intrinsieke beloningen te genereren en zo de samenwerking tussen heterogene agents in gedecentraliseerde multi-agent versterkingsleer te verbeteren, zelfs bij gedeeltelijke waarneembaarheid en schaarse beloningen.

Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek KhanWed, 11 Ma🤖 cs.AI

Sparse Variational Student-t Processes for Heavy-tailed Modeling

Deze paper introduceert Sparse Variational Student-t Processes (SVTP), een schaalbaar raamwerk dat de robuustheid van Student-t-processen combineert met efficiënte inference-algoritmen voor het modelleren van zwaarstaartige data en uitbijters, waarbij het aanzienlijk beter presteert dan bestaande methoden op grote datasets.

Jian Xu, Delu Zeng, John PaisleyWed, 11 Ma🤖 cs.AI

Robust Training of Neural Networks at Arbitrary Precision and Sparsity

Deze paper introduceert een unificerend raamwerk dat kwantisatie en verduidelijking als additief ruis modelleert en een afgeleid denoising-dekwantisatietransform toepast om stabiele training van neurale netwerken op willekeurige precisie- en sparsiteitsniveaus mogelijk te maken, waardoor state-of-the-art resultaten worden behaald in ultra-lage precisie-regimes zoals A1W1.

Chengxi Ye, Grace Chu, Yanfeng Liu, Yichi Zhang, Lukasz Lew, Li Zhang, Mark Sandler, Andrew HowardWed, 11 Ma🤖 cs.AI

DRUPI: Dataset Reduction Using Privileged Information

Dit paper introduceert DCPI, een methode voor datasetcondensatie die de prestaties verbetert door naast de gereduceerde dataset ook 'geprivilegieerde informatie' te synthetiseren die als aanvullende supervisie dient tijdens het trainen van modellen.

Shaobo Wang, Youxin Jiang, Tianle Niu, Yantai Yang, Ruiji Zhang, Shuhao Hu, Shuaiyu Zhang, Chenghao Sun, Weiya Li, Conghui He, Xuming Hu, Linfeng ZhangWed, 11 Ma🤖 cs.AI

On the Impact of the Utility in Semivalue-based Data Valuation

Dit artikel introduceert het concept van een 'ruimtelijke signatuur' voor datasets om de robuustheid van semivalue-gebaseerde datawaardering tegen veranderingen in de nuttigheidsfunctie te analyseren en biedt een praktische methode om de stabiliteit van deze waarderingen te kwantificeren.

Mélissa Tamine, Benjamin Heymann, Maxime Vono, Patrick LoiseauWed, 11 Ma🤖 cs.AI

MKE-Coder: Multi-Axial Knowledge with Evidence Verification in ICD Coding for Chinese EMRs

Dit paper introduceert MKE-Coder, een nieuw raamwerk dat multi-axiale kennis en bewijsverificatie combineert om de nauwkeurigheid en snelheid van het automatisch coderen van ICD-codes in Chinese elektronische medische dossiers aanzienlijk te verbeteren.

Xinxin You, Xien Liu, Xue Yang, Ziyi Wang, Ji WuWed, 11 Ma🤖 cs.AI

LLM-Advisor: An LLM Benchmark for Cost-efficient Path Planning across Multiple Terrains

Dit paper introduceert LLM-Advisor, een prompt-based raamwerk dat grote taalmodellen gebruikt als post-processing adviseurs om de kosten-efficiëntie van padplanning over diverse terreinen aanzienlijk te verbeteren zonder de onderliggende planner te wijzigen.

Ling Xiao, Toshihiko YamasakiWed, 11 Ma🤖 cs.AI

HyConEx: Hypernetwork classifier with counterfactual explanations for tabular data

Dit paper introduceert HyConEx, een innovatief diep leermodel voor tabulaire data dat gelijktijdig nauwkeurige classificaties en lokale uitleggen in de vorm van contrafactuele voorbeelden biedt, waardoor het de eerste interpreteerbare classifier is die beide functies in één neurale netwerkbouwkundige combineert.

Patryk Marszałek, Kamil Ksi\k{a}\.zek, Oleksii Furman, Ulvi Movsum-zada, Przemysław Spurek, Marek SmiejaWed, 11 Ma🤖 cs.AI

GateLens: A Reasoning-Enhanced LLM Agent for Automotive Software Release Analytics

Dit paper introduceert GateLens, een LLM-agent die Relational Algebra gebruikt als formele tussenlaag om complexe tabulaire data in de automobielindustrie snel, transparant en betrouwbaar te analyseren, waardoor de analysetijd met meer dan 80% wordt gereduceerd ten opzichte van bestaande methoden.

Arsham Gholamzadeh Khoee, Shuai Wang, Robert Feldt, Dhasarathy Parthasarathy, Yinan YuWed, 11 Ma🤖 cs.AI

A Consequentialist Critique of Binary Classification Evaluation: Theory, Practice, and Tools

Dit paper pleit vanuit een consequentiaalistisch perspectief voor het gebruik van proper scoring rules in plaats van binaire classificatiemetrics, onderbouwd met een theoretisch kader, een empirische analyse van huidige praktijken en de introductie van het Python-pakket `briertools` om deze aanpak toegankelijker te maken.

Gerardo Flores, Abigail Schiff, Alyssa H. Smith, Julia A Fukuyama, Ashia C. WilsonWed, 11 Ma🤖 cs.AI

MCP Bridge: A Lightweight, LLM-Agnostic RESTful Proxy for Model Context Protocol Servers

Dit paper introduceert MCP Bridge, een lichtgewicht RESTful proxy die Model Context Protocol-servers toegankelijk maakt voor resource-beperkte omgevingen via een veilige, LLM-agnostische API, en combineert dit met een geoptimaliseerde Qwen3-variant die op de MCPToolBench++-benchmark aanzienlijk beter presteert dan bestaande baselines.

Arash Ahmadi, Sarah Sharif, Yaser M. BanadWed, 11 Ma🤖 cs.AI

Stepwise Guided Policy Optimization: Coloring your Incorrect Reasoning in GRPO

Dit paper introduceert Stepwise Guided Policy Optimization (SGPO), een framework dat het probleem van volledig negatieve steekproefgroepen in GRPO oplost door gebruik te maken van een stapsgewijze beoordelaar voor diversiteit, waardoor het model effectief kan leren van fouten zonder dat de beoordelaar zelf correcte oplossingen hoeft te genereren.

Peter Chen, Xiaopeng Li, Ziniu Li, Xi Chen, Tianyi LinWed, 11 Ma🤖 cs.AI

Let's Verify Math Questions Step by Step

Dit paper introduceert MathQ-Verify, een nieuw vijfstapsproces dat zorgvuldig slecht gestelde wiskundeproblemen filtert door syntactische validatie, formalisering, logicacontrole en volledigheidstests, waardoor de kwaliteit van wiskundedatasets aanzienlijk verbetert en de F1-score tot 25 procentpunten stijgt ten opzichte van bestaande methoden.

Chengyu Shen, Zhen Hao Wong, Runming He, Hao Liang, Meiyi Qiang, Zimo Meng, Zhengyang Zhao, Bohan Zeng, Zhengzhou Zhu, Bin Cui, Wentao ZhangWed, 11 Ma🤖 cs.AI

UltraEdit: Training-, Subject-, and Memory-Free Lifelong Editing in Language Models

Dit paper introduceert UltraEdit, een trainings-, onderwerp- en geheugenloze methode voor het levenslang bijwerken van taalmodellen die aanzienlijk sneller en minder geheugenintensief is dan bestaande technieken, waardoor het zelfs op consumentenhardware mogelijk wordt om miljoenen bewerkingen uit te voeren zonder bestaande vaardigheden te verliezen.

Xiaojie Gu, Ziying Huang, Jia-Chen Gu, Kai ZhangWed, 11 Ma🤖 cs.AI

SATURN: SAT-based Reinforcement Learning to Unleash LLMs Reasoning

Het paper introduceert SATURN, een reinforcement learning-framework dat gebruikmaakt van Boolean Satisfiability-problemen om de redeneercapaciteit van grote taalmodellen schaalbaar, verifieerbaar en met gecontroleerde moeilijkheidsgraad te trainen via een curriculum learning-aanpak.

Huanyu Liu, Ge Li, Jia Li, Hao Zhu, Kechi Zhang, Yihong DongWed, 11 Ma🤖 cs.AI

Daily-Omni: Towards Audio-Visual Reasoning with Temporal Alignment across Modalities

Deze paper introduceert Daily-Omni, een nieuw meerkeuze benchmark voor audio-visuele vragen die de uitdagingen blootlegt van bestaande multimodale modellen bij het synchroniseren van tijdsafhankelijke informatie tussen auditieve en visuele modaliteiten.

Ziwei Zhou, Rui Wang, Zuxuan Wu, Yu-Gang JiangWed, 11 Ma🤖 cs.AI

Rating Quality of Diverse Time Series Data by Meta-learning from LLM Judgment

Dit paper introduceert TSRating, een uniek raamwerk dat meta-learning en Large Language Models combineert om de kwaliteit van tijdreeksdata uit diverse domeinen nauwkeurig en efficiënt te beoordelen.

Shunyu Wu, Dan Li, Wenjie Feng, Haozheng Ye, Jian Lou, See-Kiong NgWed, 11 Ma🤖 cs.AI

Cooperative Game-Theoretic Credit Assignment for Multi-Agent Policy Gradients via the Core

Dit paper introduceert CORA, een methode voor credit assignment in multi-agent reinforcement learning die gebruikmaakt van coöperatieve speltheorie en kernallocatie om agenten effectiever te belonen op basis van hun coalitiële bijdragen, wat leidt tot verbeterde gecoördineerde prestaties.

Mengda Ji, Genjiu Xu, Keke Jia, Zekun Duan, Yong Qiu, Jianjun Ge, Mingqiang LiWed, 11 Ma🤖 cs.AI

Towards Robust Real-World Multivariate Time Series Forecasting: A Unified Framework for Dependency, Asynchrony, and Missingness

Dit artikel introduceert ChannelTokenFormer, een Transformer-gebaseerd raamwerk dat tegelijkertijd complexe kanaalafhankelijkheden, asynchrone bemonstering en ontbrekende waarden aanpakt om robuuste multivariate tijdreeksvoorspellingen in real-world scenario's mogelijk te maken.

Jinkwan Jang, Hyungjin Park, Jinmyeong Choi, Taesup KimWed, 11 Ma🤖 cs.AI