cs.LG Arbeiten | Gist.Science

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

Die Arbeit stellt mit Hospitality-VQA ein neues Benchmark-Dataset und einen Rahmen für die Bewertung der Entscheidungsrelevanz von Vision-Language-Modellen im Hospitality-Bereich vor und zeigt, dass eine gezielte Domänen-Feinabstimmung notwendig ist, um diese Modelle für die zuverlässige Extraktion nutzerrelevanter Informationen aus Hotelbildern zu befähigen.

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Toward Unified Multimodal Representation Learning for Autonomous Driving

Diese Arbeit stellt ein Contrastive Tensor Pre-training (CTP)-Framework vor, das durch die Erweiterung der herkömmlichen paarweisen Ähnlichkeitsberechnung auf einen multimodalen Ähnlichkeitstensor eine einheitliche Ausrichtung von Text-, Bild- und Punktwolken-Daten in einem gemeinsamen Embedding-Raum ermöglicht, um die Leistung autonomer Fahrzeuge zu verbessern.

Ximeng Tao, Dimitar Filev, Gaurav Pandey2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

Diese Arbeit untersucht paralleles Schließen in Sprachmodellen durch die Anwendung von Partikelfilter-Algorithmen wie Sequential Monte Carlo, um theoretische Garantien und fundamentale Grenzen für den Trade-off zwischen Genauigkeit und Kosten bei der Stichprobenziehung zu identifizieren.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?

Die Arbeit stellt VLM-SubtleBench vor, einen Benchmark, der Vision-Language-Modelle anhand feiner Unterschiede in vielfältigen Domänen wie Industrie, Medizin und Luftaufnahmen bewertet und dabei signifikante Leistungslücken im Vergleich zum menschlichen Urteilsvermögen aufdeckt.

Minkyu Kim, Sangheon Lee, Dongmin Park2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

Diese Studie stellt ein entscheidungstheoretisches Framework vor, das KI-Wettervorhersagen mit einem statistischen Modell für sich wandelnde Bauernerwartungen kombiniert, um personalisierte, probabilistische Monsunprognosen zu erstellen, die 2025 erfolgreich 38 Millionen indischen Landwirten halfen, ihre Anbauentscheidungen zu optimieren.

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

SMGI: A Structural Theory of General Artificial Intelligence

Die Arbeit stellt SMGI als eine strukturelle Theorie der allgemeinen künstlichen Intelligenz vor, die das Lernen als kontrollierte Evolution der Lernschnittstelle neu definiert, ein streng formalisiertes Typen-Modell zur Trennung von Struktur und Semantik etabliert und beweist, dass klassische sowie moderne KI-Ansätze als eingeschränkte Instanzen dieses allgemeinen Rahmens fungieren.

Aomar Osmani2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

Die Arbeit stellt LeJOT-AutoML vor, ein von LLM-Agenten gesteuertes AutoML-Framework, das durch die automatische Generierung und Validierung von Laufzeitfeatures die Vorhersage von Job-Ausführungszeiten in Databricks beschleunigt und so die Orchestrierungskosten um 19,01 % senkt.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning

Die Arbeit stellt E²OAL vor, ein einheitliches und detektorfreies Framework für das Open-Set Active Learning, das durch die Nutzung von gelabelten unbekannten Klassen, eine Dirichlet-kalibrierte Hilfskopf-Architektur und eine zweistufige Abfragestrategie sowohl die Genauigkeit als auch die Effizienz bei der Identifizierung informativer Stichproben in offenen Szenarien signifikant verbessert.

Chen-Chen Zong, Yu-Qi Chi, Xie-Yang Wang, Yan Cui, Sheng-Jun Huang2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

Diese Studie stellt einen Bayesian Transformer vor, der drei Unsicherheitsmechanismen in eine PatchTST-Architektur integriert, um in Smart Grids überlegene, kalibrierte probabilistische Lastprognosen zu liefern, die auch bei extremen Wetterereignissen robuste Unsicherheitsschätzungen bieten und damit den aktuellen Stand der Technik übertreffen.

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

Die Arbeit stellt NaviDriveVLM vor, ein entkoppeltes Framework für autonomes Fahren, das ein großes Sprachmodell für die hochrangige Entscheidungsfindung und einen leichtgewichtigen Driver für die Bewegungsplanung kombiniert, um die Effizienz zu steigern und gleichzeitig die Leistung bei der End-to-End-Steuerung zu verbessern.

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

Das Paper stellt DyQ-VLA vor, einen dynamischen Quantisierungsrahmen für Vision-Language-Action-Modelle, der durch eine kinematikgesteuerte Bitbreitenanpassung den Speicherbedarf um 69,1 % reduziert und gleichzeitig die Leistung sowie die Echtzeitgeschwindigkeit erhält.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

Die Arbeit stellt Rel-MOSS vor, einen neuartigen Graph-Neural-Network-Ansatz, der durch relationsspezifische Gating-Mechanismen und eine geführte Überabtastung das Problem des Klassenungleichgewichts bei der Entitätsklassifizierung in relationalen Datenbanken adressiert und damit die Leistung bestehender Methoden signifikant verbessert.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

Robust Transfer Learning with Side Information

Dieser Beitrag stellt ein Transfer-Learning-Framework vor, das durch die Integration von Seiteninformationen wie Momentenbeschränkungen und Dichteverhältnissen in schätz-zentrierte Unsicherheitsmengen robuste, weniger konservative Strategien für Markov-Entscheidungsprozesse unter Umgebungsverschiebungen ermöglicht und dabei die Sample-Effizienz sowie die Ziel-Domain-Leistung im Vergleich zu bestehenden Methoden verbessert.

Akram S. Awad, Shihab Ahmed, Yue Wang, George K. Atia2026-03-10🤖 cs.LG

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Die vorgestellte Arbeit stellt einen KI-gestützten Rahmen vor, der mittels semantischer und syntaktischer Analyse von SQL-Abfragen aggregierte Gesundheitsmetriken auf Datenschutzrisiken bewertet, um eine präventive Governance und sichere datengetriebene Entscheidungsfindung in Gesundheitseinrichtungen zu gewährleisten.

Mohammed Omer Shakeel Ahmed2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

Die Arbeit stellt ELLMob vor, ein selbstabstimmendes LLM-Framework, das unter Verwendung der Fuzzy-Trace-Theorie und eines neu erstellten, ereignisannotierten Datensatzes menschengemäße Mobilitätsdaten generiert, die sowohl gewohnheitsbasierte Muster als auch Einschränkungen durch Großereignisse wie den Taifun Hagibis, die COVID-19-Pandemie und die Olympischen Spiele 2021 in Tokio erfolgreich vereinen.

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG

RL unknotter, hard unknots and unknotting number

Die Autoren stellen eine Reinforcement-Learning-Pipeline vor, die Knotendiagramme vereinfacht und erfolgreich auf „sehr harte" Unknoten sowie auf das verknüpfte Produkt $4_1\#9_{10}$ angewendet wurde, wobei die überraschende obere Schranke von drei für die Unknotungszahl bestätigt werden konnte.

Anne Dranowski, Yura Kabkov, Daniel Tubbenhauer2026-03-10🤖 cs.LG

PSTNet: Physically-Structured Turbulence Network

Die Arbeit stellt PSTNet vor, ein extrem ressourcenschonendes neuronales Netzwerk mit nur 552 Parametern, das physikalische Prinzipien direkt in seine Architektur integriert, um die Echtzeit-Schätzung atmosphärischer Turbulenzen für sicherheitskritische Flugsysteme präziser und effizienter zu ermöglichen als herkömmliche Methoden.

Boris Kriuk, Fedor Kriuk2026-03-10🤖 cs.LG

Local Constrained Bayesian Optimization

Der Artikel stellt LCBO vor, einen neuartigen Rahmen für die Bayessche Optimierung unter Nebenbedingungen in hochdimensionalen Räumen, der durch den Wechsel zwischen lokaler Abstiegs- und explorativer Suche eine polynomial skalierende Konvergenzrate erreicht und damit bestehende Methoden in Bezug auf Effizienz und Leistung übertrifft.

Jing Jingzhe, Fan Zheyi, Szu Hui Ng, Qingpei Hu2026-03-10🤖 cs.LG

Scaling Machine Learning Interatomic Potentials with Mixtures of Experts

Diese Studie entwickelt und analysiert Mixture-of-Experts-Architekturen für maschinelle Lernpotenziale, die durch spärliche Aktivierung und elementweise Routing-Strategien nicht nur eine state-of-the-art Genauigkeit auf mehreren Benchmarks erreichen, sondern auch chemisch interpretierbare Spezialisierungen der Experten aufzeigen.

Yuzhi Liu, Duo Zhang, Anyang Peng, Weinan E, Linfeng Zhang, Han Wang2026-03-10🤖 cs.LG

\$OneMillion-Bench: How Far are Language Agents from Human Experts?

Die Arbeit stellt \$OneMillion-Bench vor, einen Benchmark mit 400 von Experten erstellten Aufgaben aus fünf Fachbereichen, der darauf abzielt, die Zuverlässigkeit und professionelle Tiefe von Sprachagenten in realen, wirtschaftlich bedeutenden Szenarien durch eine rubrikbasierte Bewertung zu messen.

Qianyu Yang, Yang Liu, Jiaqi Li, Jun Bai, Hao Chen, Kaiyuan Chen, Tiliang Duan, Jiayun Dong, Xiaobo Hu, Zixia Jia, Yang Liu, Tao Peng, Yixin Ren, Ran Tian, Zaiyuan Wang, Yanglihong Xiao, Gang Yao, Lingyue Yin, Ge Zhang, Chun Zhang, Jianpeng Jiao, Zilong Zheng, Yuan Gong2026-03-10🤖 cs.LG

← Zurück Weiter →