cs.LG papers | Gist.Science

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

Dit artikel introduceert Hospitality-VQA, een nieuwe dataset en evaluatieframework voor informativiteit, om te onderzoeken hoe Vision-Language Models beslissingsgerelateerde vragen over hotelvoorzieningen kunnen beantwoorden en hoe domeinspecifieke finetuning de bruikbaarheid van deze modellen verbetert.

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

Toward Unified Multimodal Representation Learning for Autonomous Driving

Dit paper introduceert het Contrastive Tensor Pre-training (CTP)-framework, dat door het vervangen van paarwijze vergelijkingen door een gezamenlijke tensorbenadering, een consistente en verenigde uitlijning van tekst, afbeeldingen en puntwolkdata realiseert voor verbeterde autonome rijprestaties.

Ximeng Tao, Dimitar Filev, Gaurav Pandey2026-03-10🤖 cs.LG

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

Dit paper introduceert een theoretisch kader gebaseerd op deeltjesschermen (particle filtering) om de nauwkeurigheids-kostentrade-offs van inferentiemethoden voor grote taalmodellen die meerdere samples aggregeren en pruning toepassen, rigoureus te analyseren en fundamentele grenzen te identificeren.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

VLM-SubtleBench: How Far Are VLMs from Human-Level Subtle Comparative Reasoning?

Dit paper introduceert VLM-SubtleBench, een nieuw meetinstrument dat VLM's evalueert op hun vermogen om subtiele verschillen in diverse domeinen zoals industrie en medische beeldvorming te onderscheiden, en blootlegt dat er nog een aanzienlijke kloof bestaat tussen model- en menselijke prestaties.

Minkyu Kim, Sangheon Lee, Dongmin Park2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

Dit artikel beschrijft een nieuw besluitvormingskader en een hybride AI-statistisch voorspellingsmodel voor de Indiase moesson, dat in 2025 operationeel werd ingezet om 38 miljoen boeren nauwkeurige, op maat gemaakte seizoensvoorspellingen te bieden voor betere landbouwbeslissingen.

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

SMGI: A Structural Theory of General Artificial Intelligence

Dit paper introduceert SMGI, een structurele theorie voor algemeen kunstmatige intelligentie die leren herkijkt als de gecontroleerde evolutie van het leerinterface en bewijst dat bestaande methoden zoals versterkend leren en empirisch risicominimalisatie beperkte instanties zijn van dit uitgebreide raamwerk.

Aomar Osmani2026-03-10🤖 cs.LG

LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

Het paper introduceert LeJOT-AutoML, een door LLM-agenten aangedreven AutoML-framework dat automatisch complexe runtime-kenmerken genereert voor het voorspellen van uitvoeringstijden in Databricks, waardoor de feature-engineeringcyclus van weken naar minuten wordt teruggebracht en de kosten met 19,01% worden verlaagd.

Lizhi Ma, Yi-Xiang Hu, Yihui Ren, Feng Wu, Xiang-Yang Li2026-03-10🤖 cs.LG

Revisiting Unknowns: Towards Effective and Efficient Open-Set Active Learning

Dit artikel introduceert E²OAL, een unified en detector-vrij raamwerk voor open-set actief leren dat gelabelde onbekende klassen effectief benut via label-gestuurde clustering en Dirichlet-gecalibreerde hulpkoppen om zowel de nauwkeurigheid als de efficiëntie te verbeteren zonder de hoge trainingskosten van bestaande methoden.

Chen-Chen Zong, Yu-Qi Chi, Xie-Yang Wang, Yan Cui, Sheng-Jun Huang2026-03-10🤖 cs.LG

Bayesian Transformer for Probabilistic Load Forecasting in Smart Grids

Dit artikel introduceert een Bayesiaanse Transformer die drie onzekerheidsmechanismen combineert om in slimme netten nauwkeurige, goed gekalibreerde probabilistische lastprognoses te genereren die robuust zijn onder extreme weersomstandigheden en de prestaties van bestaande modellen aanzienlijk verbeteren.

Sajib Debnath, Md. Uzzal Mia2026-03-10🤖 cs.LG

NaviDriveVLM: Decoupling High-Level Reasoning and Motion Planning for Autonomous Driving

Dit paper introduceert NaviDriveVLM, een gefragmenteerd framework dat redenering en bewegingsplanning voor autonoom rijden ontkoppelt via een grote Navigator en een lichte Driver, waardoor het de prestaties van bestaande visueel-taalmodellen op de nuScenes-benchmark verbetert terwijl de trainingskosten worden verlaagd.

Ximeng Tao, Pardis Taghavi, Dimitar Filev, Reza Langari, Gaurav Pandey2026-03-10🤖 cs.LG

DyQ-VLA: Temporal-Dynamic-Aware Quantization for Embodied Vision-Language-Action Models

DyQ-VLA is een dynamisch kwantisatiekader voor Vision-Language-Action-modellen dat tijdsafhankelijke gevoeligheid benut om de geheugenvoetafdruk met 69,1% te verminderen en de snelheid te verhogen, terwijl 99,5% van de oorspronkelijke prestaties behouden blijft.

Zihao Zheng, Hangyu Cao, Sicheng Tian, Jiayu Chen, Maoliang Li, Xinhao Sun, Hailong Zou, Zhaobo Zhang, Xuanzhe Liu, Donggang Cao, Hong Mei, Xiang Chen2026-03-10🤖 cs.LG

Rel-MOSS: Towards Imbalanced Relational Deep Learning on Relational Databases

Dit paper introduceert Rel-MOSS, een relationeel deep learning-model dat het probleem van class imbalance in relationele databases aanpakt door een relation-gestuurde over-sampling-methode te gebruiken die de prestaties significant verbetert ten opzichte van bestaande methoden.

Jun Yin, Peng Huo, Bangguo Zhu, Hao Yan, Senzhang Wang, Shirui Pan, Chengqi Zhang2026-03-10🤖 cs.LG

Robust Transfer Learning with Side Information

Deze paper introduceert een robuust transfer learning-raamwerk dat gebruikmaakt van zijinformatie om schattingen van overgangskernen te verbeteren en conservatieve beleidsplannen te verminderen, wat leidt tot superieure prestaties in doeldomeinen met omgevingsverschillen.

Akram S. Awad, Shihab Ahmed, Yue Wang, George K. Atia2026-03-10🤖 cs.LG

Semantic Risk Scoring of Aggregated Metrics: An AI-Driven Approach for Healthcare Data Governance

Dit paper introduceert een AI-gedreven framework dat SQL-gebaseerde metriekdefinities analyseert met behulp van CodeBERT en XGBoost om privacyrisico's in geaggregeerde gezondheidsdata proactief te detecteren en te verklaren, waardoor veilige en compliance-vriendelijke data-governance tussen verschillende afdelingen mogelijk wordt.

Mohammed Omer Shakeel Ahmed2026-03-10🤖 cs.LG

ELLMob: Event-Driven Human Mobility Generation with Self-Aligned LLM Framework

Dit paper introduceert ELLMob, een zelf-gealigneerd LLM-framework dat menselijke mobiliteit genereert die zowel gewoontes als gebeurtenisgerelateerde beperkingen respecteert, en presenteert het eerste dataset met gebeurtenisannotaties voor drie grote wereldwijde gebeurtenissen.

Yusong Wang, Chuang Yang, Jiawei Wang, Xiaohang Xu, Jiayi Xu, Dongyuan Li, Chuan Xiao, Renhe Jiang2026-03-10🤖 cs.LG

RL unknotter, hard unknots and unknotting number

De auteurs ontwikkelen een versterkingsleer-pipeline die knoopdiagrammen vereenvoudigt en succesvol toepast op zeer moeilijke ontknoopte knopen en de verbinding $4_1\#9_{10}$ , waarbij de recent vastgestelde bovengrens van drie voor het ontknooptal wordt bevestigd.

Anne Dranowski, Yura Kabkov, Daniel Tubbenhauer2026-03-10🤖 cs.LG

PSTNet: Physically-Structured Turbulence Network

Dit artikel introduceert PSTNet, een lichtgewicht neurale netwerkarchitectuur die fysische principes direct in zijn structuur verwerkt om atmosferische turbulentie in real-time en met hoge nauwkeurigheid te schatten op beperkte hardware, waardoor het een effectief alternatief biedt voor bestaande methoden in veiligheidskritieke vliegtuigsturingssystemen.

Boris Kriuk, Fedor Kriuk2026-03-10🤖 cs.LG

Local Constrained Bayesian Optimization

Dit paper introduceert Local Constrained Bayesian Optimization (LCBO), een nieuw raamwerk dat de vervlochtenheid van hoge dimensies en complexe beperkingen effectief aanpakt door lokale afdaling en exploratie te combineren, wat resulteert in een polynoomiale convergentiesnelheid en superieure prestaties ten opzichte van bestaande methoden.

Jing Jingzhe, Fan Zheyi, Szu Hui Ng, Qingpei Hu2026-03-10🤖 cs.LG

Scaling Machine Learning Interatomic Potentials with Mixtures of Experts

Deze studie introduceert en analyseert Mixture-of-Experts-architecturen voor machine learning interatomische potentialen, waarbij een element-wise routing-strategie met niet-lineaire experts en gedeelde experts leidt tot state-of-the-art nauwkeurigheid en chemisch interpreteerbare specialisatie.

Yuzhi Liu, Duo Zhang, Anyang Peng, Weinan E, Linfeng Zhang, Han Wang2026-03-10🤖 cs.LG

$OneMillion-Bench: How Far are Language Agents from Human Experts?

In dit paper wordt $OneMillion-Bench geïntroduceerd, een nieuwe benchmark met 400 door experts samengestelde taken uit vijf professionele domeinen die taalagenten evalueren op hun vermogen om complexe, realistische scenario's met betrouwbare redenering en bronverificatie aan te pakken, in plaats van alleen gestructureerde examenvragen.

Qianyu Yang, Yang Liu, Jiaqi Li, Jun Bai, Hao Chen, Kaiyuan Chen, Tiliang Duan, Jiayun Dong, Xiaobo Hu, Zixia Jia, Yang Liu, Tao Peng, Yixin Ren, Ran Tian, Zaiyuan Wang, Yanglihong Xiao, Gang Yao, Lingyue Yin, Ge Zhang, Chun Zhang, Jianpeng Jiao, Zilong Zheng, Yuan Gong2026-03-10🤖 cs.LG

← Vorige Volgende →