cs.AI papers | Gist.Science

Inference-time Alignment in Continuous Space

Dit paper introduceert Simple Energy Adaptation (SEA), een efficiënt algoritme voor inferentie-tijd uitlijning van taalmodellen dat door middel van gradiëntgebaseerde bemonstering in een continue latente ruimte direct antwoorden aanpast, waardoor het de beperkingen van discrete zoekmethodes overtreft en aanzienlijk betere prestaties levert.

Yige Yuan, Teng Xiao, Li Yunfan, Bingbing Xu, Shuchang Tao, Yunqi Qiu, Huawei Shen, Xueqi Cheng2026-03-17💬 cs.CL

ERC-SVD: Error-Controlled SVD for Large Language Model Compression

Het paper introduceert ERC-SVD, een post-training compressiemethode voor grote taalmodellen die door het benutten van residualen en het selectief comprimeren van de laatste lagen de truncatiefouten en foutpropagatie effectief beperkt, waardoor superieure prestaties worden behaald ten opzichte van bestaande methoden.

Haolei Bai, Siyong Jian, Tuo Liang, Yu Yin, Huan Wang2026-03-17💬 cs.CL

Variational Deep Learning via Implicit Regularization

Dit artikel introduceert een methode om variational deep learning te regulariseren door uitsluitend te vertrouwen op de impliciete bias van (stochastische) gradiëntafdaal, wat leidt tot sterke prestaties zowel binnen als buiten de verdeling zonder extra hyperparameter-tuning of aanzienlijke rekenkosten.

Jonathan Wenger, Beau Coker, Juraj Marusic, John P. Cunningham2026-03-17📊 stat

Balancing Safety and Optimality in Robot Path Planning: Algorithm and Metric

Dit paper introduceert de Unified Path Planner (UPP), een algoritme dat veiligheid en optimaliteit in robotpadplanning dynamisch in evenwicht brengt, en presenteert de OptiSafe-metriek om dit compromis te kwantificeren, wat resulteert in superieure prestaties in zowel simulatie als hardware-validatie.

Jatin Kumar Arora, Soutrik Bandyopadhyay, Sunil Sulania + 1 more2026-03-17🤖 cs.AI

DiG-Net: Enhancing Human-Robot Interaction through Hyper-Range Dynamic Gesture Recognition in Assistive Robotics

Dit paper introduceert DiG-Net, een nieuw raamwerk voor dynamische gebarenherkenning dat assistieve robots in staat stelt om gebaren tot 30 meter afstand nauwkeurig te interpreteren, waardoor de interactie voor mensen met beperkte mobiliteit aanzienlijk wordt verbeterd.

Eran Bamani Beeri, Eden Nissinman, Avishai Sintov2026-03-17🤖 cs.AI

NetArena: Dynamic Benchmarks for AI Agents in Network Automation

Het paper introduceert NetArena, een dynamisch benchmarkkader voor AI-agenten in netwerkautomatisering dat statische beperkingen overwint door on-demand query's te genereren en zo de betrouwbaarheid van evaluaties aanzienlijk verbetert terwijl het de lage prestaties van agenten in realistische scenario's blootlegt.

Yajie Zhou, Jiajun Ruan, Eric S. Wang + 4 more2026-03-17🤖 cs.AI

AssetOpsBench: Benchmarking AI Agents for Task Automation in Industrial Asset Operations and Maintenance

In dit artikel wordt AssetOpsBench voorgesteld, een uniek raamwerk dat een multimodaal ecosysteem, een dataset van meer dan 140 industriële queries en een geautomatiseerde evaluatie biedt om AI-agenten voor de automatisering van onderhoud en operaties in de industrie te benchmarken en te vergelijken.

Dhaval Patel, Shuxin Lin, James Rayfield + 7 more2026-03-17🤖 cs.AI

AMPED: Adaptive Multi-objective Projection for balancing Exploration and skill Diversification

Dit paper introduceert AMPED, een nieuwe methode voor op vaardigheden gebaseerd versterkend leren die tijdens het vooropleiden een gradiënt-chirurgie-projectie gebruikt om exploratie en vaardigheidsdiversiteit in balans te brengen, wat leidt tot superieure prestaties en een lagere steekproefcomplexiteit bij fijnafstemming.

Geonwoo Cho, Jaemoon Lee, Jaegyun Im + 3 more2026-03-17🤖 cs.AI

DesignBench: A Comprehensive Benchmark for MLLM-based Front-end Code Generation

Dit paper introduceert DesignBench, een uitgebreide benchmark die multimodale grote taalmodellen evalueert op hun vermogen om front-end code te genereren, bewerken en repareren binnen meerdere populaire frameworks en diverse realistische ontwikkelingstaken.

Jingyu Xiao, Ming Wang, Man Ho Lam + 4 more2026-03-17🤖 cs.AI

Model-based Implicit Neural Representation for sub-wavelength Radio Localization

Deze paper introduceert een model-gebaseerde, impliciete neurale representatie die de bestaande vingerafdruk-gebaseerde lokalisatie verbetert door een generatief kanaalmodel te gebruiken, wat leidt tot sub-golfgeleidelokalisatie in complexe NLoS-omgevingen met een aanzienlijke reductie in geheugenvereisten en een verbetering van de nauwkeurigheid met meerdere ordes van grootte.

Baptiste Chatelier (IETR, INSA Rennes, MERCE-France), Vincent Corlay (MERCE-France), Musa Furkan Keskin (INSA Rennes, IETR), Matthieu Crussière (INSA Rennes, IETR), Henk Wymeersch (INSA Rennes, IETR), Luc Le Magoarou (INSA Rennes, IETR)2026-03-17⚡ eess

Curriculum Reinforcement Learning from Easy to Hard Tasks Improves LLM Reasoning

Dit paper introduceert de E2H Reasoner, een methode die de redeneercapaciteiten van taalmodellen verbetert door middel van versterkingsleer met een curriculum dat taken van makkelijk naar moeilijk schakelt, wat theoretisch en empirisch bewezen is te leiden tot betere prestaties en minder overfitting dan directe training op moeilijke taken.

Shubham Parashar, Shurui Gui, Xiner Li, Hongyi Ling, Sushil Vemuri, Blake Olson, Eric Li, Yu Zhang, James Caverlee, Dileep Kalathil, Shuiwang Ji2026-03-17💬 cs.CL

BIS Reasoning 1.0: The First Large-Scale Japanese Benchmark for Belief-Inconsistent Syllogistic Reasoning

Dit artikel introduceert BIS Reasoning 1.0, het eerste grote Japanse dataset voor syllogismen die geloof-inconsistent redeneren testen, en toont aan dat de weerstand tegen geloofsvooroordeel bij grote taalmodellen voornamelijk wordt bepaald door expliciete redeneeroptimalisatie in plaats van taalspecialisatie of schaal.

Ha-Thanh Nguyen, Hideyuki Tachibana, Chaoran Liu, Qianying Liu, Su Myat Noe, Koichi Takeda, Sadao Kurohashi2026-03-17💬 cs.CL

Speech Recognition on TV Series with Video-guided Post-ASR Correction

Deze paper introduceert een Video-Guided Post-ASR Correction (VPC) framework dat een Video-Large Multimodal Model (VLMM) gebruikt om de transcriptieprecisie van tv-series te verbeteren door visuele context te benutten voor het corrigeren van ASR-fouten.

Haoyuan Yang, Yue Zhang, Liqiang Jing, John H. L. Hansen2026-03-17⚡ eess

AVA-Bench: Atomic Visual Ability Benchmark for Vision Foundation Models

Dit paper introduceert AVA-Bench, het eerste benchmark dat 14 atomische visuele vaardigheden ontkoppelt om Vision Foundation Models systematisch en transparant te evalueren, waardoor selectie overgaat van gokwerk naar principieel engineering en efficiënter kan worden uitgevoerd met kleinere taalmodellen.

Arpita Chowdhury, Zheda Mai, Zihe Wang + 4 more2026-03-17🤖 cs.AI

A Lightweight IDS for Early APT Detection Using a Novel Feature Selection Method

In dit artikel wordt een lichtgewicht systeem voor de detectie van geavanceerde aanhoudende bedreigingen (APT) voorgesteld dat gebruikmaakt van XGBoost en SHAP om het aantal kenmerken in het SCVIC-APT-2021-dataset van 77 tot 4 te reduceren, terwijl het toch een uitzonderlijke nauwkeurigheid van 97% en een recall van 100% behaalt voor vroege detectie.

Bassam Noori Shaker, Bahaa Al-Musawi, Mohammed Falih Hassan2026-03-17🤖 cs.AI

Resource Rational Contractualism Should Guide AI Alignment

Dit paper stelt Resource-Rational Contractualism voor als een kader waarin AI-systemen, door het gebruik van cognitief geïnspireerde heuristieken die inspanning afwegen tegen nauwkeurigheid, rationele overeenkomsten benaderen om zich efficiënt en dynamisch aan te passen aan een complexe menselijke sociale wereld.

Sydney Levine, Matija Franklin, Tan Zhi-Xuan + 8 more2026-03-17🤖 cs.AI

TRACED: Transition-aware Regret Approximation with Co-learnability for Environment Design

Het paper introduceert TRACED, een methode voor Unsupervised Environment Design die de generalisatie van deep reinforcement learning-agenten verbetert door een nieuwe regret-benadering te combineren met transitiesvoorspelling en een 'Co-Learnability'-metriek om effectieve leercurricula te genereren.

Geonwoo Cho, Jaegyun Im, Jihwan Lee + 3 more2026-03-17🤖 cs.AI

Explainable Hierarchical Deep Learning Neural Networks (Ex-HiDeNN)

Dit artikel introduceert Ex-HiDeNN, een nieuw, interpreteerbaar en nauwkeurig diep leermodel dat symbolische regressie combineert met een hiërarchische architectuur om gesloten formules te ontdekken uit beperkte data, waarbij het in diverse benchmarks en engineering-toepassingen de bestaande methoden overtreft.

Reza T. Batley, Chanwook Park, Wing Kam Liu + 1 more2026-03-17🤖 cs.AI

Lumos-1: On Autoregressive Video Generation with Discrete Diffusion from a Unified Model Perspective

Dit paper introduceert Lumos-1, een unificerend LLM-gebaseerd model voor autoregressieve videogeneratie dat gebruikmaakt van een efficiënte discrete diffusie en een nieuwe MM-RoPE-architectuur om de prestaties van bestaande methoden te overtreffen.

Hangjie Yuan, Weihua Chen, Jun Cen + 11 more2026-03-17🤖 cs.AI

CSD-VAR: Content-Style Decomposition in Visual Autoregressive Models

Dit paper introduceert CSD-VAR, een nieuwe methode die Visual Autoregressive Modeling (VAR) gebruikt met schaalbewuste optimalisatie, SVD-rectificatie en verrijkte K-V-geheugen om inhoud en stijl effectiever te ontkoppelen dan eerdere diffusion-gebaseerde benaderingen, ondersteund door het nieuwe CSD-100-dataset.

Quang-Binh Nguyen, Minh Luu, Quang Nguyen + 2 more2026-03-17🤖 cs.AI

← Vorige Volgende →