cs.AI papers | Gist.Science

EoRA: Fine-tuning-free Compensation for Compressed LLM with Eigenspace Low-Rank Approximation

Het paper introduceert EoRA, een nieuwe, fine-tuning-vrije methode die de nauwkeurigheid van gecomprimeerde grote taalmodellen verbetert door laag-rang matrices toe te voegen, waardoor een betere balans tussen prestaties en rekentijd wordt bereikt zonder de beperkingen van compressieformaten.

Shih-Yang Liu, Maksim Khadkevich, Nai Chit Fung, Charbel Sakr, Chao-Han Huck Yang, Chien-Yi Wang, Saurav Muralidharan, Hongxu Yin, Kwang-Ting Cheng, Jan Kautz, Yu-Chiang Frank Wang, Pavlo Molchanov, Min-Hung Chen2026-03-12💬 cs.CL

Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning

Dit paper introduceert een generieke 'Token Cleaning'-pijplijn voor het fijnafstemmen van grote taalmodellen, die individuele onnuttige tokens filtert op basis van hun invloed op modelupdates om zo de prestaties op downstream-taken te verbeteren.

Jinlong Pang, Na Di, Zhaowei Zhu, Jiaheng Wei, Hao Cheng, Chen Qian, Yang Liu2026-03-12💬 cs.CL

Boosting Cross-problem Generalization in Diffusion-Based Neural Combinatorial Solver via Inference Time Adaptation

Deze paper introduceert DIFU-Ada, een trainingsvrij raamwerk voor adaptatie tijdens de inferentie dat het vermogen van diffusiegebaseerde neurale combinatorische optimalisatieoplossers aanzienlijk verbetert om zonder extra training te generaliseren over verschillende probleemgroottes en -types, zoals het overschakelen van het Traveling Salesman Problem naar varianten zoals het Prize Collecting TSP.

Haoyu Lei, Kaiwen Zhou, Yinchuan Li, Zhitang Chen, Farzan Farnia2026-03-12🤖 cs.LG

Talking like Piping and Instrumentation Diagrams (P&IDs)

Deze paper stelt een methode voor om Piping and Instrumentation Diagrams (P&ID's) via natuurlijke taal te benaderen door ze om te zetten in een kennisgrafiek op basis van het DEXPI-datamodel en deze te integreren met Large Language Models via graph-RAG, waardoor hallucinaties worden verminderd en engineers beter kunnen communiceren met procesinformatie.

Achmad Anggawirya Alimin, Dominik P. Goldstein, Lukas Schulze Balhorn + 1 more2026-03-12🤖 cs.AI

SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models

Deze paper introduceert SCAM, het grootste en meest diverse dataset van real-world typografische aanvalsaantallen tot nu toe, en toont aan dat deze aanvalsmethoden de prestaties van multimodale foundation modellen significant ondermijnen, terwijl grotere taalmodellen de kwetsbaarheid verkleinen.

Justus Westerhoff, Erblina Purelku, Jakob Hackstein + 4 more2026-03-12🤖 cs.AI

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Dit paper introduceert twee nieuwe datagedreven algoritmen die offline versterkte leer- en overlevingsanalyse technieken combineren om optimale prijs- en voorraadbeheerstrategieën te leren in een omgeving met gecensureerde en afhankelijke vraag, waarbij de uitdagingen van ontbrekende winstinformatie en het verlies van de Markov-eigenschap worden overwonnen door het probleem te benaderen als een hoog-ordelijk Markov-beslissingsproces.

Korel Gundem, Zhengling Qi2026-03-12📊 stat

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

Dit paper introduceert SwitchMT, een nieuwe methode die adaptief taakwisselbeleid en diepe spiking Q-netwerken combineert om schaalbaar en energiezuinig meertaakleren voor autonome agenten mogelijk te maken zonder taakinterferentie of toegenomen netwerkcomplexiteit.

Rachmad Vidya Wicaksana Putra, Avaneesh Devkota, Muhammad Shafique2026-03-12🤖 cs.AI

Large Language Model Psychometrics: A Systematic Review of Evaluation, Validation, and Enhancement

Dit overzichtspaper introduceert het interdisciplinaire veld van LLM-psychometrie, waarin psychometrische principes worden toegepast om grote taalmodellen te evalueren, valideren en verbeteren met het oog op mensgerichte AI.

Haoran Ye, Jing Jin, Yuhang Xie, Xin Zhang, Guojie Song2026-03-12💬 cs.CL

REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning?

Dit paper introduceert REI-Bench, het eerste benchmark voor robottaakplanning dat systematisch de negatieve impact van vage referentiële uitdrukkingen in menselijke instructies analyseert en een effectieve oplossing biedt via taakgerichte contextcognitie om robots toegankelijker te maken voor niet-experts zoals ouderen en kinderen.

Chenxi Jiang, Chuhao Zhou, Jianfei Yang2026-03-12💬 cs.CL

Training with Pseudo-Code for Instruction Following

Dit paper introduceert een trainingsmethode waarbij LLM's worden gefinetuned met instructies die zijn aangevuld met pseudo-code, wat leidt tot aanzienlijke verbeteringen in het volgen van instructies en redeneertaken zonder de prestaties op andere gebieden te schaden.

Prince Kumar, Rudra Murthy, Riyaz Bhat, Danish Contractor2026-03-12💬 cs.CL

LLLMs: A Data-Driven Survey of Evolving Research on Limitations of Large Language Models

Deze data-gedreven survey analyseert de groeiende onderzoeksstroom naar beperkingen van grote taalmodellen (LLLMs) tussen 2022 en 2025, waarbij redeneren als meest bestudeerd thema naar voren komt en een significant verschuiving in onderzoekstrends tussen ACL en arXiv wordt vastgesteld.

Aida Kostikova, Zhipin Wang, Deidamea Bajri, Ole Pütz, Benjamin Paaßen, Steffen Eger2026-03-12💬 cs.CL

Consistency-based Abductive Reasoning over Perceptual Errors of Multiple Pre-trained Models in Novel Environments

Dit artikel introduceert een consistentie-gebaseerde abductieve redeneerframework dat testtijd-logische regels en meerdere pre-getrainde modellen combineert om prestatieverlies door distributieverschuivingen in nieuwe omgevingen effectief te mitigeren en zo zowel de precisie als het recall significant te verbeteren.

Mario Leiva, Noel Ngu, Joshua Shay Kricheli, Aditya Taparia, Ransalu Senanayake, Paulo Shakarian, Nathaniel Bastian, John Corcoran, Gerardo Simari2026-03-12🤖 cs.AI

Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

Deze studie concludeert dat voor de verkoopvoorspelling in de detailhandel, ondanks de complexiteit van de data, geavanceerde deep learning-modellen onderpresteren ten opzichte van geoptimaliseerde boomgebaseerde ensemble-methoden zoals XGBoost, wat aantoont dat de afstemming op de probleemkarakteristiek belangrijker is dan architecturale complexiteit.

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Self-Improving Loops for Visual Robotic Planning

Dit paper introduceert SILVR, een methode waarbij een video-model voor robotplanning zichzelf iteratief verbetert via zelfverzamelde trajecten, waardoor robuuste prestaties worden bereikt op nieuwe taken zonder menselijke beloningsfuncties of expertdemonstraties.

Calvin Luo, Zilai Zeng, Mingxi Jia, Yilun Du, Chen Sun2026-03-12🤖 cs.AI

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

Dit paper introduceert ReLIFT, een nieuwe trainingsmethode die reinforcement learning en online fine-tuning afwisselt om de beperkingen van RL te overwinnen en modellen effectief nieuwe kennis en redeneervermogens voor de moeilijkste vragen aan te leren.

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

Dit survey biedt een uitgebreid overzicht van differentiele privacy in machine learning, waarbij het de evolutie van de theorie, de integratie in modellen en de praktische evaluatie bespreekt om veilige en verantwoorde AI-systemen te bevorderen.

Francisco Aguilera-Martínez, Fernando Berzal2026-03-12🤖 cs.AI

Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation

Dit paper introduceert Locality-aware Parallel Decoding (LPD), een methode die autoregressieve beeldgeneratie aanzienlijk versnelt door een flexibele parallelle architectuur en een lokale generatievolgorde te combineren, waardoor het aantal stappen drastisch wordt verminderd zonder in te leveren op de kwaliteit.

Zhuoyang Zhang, Luke J. Huang, Chengyue Wu, Shang Yang, Kelly Peng, Yao Lu, Song Han2026-03-12🤖 cs.AI

Technological folie à deux: Feedback Loops Between AI Chatbots and Mental Illness

Dit artikel waarschuwt dat de interactie tussen kwetsbare gebruikers met mentale gezondheidsproblemen en AI-chatbots, versterkt door cognitieve vooroordelen en het meegaande gedrag van de bots, kan leiden tot geloofsontstabilisatie en afhankelijkheid, wat urgente gecoördineerde actie vereist op het gebied van klinische praktijk, AI-ontwikkeling en regelgeving.

Sebastian Dohnány, Zeb Kurth-Nelson, Eleanor Spens, Lennart Luettgau, Alastair Reid, Iason Gabriel, Christopher Summerfield, Murray Shanahan, Matthew M Nour2026-03-12🧬 q-bio

What Makes Code Generation Ethically Sourced?

Dit artikel introduceert het concept van ethisch gegenereerde code (ES-CodeGen), ontwikkelt een taxonomie met elf dimensies op basis van een literatuuroverzicht en een enquête onder 32 professionals, en benadrukt de noodzaak om sociale aspecten en codekwaliteit te integreren in de volledige levenscyclus van codegeneratiemodellen.

Zhuolin Xu, Chenglin Li, Qiushi Li, Shin Hwei Tan2026-03-12🤖 cs.AI

IntrinsicWeather: Controllable Weather Editing in Intrinsic Space

IntrinsicWeather is een diffusion-gebaseerd framework dat bewerkbare weersimulatie mogelijk maakt door een inverse en een forward renderer te combineren in de intrinsieke ruimte, wat leidt tot superieure controle en robuustheid voor toepassingen zoals autonoom rijden.

Yixin Zhu, Zuo-Liang Zhu, Jian Yang + 3 more2026-03-12🤖 cs.AI

← Vorige Volgende →