cs papers | Gist.Science

In-Context Reinforcement Learning for Tool Use in Large Language Models

Deze paper introduceert In-Context Reinforcement Learning (ICRL), een schaalbaar en data-efficiënt framework dat grote taalmodellen zonder voorafgaande gesuperviseerde fijne afstemming (SFT) leert externe hulpmiddelen effectief te gebruiken door tijdens het trainingsproces geleidelijk van few-shot naar zero-shot prompting over te schakelen.

Yaoqi Ye, Yiran Zhao, Keyu Duan, Zeyu Zheng, Kenji Kawaguchi, Cihang Xie, Michael Qizhe Shieh2026-03-10💻 cs

Synthetic Defect Image Generation for Power Line Insulator Inspection Using Multimodal Large Language Models

Dit paper introduceert een methode om synthetische defectbeelden van hoogspanningsisolatoren te genereren met behulp van multimodale grote taalmodellen, waardoor de prestaties van defectdetectiemodellen aanzienlijk verbeteren in scenario's met beperkte realistische trainingsdata.

Xuesong Wang, Caisheng Wang2026-03-10💻 cs

Geometric Give and Take

Dit artikel bepaalt het minimale aantal stenen dat Alice nodig heeft om Bob te weerhouden van het leegmaken van een vakje in een geometrisch spel met lijnarrangementen, en toont aan dat dit aantal voor lijnen in algemene positie evenredig is met $n^3$ .

Oswin Aichholzer, Katharina Klost, Kristin Knorr, Viola Mészáros, Josef Tkadlec2026-03-10💻 cs

TALON: Test-time Adaptive Learning for On-the-Fly Category Discovery

Het paper introduceert TALON, een adaptief leerframework dat de beperkingen van bestaande hash-gebaseerde methoden voor on-the-fly categorieontdekking overwint door testtijd-adaptatie en semantische prototype-updates te gebruiken, waardoor het model dynamisch nieuwe kennis kan verwerven zonder last te hebben van categorie-explosie.

Yanan Wu, Yuhan Yan, Tailai Chen, Zhixiang Chi, ZiZhang Wu, Yi Jin, Yang Wang, Zhenbo Li2026-03-10💻 cs

Why Large Language Models can Secretly Outperform Embedding Similarity in Information Retrieval

Hoewel het onderzoek concludeert dat LLM-gebaseerde relevantieoordelen het potentieel hebben om de beperkingen van embedding-achtige systemen te overwinnen door kortzichtigheid te doorbreken, kan dit voordeel niet worden aangetoond met standaard annotatiegegevens omdat deze zelf ook last hebben van dezelfde kortzichtigheid.

Matei Benescu, Ivo Pascal de Jong2026-03-10💻 cs

Augmented Model Predictive Control: A Balance between Satellite Agility and Computation Complexity

Dit paper introduceert een geavanceerde Model Predictive Control-methode die een evenwicht creëert tussen de wendbaarheid van aardobservatiesatellieten en de rekenkracht, door de prestaties van niet-lineaire MPC te combineren met de rekenkundige eenvoud van lineaire MPC.

Yiming Wang, Mihindukulasooriya Sheral Crescent Tissera, Haihong Yu, Kai Jie Ethan Foo, Sean Yeo Keyuan, Ankit Srivastava, Hao An2026-03-10💻 cs

M-ABD: Scalable, Efficient, and Robust Multi-Affine-Body Dynamics

Dit artikel introduceert M-ABD, een schaalbaar en robuust raamwerk voor het simuleren van grote gearticuleerde systemen dat door het gebruik van lineaire kinematische mapping en een co-rotatiebenadering interactieve snelheden en grote tijdstappen mogelijk maakt op één CPU-kern.

Zhiyong He (University of Utah), Dewen Guo (University of Utah), Minghao Guo (MIT), Yili Zhao (ByteDance), Wojciech Matusik (MIT), Hao Su (UCSD), Chenfanfu Jiang (UCLA), Peter Yichen Chen (UBC), Yin Yang (University of Utah)2026-03-10💻 cs

MRDrive: An Open Source Mixed Reality Driving Simulator for Automotive User Research

Dit artikel introduceert MRDrive, een open-source gemengde-realiteit-simulatiesysteem dat onderzoekers in staat stelt in-vehicle interfaces te evalueren door een echte voertuigcabine te combineren met een volledig virtueel rijomgeving, waardoor zowel ecologische validiteit als experimentele controle worden geboden.

Patrick Ebel, Michał Patryk Miazga, Martin Lorenz, Timur Getselev, Pavlo Bazilinskyy, Celine Conzen2026-03-10💻 cs

The AI Amplifier Effect: Defining Human-AI Intimacy and Romantic Relationships with Conversational AI

Dit onderzoek definieert mens-AI-intimiteit op basis van interviews met 30 gebruikers en introduceert het concept van het 'AI-versterkingseffect', waarbij AI als medium fungeert dat de bestaande emotionele toestand van de gebruiker versterkt, met zowel positieve als negatieve gevolgen voor hun welzijn en echte leven.

Ching Christie Pang, Yi Gao, Xuetong Wang, Pan Hui2026-03-10💻 cs

From Reactive to Map-Based AI: Tuned Local LLMs for Semantic Zone Inference in Object-Goal Navigation

Dit paper introduceert een nieuwe 'Map-Based AI'-benadering voor object-navigatie die een lokaal, op LoRA gefinetuned Llama-2-model combineert met een hybride topologisch-roosterkaart om semantische zones te infereren en systematische verkenning te optimaliseren, wat leidt tot aanzienlijk betere prestaties dan traditionele reactieve methoden in de AI2-THOR-simulatie.

Yudai Noda, Kanji Tanaka2026-03-10💻 cs

Adaptive Vision-Based Control of Redundant Robots with Null-Space Interaction for Human-Robot Collaboration

Dit artikel presenteert een nieuw adaptief visiegebaseerd regelschema voor redundante robots dat taakruimte en nultoestruimte decoupeert om veilige en effectieve samenwerking met mensen in onbekende omgevingen mogelijk te maken, waarbij de stabiliteit wiskundig is bewezen en de prestaties met augmented reality zijn geverifieerd.

Xiangjie Yan, Chen Chen, Xiang Li2026-03-10💻 cs

DSH-Bench: A Difficulty- and Scenario-Aware Benchmark with Hierarchical Subject Taxonomy for Subject-Driven Text-to-Image Generation

Dit paper introduceert DSH-Bench, een uitgebreid benchmark met een hiërarchische taxonomie en een nieuwe consistentiemaatstaf (SICS) om subject-gedreven tekst-naar-beeldmodellen systematisch te evalueren op basis van moeilijkheidsgraad en scenario's, waardoor beperkingen van bestaande modellen worden blootgelegd en gerichte richtingen voor toekomstige verbetering worden geboden.

Zhenyu Hu, Qing Wang, Te Cao, Luo Liao, Longfei Lu, Liqun Liu, Shuang Li, Hang Chen, Mengge Xue, Yuan Chen, Chao Deng, Peng Shu, Huan Yu, Jie Jiang2026-03-10💻 cs

TrianguLang: Geometry-Aware Semantic Consensus for Pose-Free 3D Localization

TrianguLang is een voeding-voorwaartse, pose-vrije 3D-lokalisatiemethode die met behulp van geometrie-bewuste semantische aandacht (GASA) de nauwkeurigheid en geometrische consistentie van objecten en delen in 3D-ruimtes verbetert zonder camera-calibratie, waardoor het toepasbaar is voor interactieve robotica en AR-toepassingen.

Bryce Grant, Aryeh Rothenberg, Atri Banerjee, Peng Wang2026-03-10💻 cs

PathBench: Speech Intelligibility Benchmark for Automatic Pathological Speech Assessment

Dit paper introduceert PathBench, een unificerend benchmarkkader voor het beoordelen van pathologische spraak met behulp van openbare datasets, waarbij diverse methoden worden vergeleken en een nieuwe referentievrije methode genaamd DArtP wordt voorgesteld die de hoogste correlatie bereikt.

Bence Mark Halpern, Thomas Tienkamp, Defne Abur, Tomoki Toda2026-03-10💻 cs

Adaptive MLP Pruning for Large Vision Transformers

Deze paper introduceert Adaptive MLP Pruning (AMP), een methode die de parameters en FLOPs van grote Vision Transformers met ongeveer 40% vermindert zonder merkbare prestatieverlies door het gebruik van een label-vrije entropie-criterium voor nauwkeurigere neuron-evaluatie en een adaptieve binaire zoekalgoritme voor het bepalen van de pruning-diepte.

Chengchao Shen2026-03-10💻 cs

''I don't want to break it'': An Exploration of Perceived Fragility in Shape-Changing Interfaces

Dit onderzoek verkent hoe gebruikers de kwetsbaarheid van vormveranderende interfaces waarnemen en ontwikkelt een raamwerk om deze perceptie te begrijpen en de robuustheid van toekomstige ontwerpen te verbeteren.

Eva Mackamul (IIHM), Tom Maillard (IIHM), Noé Marceaul (IIHM), Yelli Coulibaly (IIHM), Julien Pansiot (SED [Grenoble]), Laurence Boissieux (SED [Grenoble]), Dominique Vaufreydaz (LIG, M-PSI), Anne Roudaut (IIHM), Céline Coutrix (IIHM)2026-03-10💻 cs

Permutation Match Puzzles: How Young Tanvi Learned About Computational Complexity

Dit artikel introduceert permutatie-matchpuzzels op roosters, karakteriseert de oplosbaarheid ervan via een acyclische voorwaarde, levert een tellende formule voor oplossingen, biedt een lineaire algoritme voor het repareren van onoplosbare gevallen, en toont aan dat de veralgemening met willekeurige permutaties NP-compleet is.

Kshitij Gajjar, Neeldhara Misra2026-03-10💻 cs

DeReCo: Decoupling Representation and Coordination Learning for Object-Adaptive Decentralized Multi-Robot Cooperative Transport

DeReCo is een nieuw decentraliseerd multi-robot leerframework dat representatie- en coördinatielering ontkoppelt via een drie-traps trainingsstrategie, waardoor de sample-efficiëntie en generalisatie voor het samenwerken bij het transporteren van objecten met uiteenlopende vormen en eigenschappen aanzienlijk worden verbeterd.

Kazuki Shibata, Ryosuke Sota, Shandil Dhiresh Bosch, Yuki Kadokawa, Tsurumine Yoshihisa, Takamitsu Matsubara2026-03-10💻 cs

SAMoE-VLA: A Scene Adaptive Mixture-of-Experts Vision-Language-Action Model for Autonomous Driving

Dit artikel introduceert SAMoE-VLA, een autonoom rijmodel dat de instabiliteit van bestaande token-gebaseerde MoE-mechanismen oplost door expertselectie te baseren op gestructureerde verkeerscènes en een conditionele cross-modale causale aandachtmechanisme, waardoor het state-of-the-art prestaties bereikt met minder parameters.

Zihan You, Hongwei Liu, Chenxu Dang, Zhe Wang, Sining Ang, Aoqi Wang, Yan Wang2026-03-10💻 cs

UIS-Digger: Towards Comprehensive Research Agent Systems for Real-world Unindexed Information Seeking

Deze paper introduceert UIS-Digger, een nieuw multi-agent framework dat de beperkingen van huidige zoekagenten bij het vinden van niet-geïndexeerde informatie aanpakt door middel van een nieuw benchmark (UIS-QA) en een effectieve oplossing die zelfs superieure prestaties boekt ten opzichte van geavanceerde modellen zoals O3 en GPT-4.1.

Chang Liu, Chuqiao Kuang, Tianyi Zhuang, Yuxin Cheng, Huichi Zhou, Xiaoguang Li, Lifeng Shang2026-03-10💻 cs

← Vorige Volgende →