cs.AI papers | Gist.Science

PixelPrune: Pixel-Level Adaptive Visual Token Reduction via Predictive Coding

PixelPrune is een trainingsvrije, pixelgebaseerde methode die redundante beeldpatches via voorspellende codering verwijdert voordat ze de Vision Transformer bereiken, waardoor de inferentie- en trainingsnelheid van Vision-Language Modellen aanzienlijk wordt versneld zonder in te leveren op de nauwkeurigheid.

Nan Wang, Zhiwei Jin, Chen Chen, Haonan Lu2026-04-02🤖 cs.AI

Beyond Symbolic Solving: Multi Chain-of-Thought Voting for Geometric Reasoning in Large Language Models

Dit paper introduceert MARS-GPS, een methode die meerdere parallelle redeneerrollouts combineert met Python-uitvoering en meerstaps stemming om de logische inferentie bij het oplossen van meetkundige problemen in grote taalmodellen aanzienlijk te verbeteren.

Md. Abu Bakor Siddique, Shahrin Hossain, Sadman Ahmed Siam, Syed Rifat Raiyan, Hasan Mahmud, Md Kamrul Hasan2026-04-02🤖 cs.AI

Experience as a Compass: Multi-agent RAG with Evolving Orchestration and Agent Prompts

Dit paper introduceert HERA, een hiërarchisch raamwerk dat de prestaties van multi-agent Retrieval-Augmented Generation verbetert door zowel de agent-orchestratie als de rol-specifieke prompts dynamisch te laten evolueren op basis van ervaring, wat leidt tot aanzienlijk betere resultaten op complexe kennisintensieve taken.

Sha Li, Naren Ramakrishnan2026-04-02🤖 cs.AI

Investigating Autonomous Agent Contributions in the Wild: Activity Patterns and Code Change over Time

Dit onderzoek analyseert een dataset van 110.000 pull requests om de activiteitspatronen van autonome coderingsagenten te vergelijken met menselijke bijdragen en concludeert dat, hoewel hun rol in open-sourceprojecten groeit, hun code over de tijd meer wijzigingen (churn) ondergaat dan door mensen geschreven code.

Razvan Mihai Popescu, David Gros, Andrei Botocan, Rahul Pandita, Prem Devanbu, Maliheh Izadi2026-04-02🤖 cs.AI

Representation Selection via Cross-Model Agreement using Canonical Correlation Analysis

Dit artikel introduceert een trainingsvrije methode die via canonische correlatieanalyse (CCA) de gedeelde semantische structuur tussen twee vooraf getrainde beeldencoders benut om representaties te selecteren en te reduceren, wat leidt tot aanzienlijke dimensieverlaging en verbeterde downstream prestaties vergeleken met bestaande technieken zoals PCA.

Dylan B. Lewis, Jens Gregor, Hector Santos-Villalobos2026-04-02🤖 cs.AI

Learning Quantised Structure-Preserving Motion Representations for Dance Fingerprinting

Dit paper introduceert DANCEMATCH, een end-to-end framework dat door middel van skeletbewegingsquantisatie en spatio-temporele transformers compacte, discrete bewegingshandafdrukken genereert voor efficiënte en schaalbare opslag en terugvinding van choreografieën op basis van ruwe video.

Arina Kharlamova, Bowei He, Chen Ma, Xue Liu2026-04-02🤖 cs.AI

PsychAgent: An Experience-Driven Lifelong Learning Agent for Self-Evolving Psychological Counselor

Het paper introduceert PsychAgent, een agent voor psychologische counseling die door middel van een ervaringgedreven levenslang leerproces, bestaande uit een geheugengebaseerde planning, vaardigheidsevolutie en versterkte internalisatie, de kwaliteit en consistentie van meerzessiesgesprekken verbetert en hiermee superieure resultaten behaalt ten opzichte van bestaande modellen.

Yutao Yang, Junsong Li, Qianjun Pan, Jie Zhou, Kai Chen, Qin Chen, Jingyuan Zhao, Ningning Zhou, Xin Li, Liang He2026-04-02🤖 cs.AI

WARP: Guaranteed Inner-Layer Repair of NLP Transformers

Het paper introduceert WARP, een constraint-based reparatieframework dat het bereik van gegarandeerde en verifieerbare reparatie van Transformer-modellen uitbreidt naar binnenste lagen door gebruik te maken van convex kwadratische programmering en eerste-orde linearisatie.

Hsin-Ling Hsu, Min-Yu Chen, Nai-Chia Chen, Yan-Ru Chen, Yi-Ling Chang, Fang Yu2026-04-02🤖 cs.LG

Flow-based Policy With Distributional Reinforcement Learning in Trajectory Optimization

Deze paper introduceert FP-DRL, een nieuw reinforcement learning-algoritme dat flow-matching en distributional RL combineert om multimodale beleidsdistributies en opbrengstverdelingen effectiever te modelleren, wat leidt tot state-of-the-art prestaties op MuJoCo-benchmarks.

Ruijie Hao, Longfei Zhang, Yang Dai, Yang Ma, Xingxing Liang, Guangquan Cheng2026-04-02🤖 cs.LG

Dual Optimal: Make Your LLM Peer-like with Dignity

Dit paper introduceert het 'Dignified Peer'-framework, dat het probleem van sycophantische en ontwijkende taalmodellen aanpakt door middel van het PersonaKnob-dataset, een tolerant Lagrangiaans DPO-algoritme en een psychometrisch geëvalueerd protocol om LLM's te transformeren in waardige, gelijkwaardige gesprekspartners.

Xiangqi Wang, Yue Huang, Haomin Zhuang, Kehan Guo, Xiangliang Zhang2026-04-02🤖 cs.AI

← Vorige Volgende →