cs.LG papers | Gist.Science

Why Is RLHF Alignment Shallow? A Gradient Analysis

Dit paper bewijst dat gradienten op basis van RLHF alignment inherent oppervlakkig zijn omdat ze verdwijnen zodra de schadelijkheid van een output is vastgesteld, en stelt een nieuw doel voor dat herstelstraffen gebruikt om een gradientensignaal over de volledige sequentie te behouden.

Robin Young2026-03-06🤖 cs.LG

Osmosis Distillation: Model Hijacking with the Fewest Samples

Dit paper introduceert de 'Osmosis Distillation'-aanval, een nieuwe methode voor modelkaping die het risico blootlegt dat een aanvaller met slechts enkele vergiftigde synthetische datasets een model kan manipuleren om een verborgen taak uit te voeren terwijl de oorspronkelijke functionaliteit behouden blijft.

Yuchen Shi, Huajie Chen, Heng Xu, Zhiquan Liu, Jialiang Shen, Chi Liu, Shuai Zhou, Tianqing Zhu, Wanlei Zhou2026-03-06🔒 cs.CR

Causally Robust Reward Learning from Reason-Augmented Preference Feedback

Het paper introduceert ReCouPLe, een lichtgewicht framework dat natuurlijke taalredeneringen gebruikt als causale signalen om voorkeursgebaseerde beloningsmodellen robuuster te maken tegen causale verwarring en beter te laten generaliseren naar nieuwe taken zonder extra data.

Minjune Hwang, Yigit Korkmaz, Daniel Seita + 1 more2026-03-06🤖 cs.AI

Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics

Deze studie presenteert een interpreteerbaar model dat 80,4% nauwkeurigheid bereikt bij het voorspellen van acht verschillende worptypes in honkbal op basis van monokulaire 3D-lichaamshouding, waarbij bovenlichaamsmechaniek en polspositie als belangrijkste voorspellers worden geïdentificeerd en een empirisch plafond wordt vastgesteld voor worpen die uitsluitend op grip verschillen.

Jerrin Bright, Michelle Lu, John Zelek2026-03-06🤖 cs.AI

Differential Privacy in Two-Layer Networks: How DP-SGD Harms Fairness and Robustness

Deze paper introduceert een unificerend kader dat aantoont dat de ruis in differentieel privé SGD in twee-laags netwerken de feature-learning dynamiek verstoort, wat leidt tot een verslechtering van eerlijkheid, robuustheid en prestaties, vooral bij onbalans en lange staartverdelingen.

Ruichen Xu, Kexin Chen2026-03-06🤖 cs.LG

FedAFD: Multimodal Federated Learning via Adversarial Fusion and Distillation

FedAFD is een geïntegreerd framework voor multimodaal federatief leren dat via een tweeledige adversariale uitlijning, granulariteitsbewuste fusie en een op gelijkenis gebaseerde ensemble-distillatie de uitdagingen van heterogene data en modellen oplost om zowel client- als serverprestaties te verbeteren.

Min Tan, Junchao Ma, Yinfu Feng + 6 more2026-03-06🤖 cs.AI

How Does the ReLU Activation Affect the Implicit Bias of Gradient Descent on High-dimensional Neural Network Regression?

Deze studie toont aan dat bij hoogdimensionale willekeurige data de impliciete bias van gradient descent voor een ondiep ReLU-model met hoge waarschijnlijkheid de minimum-l2-norm oplossing benadert met een foutmarge van de orde $\Theta(\sqrt{n/d})$ , dankzij een nieuwe primal-dual analyse die aantoont dat het ReLU-activatiepatroon snel stabiliseert.

Kuo-Wei Lai, Guanghui Wang, Molei Tao + 1 more2026-03-06🔢 math

U-Parking: Distributed UWB-Assisted Autonomous Parking System with Robust Localization and Intelligent Planning

Deze paper presenteert U-Parking, een gedistribueerd autonoom parkeersysteem dat gebruikmaakt van UWB-technologie, robuuste lokalisatie en LLM-ondersteunde planning om betrouwbare parkeerbewegingen in uitdagende binnenruimtes mogelijk te maken.

Yiang Wu, Qiong Wu, Pingyi Fan + 4 more2026-03-06🤖 cs.LG

VPWEM: Non-Markovian Visuomotor Policy with Working and Episodic Memory

In dit artikel wordt VPWEM voorgesteld, een niet-Markoviaanse visuele beleidsmethode die werkgeheugen en een Transformer-gebaseerd episodisch geheugen combineert om robotmanipulatie taken met lange termijn geheugenvereisten efficiënter op te lossen dan bestaande methoden.

Yuheng Lei, Zhixuan Liang, Hongyuan Zhang + 1 more2026-03-06🤖 cs.AI

EVMbench: Evaluating AI Agents on Smart Contract Security

Dit paper introduceert EVMbench, een evaluatieframework dat de capaciteit van AI-agenten meet om kwetsbaarheden in slimme contracten te detecteren, te patchen en te exploiteren, en laat zien dat geavanceerde modellen in staat zijn om deze kwetsbaarheden end-to-end te vinden en uit te buiten.

Justin Wang, Andreas Bigger, Xiaohai Xu, Justin W. Lin, Andy Applebaum, Tejal Patwardhan, Alpin Yukseloglu, Olivia Watkins2026-03-06🔒 cs.CR

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

Dit artikel introduceert BandPO, een nieuwe methode voor het versterken van grote taalmodellen die de beperkingen van vaste PPO-bounds oplost door dynamische, waarschijnlijkheidsbewuste intervallen te gebruiken, waardoor de stabiliteit wordt verbeterd en het vroege verlies aan exploratie wordt tegengegaan.

Yuan Li, Bo Wang, Yufei Gao + 4 more2026-03-06🤖 cs.AI

Semantic Communication-Enhanced Split Federated Learning for Vehicular Networks: Architecture, Challenges, and Case Study

Dit artikel introduceert het SC-USFL-framework, dat semantische communicatie combineert met split federated learning om de communicatie-overhead te verminderen, de privacy te waarborgen en de leerprestaties te optimaliseren in dynamische voertuignetwerken.

Lu Yu, Zheng Chang, Ying-Chang Liang2026-03-06🤖 cs.LG

Person Detection and Tracking from an Overhead Crane LiDAR

Dit artikel presenteert een aangepast dataset en een evaluatie van 3D-detectie- en trackingmethodes voor het lokaliseren van personen vanuit een LiDAR-sensor op een kraan in een industriële omgeving, waarbij VoxelNeXt en SECOND de beste prestaties leveren binnen een straal van 5 meter.

Nilusha Jayawickrama, Henrik Toikka, Risto Ojala2026-03-06🤖 cs.LG

$\nabla$ -Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space

Dit paper introduceert $\nabla$ -Reasoner, een innovatief framework dat differentieerbare optimalisatie van token-logits in de latent space toepast tijdens de inferentie om de redeneercapaciteiten van grote taalmodellen aanzienlijk te verbeteren met minder modeloproepen dan bestaande methoden.

Peihao Wang, Ruisi Cai, Zhen Wang + 4 more2026-03-06🤖 cs.LG

TimeWarp: Evaluating Web Agents by Revisiting the Past

Dit paper introduceert TimeWarp, een benchmark die de kwetsbaarheid van webagenten voor veranderingen in webontwerp blootlegt, en presenteert TimeTraj, een algoritme dat via plan-distillatie over meerdere UI-versies de prestaties en robuustheid van deze agenten aanzienlijk verbetert.

Md Farhan Ishmam, Kenneth Marino2026-03-06🤖 cs.AI

Uncertainty-aware Blood Glucose Prediction from Continuous Glucose Monitoring Data

Dit onderzoek toont aan dat Transformer-modellen met evidentiële outputlagen, getest op het HUPA-UCM-dataset, de meest effectieve en goed gekalibreerde onzekerheidsschattingen bieden voor de voorspelling van bloedglucose en het identificeren van glycemische risico's bij type 1-diabetes.

Hai Siong Tan2026-03-06✓ Author reviewed ⓘ🔬 physics

WaterSIC: information-theoretically (near) optimal linear layer quantization

Dit paper introduceert WaterSIC, een nieuw algoritme dat door het toewijzen van verschillende quantisatiesnelheden aan kolommen van de gewichtsmatrix (geïnspireerd door waterfilling) een bijna optimale informatie-theoretische prestatie bereikt en daarmee nieuwe state-of-the-art resultaten oplevert voor de kwantisatie van LLM's zoals Llama en Qwen.

Egor Lifar, Semyon Savkin, Or Ordentlich + 1 more2026-03-06🔢 math

Replaying pre-training data improves fine-tuning

Het herhalen van vooraf getrainde generieke data tijdens het fijnafstemmen verbetert verrassend genoeg de prestaties op specifieke doeltaakken, zelfs bij minder gerelateerde domeinen, door de datadoeltreffendheid te verhogen en de algemene vaardigheden van het model te behouden.

Suhas Kotha, Percy Liang2026-03-06🤖 cs.LG

Mixture of Universal Experts: Scaling Virtual Width via Depth-Width Transformation

Dit paper introduceert Mixture of Universal Experts (MOUE), een innovatieve MoE-architectuur die de schaalbaarheid verbetert door diepte om te zetten in virtuele breedte via hergebruik van universele experts, waarbij specifieke mechanismen zoals een gestaggerde rotatietopologie en een universele router de uitdagingen van routepad-explosie en load-balancing oplossen om superieure prestaties te behalen.

Yilong Chen, Naibin Gu, Junyuan Shang + 8 more2026-03-06🤖 cs.AI

Functionality-Oriented LLM Merging on the Fisher--Rao Manifold

Deze paper introduceert een functioneel georiënteerde methode voor het samenvoegen van meerdere LLM's op de Fisher-Rao-maand, die de beperkingen van traditionele Euclidische benaderingen overwint door een stabiel Karcher-gemiddelde te berekenen dat representatie-inzinking voorkomt en de prestaties verbetert bij het samenvoegen van heterogene modellen.

Jiayu Wang, Zuojun Ye, Wenpeng Yin2026-03-06🤖 cs.LG

← Vorige Volgende →

cs.LG