cs.LG Arbeiten | Gist.Science

DemoDiffusion: One-Shot Human Imitation using pre-trained Diffusion Policy

Der Paper stellt DemoDiffusion vor, eine Methode, die es Robotern ermöglicht, komplexe Manipulationsaufgaben durch Nachahmung einer einzigen menschlichen Demonstration zu erlernen, indem sie eine kinematische Retargeting-Vorlage mit einem vortrainierten Diffusions-Policy kombiniert, um eine robuste Anpassung ohne zusätzliche Trainingsdaten zu erreichen.

Sungjae Park, Homanga Bharadhwaj, Shubham Tulsiani2026-03-10🤖 cs.LG

Adopting a human developmental visual diet yields robust, shape-based AI vision

Die Studie zeigt, dass künstliche Sehsysteme durch die Anwendung einer menschlich inspirierten, entwicklungsorientierten visuellen Lernkurriculum („Developmental Visual Diet") robuster, adversarial-resistenter und stärker auf Form statt auf Textur ausgerichtet werden können, wodurch sie menschlichem Sehen deutlich näher kommen.

Zejin Lu, Sushrut Thorat, Radoslaw M Cichy, Tim C Kietzmann2026-03-10🤖 cs.LG

Noisy PDE Training Requires Bigger PINNs

Die Studie zeigt, dass Physics-Informed Neural Networks (PINNs) bei verrauschten Daten eine Mindestgröße überschreiten müssen, um einen empirischen Fehler unter die Varianz des Rauschens zu drücken, wobei eine reine Erhöhung der Stichprobenanzahl allein keine Verbesserung garantiert.

Sebastien Andre-Sloan, Anirbit Mukherjee, Matthew Colbrook2026-03-10🤖 cs.LG

Towards Practical Benchmarking of Data Cleaning Techniques: On Generating Authentic Errors via Large Language Models

Die Arbeit stellt TableEG vor, ein auf Large Language Models basierendes Framework, das durch Feinabstimmung authentische Fehler in tabellarischen Daten generiert und so eine zuverlässige Benchmark für die Bewertung von Datenbereinigungstechniken schafft.

Xinyuan Liu, Jiahui Chen, Bocheng Hu, Yu Sun, Xinyang Chen, Shaoxu Song, Yongxin Tong2026-03-10🤖 cs.LG

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

Die Arbeit stellt MCULoRA vor, einen neuen Parameter-effizienten Ansatz für die unvollständige multimodale Emotionserkennung, der durch die Entkopplung gemeinsamer Informationen und eine dynamische Feinabstimmung der Trainingsverhältnisse die Konflikte zwischen Gradienten verschiedener Modalitätskombinationen überwindet und damit die Vorhersagegenauigkeit signifikant verbessert.

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs

Let's Think in Two Steps: Mitigating Agreement Bias in MLLMs with Self-Grounded Verification

Die Arbeit identifiziert die „Agreement Bias" als zentrales Hindernis für Multimodale LLMs als Verifizierer und schlägt mit SGV eine zweistufige, selbstverankerte Methode vor, die die Fehlererkennung und Aufgabenabschlussraten in Bereichen wie Webnavigation und Robotik signifikant verbessert.

Moises Andrade, Joonhyuk Cha, Brandon Ho, Vriksha Srihari, Karmesh Yadav, Zsolt Kira2026-03-10🤖 cs.LG

Flow Matching Meets Biology and Life Science: A Survey

Diese Arbeit bietet die erste umfassende Übersicht über Flow-Matching-Modelle und deren Anwendungen in den Biowissenschaften, indem sie die theoretischen Grundlagen systematisch erläutert, Anwendungsbereiche wie Sequenzmodellierung und Moleküldesign kategorisiert sowie Datensätze, Werkzeuge und zukünftige Forschungsrichtungen zusammenfasst.

Zihao Li, Zhichen Zeng, Xiao Lin, Feihao Fang, Yanru Qu, Zhe Xu, Zhining Liu, Xuying Ning, Tianxin Wei, Ge Liu, Hanghang Tong, Jingrui He2026-03-10🤖 cs.LG

Weak-to-Strong Generalization with Failure Trajectories: A Tree-based Approach to Elicit Optimal Policy in Strong Models

Diese Arbeit erweitert das Weak-to-Strong Generalization-Paradigma auf komplexe Entscheidungsprozesse, indem sie durch die Nutzung von „Trajektorienbäumen" und Monte-Carlo-Baumsuche sowohl Erfolge als auch Fehlversuche schwacher Modelle nutzt, um die Fähigkeiten starker Modelle theoretisch fundiert und empirisch nachweisbar zu optimieren.

Ruimeng Ye, Zihan Wang, Yang Xiao, Zinan Ling, Manling Li, Bo Hui2026-03-10🤖 cs.LG

Exposing the Illusion of Fairness: Auditing Vulnerabilities to Distributional Manipulation Attacks

Diese Arbeit untersucht, wie böswillige KI-Anbieter durch mathematisch fundierte Manipulationen scheinbar faire und repräsentative Datensätze erzeugen können, um Compliance-Audits zu täuschen, und entwickelt darauf aufbauend statistische Methoden zur Erkennung solcher Täuschungsversuche.

Valentin Lafargue, Adriana Laurindo Monteiro, Emmanuelle Claeys, Laurent Risser, Jean-Michel Loubes2026-03-10🤖 cs.LG

Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models

Die Studie stellt einen dynamischen, automatisierten und systematischen Red-Teaming-Rahmen (DAS) vor, der zeigt, dass medizinische Sprachmodelle trotz hoher Ergebnisse in statischen Benchmarks erhebliche Sicherheitslücken aufweisen und somit durch kontinuierliche Stress-Tests auf Robustheit, Datenschutz, Fairness und Halluzinationen überprüft werden müssen, bevor sie sicher in der klinischen Praxis eingesetzt werden können.

Jiazhen Pan (Cherise), Bailiang Jian (Cherise), Paul Hager (Cherise), Yundi Zhang (Cherise), Che Liu (Cherise), Friedrike Jungmann (Cherise), Hongwei Bran Li (Cherise), Chenyu You (Cherise), Junde Wu (Cherise), Jiayuan Zhu (Cherise), Fenglin Liu (Cherise), Yuyuan Liu (Cherise), Niklas Bubeck (Cherise), Christian Wachinger (Cherise), Chen (Cherise), Chen (Cherise), Zhenyu Gong, Cheng Ouyang, Georgios Kaissis, Benedikt Wiestler, Daniel Rueckert2026-03-10🤖 cs.LG

CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data

Das Paper stellt CauKer vor, einen Algorithmus, der mittels Gauß-Prozess-Kernel-Komposition und strukturellen kausalen Modellen diverse, kausal kohärente synthetische Zeitreihen erzeugt, um die vortrainierte Klassifikation von Zeitreihen-Foundation-Modellen effizienter zu gestalten und dabei klare Skalierungsgesetze im Vergleich zu realen Datensätzen aufzuzeigen.

Shifeng Xie, Vasilii Feofanov, Ambroise Odonnat, Lei Zan, Marius Alonso, Jianfeng Zhang, Themis Palpanas, Lujia Pan, Keli Zhang, Ievgen Redko2026-03-10🤖 cs.LG

GraphProp: Training the Graph Foundation Models using Graph Properties

Die Arbeit stellt GraphProp vor, ein zweiphasiges Trainingsverfahren für Graph-Foundation-Modelle, das durch die Vorhersage struktureller Graphinvarianten eine robuste domänenübergreifende Generalisierung erreicht und insbesondere bei Graphen ohne Knotenattribute überlegene Leistung in überwachtem und Few-Shot-Learning zeigt.

Ziheng Sun, Qi Feng, Lehao Lin, Chris Ding, Jicong Fan2026-03-10🤖 cs.LG

Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks

Diese Arbeit zeigt, dass Gating-Mechanismen in rekurrenten neuronalen Netzen durch die Kopplung von Zustands- und Parameterraum-Dynamiken datengesteuerte, lag-abhängige effektive Lernraten erzeugen und als Prädikonditionierer wirken, die den Gradientenfluss in niedrigdimensionale Unterräume lenken und damit die Trainierbarkeit verbessern.

Lorenzo Livi2026-03-10🤖 cs.LG

ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signals

Das Paper stellt ECHO vor, ein frequenzbewusstes hierarchisches Encoder-Modell für Basis-Modelle, das durch Band-Split-Architektur und gleitende Patches variable Signallängen und beliebige Abtastraten unterstützt und damit bei der Anomalieerkennung und Fehlerklassifizierung in industriellen Maschinensignalen state-of-the-art Ergebnisse erzielt.

Yucong Zhang, Juan Liu, Ming Li2026-03-10🤖 cs.LG

Constraint Learning in Multi-Agent Dynamic Games from Demonstrations of Local Nash Interactions

Die Autoren stellen einen Algorithmus vor, der mithilfe von gemischt-ganzzahligen linearen Programmen parametrische Einschränkungen aus Demonstrationen lokaler Nash-Gleichgewichte in Multi-Agenten-Spielen lernt, um theoretisch fundierte, innere Approximationen sicherer und unsicherer Mengen zu gewinnen und robuste Bewegungspläne zu entwerfen.

Zhouyu Zhang, Chih-Yuan Chiu, Glen Chou2026-03-10🤖 cs.LG

CbLDM: A Diffusion Model for recovering nanostructure from atomic pair distribution function

Die Studie stellt CbLDM vor, ein bedingtes latentes Diffusionsmodell, das mithilfe von Laplace-Matrizen und bedingten Priors die rekonstruierte Nanostruktur monometallischer Nanopartikel aus atomaren Paarverteilungsfunktionen stabil und physikalisch sinnvoll bestimmt.

Jiarui Cao, Zhiyang Zhang, Heming Wang, Jun Xu, Ling Lan, Simon J. L. Billinge, Ran Gu2026-03-10🔬 cond-mat.mtrl-sci

Entropy-Driven Curriculum for Multi-Task Training in Human Mobility Prediction

Diese Arbeit stellt ein einheitliches Trainingsframework vor, das entropiegesteuertes Curriculum-Learning und Multi-Task-Learning kombiniert, um die Vorhersagegenauigkeit menschlicher Mobilität durch schrittweise Komplexitätssteigerung und die gleichzeitige Optimierung von Distanz- und Richtungsdaten zu verbessern.

Tianye Fang, Xuanshu Luo, Martin Werner2026-03-10🤖 cs.LG

Synthetic data for ratemaking: imputation-based methods vs adversarial networks and autoencoders

Diese Studie vergleicht imputationsbasierte Methoden (MICE) mit generativen Modellen wie VAEs und CTGANs für die synthetische Datengenerierung in der Tarifgestaltung und zeigt, dass MICE-Modelle bei geringerer Implementierungskomplexität eine hohe Datenqualität und Konsistenz bei GLM-Modellen bieten.

Yevhen Havrylenko, Meelis Käärik, Artur Tuttar2026-03-10🤖 cs.LG

Faster Gradient Methods for Highly-Smooth Stochastic Bilevel Optimization

Diese Arbeit schlägt die Klasse von Methoden F²SA-p vor, die durch die Verwendung von p-ter Ordnung endlichen Differenzen zur Approximation des Hypergradienten die Komplexität für stochastische Bilevel-Optimierungsprobleme mit hochgradig glatten Funktionen auf $\tilde{\mathcal{O}}(p \epsilon^{-4-p/2})$ verbessert und damit nahezu die untere Schranke von $\Omega(\epsilon^{-4})$ erreicht.

Lesi Chen, Junru Li, El Mahdi Chayti, Jingzhao Zhang2026-03-10🤖 cs.LG

Behavioral Inference at Scale: The Fundamental Asymmetry Between Motivations and Belief Systems

Die Studie zeigt, dass bei der Verhaltensinferenz von KI-Agenten zwar Motivationen mit nahezu 100 %iger Genauigkeit erkannt werden können, während die Identifizierung von Glaubenssystemen selbst bei fortschrittlichen Architekturen und umfangreichen Trainingsdaten an einer fundamentalen Informationsgrenze von unter 50 % scheitert.

Jason Starace, Terence Soule2026-03-10🤖 cs.LG

← Zurück Weiter →