cs.LG Arbeiten | Gist.Science

Efficient Reasoning at Fixed Test-Time Cost via Length-Aware Attention Priors and Gain-Aware Training

Diese Arbeit stellt zwei rein trainingsseitige Komponenten vor, die durch längenbewusste Aufmerksamkeitspriors und einen gewinnbewussten Controller die Effizienz des logischen Schlussfolgerns bei festen Testzeitkosten verbessern, indem sie die Validierungsverluste senken, ohne die Inferenzlatenz oder den Speicherbedarf zu erhöhen.

Rian AtriWed, 11 Ma🤖 cs.LG

Transductive Generalization via Optimal Transport and Its Application to Graph Node Classification

Diese Arbeit stellt neue, effizient berechenbare transduktive Generalisierungsgrenzen für Graph-Node-Klassifizierung vor, die auf Optimal-Transport-Maßen basieren und durch die Analyse von GNN-Aggregationen sowohl die empirische Generalisierung als auch den nicht-monotonen Einfluss der Netzwerktiefe auf den Fehler erklären.

MoonJeong Park, Seungbeom Lee, Kyungmin Kim, Jaeseung Heo, Seunghyuk Cho, Shouheng Li, Sangdon Park, Dongwoo KimWed, 11 Ma🤖 cs.LG

DendroNN: Dendrocentric Neural Networks for Energy-Efficient Classification of Event-Based Data

Die Arbeit stellt DendroNN vor, ein neuartiges, dendritenzentrisches neuronales Netzwerk, das durch die Nachahmung von Sequenzerkennungsmechanismen in Dendriten und eine gradientenfreie Umverdrahtung energieeffiziente, hochpräzise Klassifizierung von ereignisbasierten Daten ermöglicht und dabei eine Hardware-Architektur mit bis zu vierfacher Effizienzsteigerung gegenüber bestehenden neuromorphen Systemen bietet.

Jann Krausse, Zhe Su, Kyrus Mama, Maryada, Klaus Knobloch, Giacomo Indiveri, Jürgen BeckerWed, 11 Ma🤖 cs.AI

On Regret Bounds of Thompson Sampling for Bayesian Optimization

Diese Arbeit schließt bestehende Lücken in der Analyse von Gaussian-Process-Thompson-Sampling (GP-TS) für das Bayesianische Optimieren, indem sie erstmals eine untere Regret-Schranke, eine verbesserte obere Schranke für die kumulative Regret über die Zeit $T$ sowie erwartete „lenient"-Regret-Schranken und eine Schranke für die zweite Moment der kumulativen Regret herleitet.

Shion Takeno, Shogo IwazakiWed, 11 Ma🤖 cs.LG

Proxy-Guided Measurement Calibration

Die Arbeit stellt einen rahmenbasierten Ansatz vor, der mithilfe von Proxy-Variablen und variationalen Autoencodern systematische Messfehler in aggregierten Ergebnisvariablen identifiziert und korrigiert, indem sie latente Inhalts- und Verzerrungsvariablen in einem kausalen Graphen trennt.

Saketh Vishnubhatla, Shu Wan, Andre Harrison, Adrienne Raglin, Huan LiuWed, 11 Ma🤖 cs.LG

A Gaussian Comparison Theorem for Training Dynamics in Machine Learning

Diese Arbeit leitet einen nicht-asymptotischen Vergleichssatz für das Training von Machine-Learning-Modellen auf Basis von Gaußschen Mischmodellen her, der die Dynamik mit einem einfacher zu analysierenden Surrogat-System verbindet und die Gültigkeit der dynamischen Mean-Field-Approximationen rigoros beweist.

Ashkan PanahiWed, 11 Ma🤖 cs.LG

CLoE: Expert Consistency Learning for Missing Modality Segmentation

Das Paper stellt CLoE vor, einen konsistenzbasierten Lernrahmen für die Segmentierung medizinischer Bilder mit fehlenden Modalitäten, der durch Expertenkonsistenz auf Entscheidungs- und Regionsebene sowie eine zuverlässigkeitsgesteuerte Merkmalsanpassung die Robustheit und Genauigkeit bei unvollständigen Eingabedaten signifikant verbessert.

Xinyu Tong, Meihua Zhou, Bowu Fan, Haitao LiWed, 11 Ma🤖 cs.AI

Reward-Zero: Language Embedding Driven Implicit Reward Mechanisms for Reinforcement Learning

Die Arbeit stellt Reward-Zero vor, einen allgemeinen, impliziten Belohnungsmechanismus, der natürliche Sprachbeschreibungen mittels Embeddings in dichte, semantisch fundierte Fortschrittsignale für das Reinforcement Learning umwandelt und so das Training beschleunigt sowie die Generalisierungsfähigkeit von Agenten verbessert.

Heng Zhang, Haddy Alchaer, Arash Ajoudani, Yu SheWed, 11 Ma🤖 cs.LG

TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection

Die Arbeit stellt TA-GGAD vor, ein adaptives Graph-Modell, das durch die Identifizierung und Modellierung des „Anomaly Disassortativity"-Problems eine bahnbrechende, domänenübergreifende Generalisierung bei der Erkennung von Anomalien in Graphen ermöglicht.

Xiong Zhang, Hong Peng, Changlong Fu, Xin Jin, Yun Yang, Cheng XieWed, 11 Ma🤖 cs.AI

Interactive 3D visualization of surface roughness predictions in additive manufacturing: A data-driven framework

Diese Arbeit stellt ein datengesteuertes Framework vor, das mithilfe von maschinellem Lernen und generativen Modellen die Oberflächenrauheit im Material-Extrusions-Druck vorhersagt und über eine interaktive 3D-Web-Schnittstelle eine visuelle Entscheidungsunterstützung für die Prozessplanung bietet.

Engin Deniz Erkan, Elif Surer, Ulas YamanWed, 11 Ma🤖 cs.LG

Democratising Clinical AI through Dataset Condensation for Classical Clinical Models

Diese Arbeit stellt einen differenziell privaten, nullten Ordnungs-Optimierungsrahmen vor, der die Datensatzkondensation auf nicht differenzierbare klinische Modelle wie Entscheidungsbäume und Cox-Regressionen erweitert, um eine sichere und modellunabhängige Datenteilung für klinische Vorhersageaufgaben zu ermöglichen.

Anshul Thakur, Soheila Molaei, Pafue Christy Nganjimi, Joshua Fieggen, Andrew A. S. Soltan, Danielle Belgrave, Lei Clifton, David A. CliftonWed, 11 Ma🤖 cs.AI

From Representation to Clusters: A Contrastive Learning Approach for Attributed Hypergraph Clustering

Die Arbeit stellt CAHC vor, eine end-zu-end-Methode für das Clustering attributierter Hypergraphen mittels kontrastiven Lernens, die die Repräsentationslernen- und Clusterzuweisungsschritte kombiniert, um eine direkte Clustering-Überwachung zu ermöglichen und damit die Leistung gegenüber bestehenden Ansätzen zu verbessern.

Li Ni, Shuaikang Zeng, Lin Mu, Longlong LinWed, 11 Ma🤖 cs.LG

Flow Field Reconstruction via Voronoi-Enhanced Physics-Informed Neural Networks with End-to-End Sensor Placement Optimization

Die Studie stellt VSOPINN vor, ein physik-informiertes neuronales Netzwerk, das durch eine differenzierbare Voronoi-Optimierung die Sensorplatzierung end-zu-end anpasst, um die Genauigkeit und Robustheit der Strömungsfeld-Rekonstruktion auch bei unvollständigen Messdaten und Sensorausfällen signifikant zu verbessern.

Renjie Xiao, Bingteng Sun, Yiling Chen, Lin Lu, Qiang Du, Junqiang ZhuWed, 11 Ma🤖 cs.LG

SPAARS: Safer RL Policy Alignment through Abstract Exploration and Refined Exploitation of Action Space

Die Arbeit stellt SPAARS vor, ein Curriculum-Learning-Framework für das Offline-zu-Online-Reinforcement-Learning, das die Exploration zunächst sicher in einem latenten Raum einschränkt und dann nahtlos in den rohen Aktionsraum übergeht, um die durch Decoder-Rekonstruktionsverluste bedingte Leistungsgrenze zu überwinden und gleichzeitig die Sample-Effizienz sowie die Stabilität zu steigern.

Swaminathan S K, Aritra HazraWed, 11 Ma🤖 cs.AI

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

Die Arbeit stellt den vollständig konvolutionalen Diffusionsmodell (FCDM) vor, der auf ConvNeXt basiert und durch seine überlegene Recheneffizienz sowie trainierbarkeit auf begrenzter Hardware eine wettbewerbsfähige Alternative zu Transformer-basierten Diffusionsmodellen darstellt.

Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius AzevedoWed, 11 Ma🤖 cs.AI

Reconstructing Movement from Sparse Samples: Enhanced Spatio-Temporal Matching Strategies for Low-Frequency Data

Diese Arbeit verbessert den räumlich-zeitlichen Matching-Algorithmus zur Zuordnung von GPS-Trajektorien zu Straßennetzen durch vier Modifikationen wie einen dynamischen Puffer und eine adaptive Beobachtungswahrscheinlichkeit, was zu einer signifikanten Steigerung der Recheneffizienz und der Pfadqualität bei Daten mit niedriger Abtastrate in dichten Umgebungen führt.

Ali Yousefian, Arianna Burzacchi, Simone VantiniWed, 11 Ma🤖 cs.LG

Impact of Markov Decision Process Design on Sim-to-Real Reinforcement Learning

Diese Arbeit analysiert systematisch den Einfluss von Markov-Entscheidungsprozess-Designentscheidungen auf die Sim-zu-Real-Übertragung beim Reinforcement Learning und zeigt anhand eines Farbmischungs-Experiments, dass physikbasierte Dynamikmodelle unter strengen Präzisionsanforderungen bis zu 50 % Erfolg auf realer Hardware ermöglichen, während vereinfachte Modelle versagen.

Tatjana Krau, Jorge Mandlmaier, Tobias Damm, Frieder HeieckWed, 11 Ma🤖 cs.LG

From Weighting to Modeling: A Nonparametric Estimator for Off-Policy Evaluation

Die Autoren stellen einen neuen nichtparametrischen Ansatz zur Off-Policy-Evaluation vor, der durch die Kombination von nichtparametrischer Gewichtung und modellgestützten Belohnungsvorhersagen im Vergleich zu bestehenden Methoden wie IPW und DR eine signifikant niedrigere Varianz bei gleichzeitig geringer Verzerrung erreicht.

Rong J. B. ZhuWed, 11 Ma🤖 cs.LG

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Die Arbeit stellt VMoER vor, einen skalierbaren bayesschen Ansatz, der die Unsicherheitsquantifizierung in Mixture-of-Experts-Transformern durch eine strukturierte Inferenz im Routing-Mechanismus ermöglicht und dabei die Kalibrierung sowie die Stabilität bei gleichzeitiger Minimierung des Rechenaufwards erheblich verbessert.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Diese Arbeit stellt Temporal-Conditioned Normalizing Flows (tcNF) vor, ein neues Framework zur Anomalieerkennung in multivariaten Zeitreihen, das durch die Bedingungung normalisierender Flüsse auf vorherige Beobachtungen komplexe zeitliche Abhängigkeiten modelliert und robuste Wahrscheinlichkeitsverteilungen für die Identifizierung von Anomalien liefert.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

← Zurück Weiter →