Global Minimizers of Sigmoid Contrastive Loss

Diese Arbeit erklärt theoretisch die Vorteile der Synchronisierung von trainierbarer inverser Temperatur und Bias im Sigmoid-Verlust (wie bei SigLIP), indem sie neue kombinatorische Objekte namens (m,brel)(\mathsf{m}, \mathsf{b}_{\mathsf{rel}})-Konstellationen einführt, um den Erfolg des Modells, die Modality Gap und die erforderliche Dimension für hochwertige Repräsentationen zu analysieren.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

Die Arbeit stellt SMoPE vor, ein neuartiges Framework für das kontinuierliche Lernen, das durch die Kombination von Prompt-basierten Methoden mit einer spärlichen Mixture-of-Experts-Architektur die Effizienz von geteilten Prompts mit der Leistungsfähigkeit aufgaben-spezifischer Prompts vereint und dabei Interferenz minimiert sowie Speicher- und Rechenkosten erheblich senkt.

Minh Le, Bao-Ngoc Dao, Huy Nguyen, Quyen Tran, Anh Nguyen, Nhat Ho2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

Die Arbeit stellt RADAR vor, ein leichtgewichtiges und interpretierbares Routing-Framework, das auf psychometrischen Prinzipien basiert, um Anfragen basierend auf ihrer Schwierigkeit und den Fähigkeiten von Modell-Budget-Kombinationen intelligent auf verschiedene Reasoning-LLMs zu verteilen und so die Leistung bei gleichzeitiger Kosteneffizienz zu optimieren.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG

Diese Arbeit stellt die erste systematische Evaluierung selbstüberwachter Lernverfahren für die label-effiziente Schlafstadienklassifizierung mit tragbaren EEG-Geräten vor und zeigt, dass ein domainspezifischer Ansatz die Leistung gegenüber rein überwachten Baselines und allgemeinen EEG-Grundmodellen signifikant verbessert, insbesondere bei knappen annotierten Daten.

Emilio Estevan, María Sierra-Torralba, Eduardo López-Larraz, Luis Montesano2026-03-12🤖 cs.AI

Geopolitics, Geoeconomics, and Sovereign Risk: Different Shocks, Different Channels

Die Studie unterscheidet zwischen geopolitischen Schocks, die das Ausfallrisiko von Staaten direkt beeinflussen, und geoekonomischen Schocks, die über die erwartete Geldpolitik wirken, und zeigt anhand eines Datensatzes von 42 Volkswirtschaften, dass diese unterschiedlichen Kanäle zu einem charakteristischen „Scherenmuster" in den Sovereign-CDS-Spreads führen, was darauf hindeutet, dass Liquiditätsbereitstellung zwar finanzzyklusbedingte Spread-Erweiterungen mildern, aber nicht die persistierenden geopolitischen Risikoprämien adressieren kann.

Alvaro Ortiz, Tomasa Rodrigo, Pablo Saborido2026-03-12📊 stat

HyWA: Hypernetwork Weight Adapting Personalized Voice Activity Detection

Die Arbeit stellt HyWA vor, eine personalisierte Sprachaktivitätserkennungsmethode, die mithilfe eines Hypernetzes angepasste Gewichte für ausgewählte Schichten eines Standardmodells generiert und dabei sowohl die Genauigkeit als auch die Deployment-Effizienz im Vergleich zu bestehenden Sprecher-Conditioning-Verfahren verbessert.

Mahsa Ghazvini Nejad, Hamed Jafarzadeh Asl, Amin Edraki, Mohammadreza Sadeghi, Masoud Asgharian, Yuanhao Yu, Vahid Partovi Nia2026-03-12⚡ eess

Resource Allocation in Hybrid Radio-Optical IoT Networks using GNN with Multi-task Learning

Die vorgestellte Arbeit adressiert die Ressourcenzuteilung in hybriden RF-OWC-IoT-Netzen durch den Dual-Graph-Embedding-with-Transformer (DGET)-Ansatz, der Graph Neural Networks mit Multi-Task-Learning kombiniert, um bei unvollständiger Kanalbeobachtung eine nahezu optimale, recheneffiziente Scheduling-Strategie zu erreichen, die den Durchsatz maximiert und das Delivery-based Age of Information im Vergleich zu reinen RF-Systemen um bis zu 20 % senkt.

Aymen Hamrouni, Sofie Pollin, Hazem Sallouha2026-03-12🤖 cs.LG