cs.LG Arbeiten | Gist.Science

GATech at AbjadGenEval Shared Task: Multilingual Embeddings for Arabic Machine-Generated Text Classification

Das Team GATech stellt bei der AbjadGenEval-Shared-Task einen Ansatz zur Erkennung von KI-generiertem arabischen Text vor, bei dem ein feinabgestimmter multilingualer E5-large-Encoder mit einfacher Mittelwert-Pooling-Strategie die besten Ergebnisse (F1 0,75) erzielt, da komplexere Pooling-Methoden bei begrenzten Daten nicht besser generalisieren und zudem ein deutlicher Längenunterschied zwischen menschlichen und maschinellen Texten festgestellt wurde.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

GATech at AbjadMed: Bidirectional Encoders vs. Causal Decoders: Insights from 82-Class Arabic Medical Classification

Diese Arbeit zeigt, dass für die feinkörnige Klassifizierung arabischer medizinischer Texte über 82 Kategorien spezialisierte bidirektionale Encoder wie AraBERTv2 aufgrund ihrer Fähigkeit, globale semantische Kontexte zu erfassen, deutlich besser abschneiden als kausale Decoder-Modelle.

Ahmed Khaled Khamis2026-03-12💬 cs.CL

Personalized Group Relative Policy Optimization for Heterogenous Preference Alignment

Die vorgestellte Arbeit führt Personalized GRPO (P-GRPO) ein, ein neuartiges Ausrichtungsframework, das durch die Entkopplung der Vorteilsschätzung von der aktuellen Batch-Statistik und die Normalisierung gegenüber gruppenspezifischen Belohnungshistorien die Verzerrung zugunsten dominanter Präferenzen in heterogenen Szenarien überwindet und so eine schnellere Konvergenz sowie eine präzisere Anpassung an individuelle Nutzerpräferenzen ermöglicht.

Jialu Wang, Heinrich Peters, Asad A. Butt, Navid Hashemi, Alireza Hashemi, Pouya M. Ghari, Joseph Hoover, James Rae, Morteza Dehghani2026-03-12🤖 cs.LG

Defining AI Models and AI Systems: A Framework to Resolve the Boundary Problem

Dieser Beitrag schlägt ein konzeptionelles und operatives Definitionsrahmenwerk vor, das die oft unklare Grenze zwischen KI-Modellen und KI-Systemen auflöst, um die Zuweisung regulatorischer Pflichten entlang der KI-Wertschöpfungskette zu präzisieren.

Yuanyuan Sun, Timothy Parker, Lara Gierschmann, Sana Shams, Teo Canmetin, Mathieu Duteil, Rokas Gipiškis, Ze Shen Chin2026-03-12🤖 cs.AI

LWM-Temporal: Sparse Spatio-Temporal Attention for Wireless Channel Representation Learning

LWM-Temporal ist ein neuer, aufgabenunabhängiger Basis-Modell-Ansatz für drahtlose Kanäle, der durch eine physikalisch ausgerichtete, sparse spatio-temporale Aufmerksamkeit und ein selbstüberwachtes Vortraining mit physikbasiertem Maskierungscurriculum universelle, geometrie-konsistente Kanal-Embeddings lernt, die insbesondere bei langen Vorhersagehorizonten und begrenzten Fine-Tuning-Daten signifikante Verbesserungen gegenüber bestehenden Methoden erzielen.

Sadjad Alikhani, Akshay Malhotra, Shahab Hamidi-Rad, Ahmed Alkhateeb2026-03-12🤖 cs.LG

HTM-EAR: Importance-Preserving Tiered Memory with Hybrid Routing under Saturation

Die Arbeit stellt HTM-EAR vor, ein hierarchisches Tiered-Memory-System mit hybrider Routing-Strategie und bewusster Verdrängung, das unter Sättigungsbedingungen durch den Erhalt wichtiger Informationen und gezieltes Vergessen veralteter Fakten die Abfragepräzision signifikant verbessert.

Shubham Kumar Singh2026-03-12🤖 cs.AI

Tureis: Transformer-based Unified Resilience for IoT Devices in Smart Homes

Die Arbeit stellt Tureis vor, eine selbstüberwachte, Transformer-basierte Methode, die in Smart-Home-Umgebungen mit mehreren Bewohnern und gleichzeitigen Sensorausfällen eine präzise Fehlererkennung und -lokalisierung ohne manuelle Kennzeichnung ermöglicht und dabei ressourcenschonend auf Edge-Geräten wie dem Raspberry Pi 5 läuft.

Alireza Borhani, Vafa Andalibi, Bahar Asgari2026-03-12💻 cs

Evaluating Generalization Mechanisms in Autonomous Cyber Attack Agents

Die Studie zeigt, dass autonome Cyber-Angreifer-Agenten durch IP-Adressänderungen in ihrer Generalisierungsfähigkeit stark beeinträchtigt werden, wobei zwar promptgesteuerte LLM-Agenten die höchste Erfolgswahrscheinlichkeit aufweisen, dies jedoch auf Kosten von Rechenleistung, Transparenz und Zuverlässigkeit geht.

Ondřej Lukáš, Jihoon Shin, Emilia Rivas, Diego Forni, Maria Rigaki, Carlos Catania, Aritran Piplai, Christopher Kiekintveld, Sebastian Garcia2026-03-12💻 cs

Safety Under Scaffolding: How Evaluation Conditions Shape Measured Safety

Die Studie zeigt, dass die Evaluierungsformate (z. B. Multiple-Choice vs. offen) einen größeren Einfluss auf gemessene Sicherheitswerte haben als die Scaffolding-Architekturen selbst, was universelle Sicherheitsaussagen unmöglich macht und eine kontextspezifische Prüfung pro Modell und Konfiguration erfordert.

David Gringras2026-03-12🤖 cs.AI

Gated Adaptation for Continual Learning in Human Activity Recognition

Die vorgeschlagene Methode zur kontinuierlichen Lernfähigkeit in der menschlichen Aktivitätserkennung nutzt eine parametereffiziente, kanalweise gated Modulation eingefrorener vortrainierter Merkmale, um durch selektive Skalierung statt neuer Merkmalsgenerierung sowohl Stabilität gegen katastrophales Vergessen als auch Plastizität für neue Subjekte zu gewährleisten.

Reza Rahimi Azghan, Gautham Krishna Gudur, Mohit Malu, Edison Thomaz, Giulia Pedrielli, Pavan Turaga, Hassan Ghasemzadeh2026-03-12🤖 cs.LG

Revisiting Sharpness-Aware Minimization: A More Faithful and Effective Implementation

Die Arbeit stellt XSAM vor, eine verbesserte und effiziente Implementierung von Sharpness-Aware Minimization, die durch eine intuitivere Interpretation des Gradienten und eine explizite Richtungsbestimmung des Maximums die Generalisierungsfähigkeit von neuronalen Netzen über bestehende Methoden hinaus optimiert.

Jianlong Chen, Zhiming Zhou2026-03-12🤖 cs.LG

InFusionLayer: a CFA-based ensemble tool to generate new classifiers for learning and modeling

Das Paper stellt InFusionLayer vor, ein Open-Source-Python-Tool, das auf Kombinatorischer Fusionsanalyse (CFA) basiert, um durch die Integration von Rang-Score-Charakteristik und kognitiver Diversität Ensemble-Methoden für überwachte und unüberwachte Klassifizierungsprobleme in gängigen Machine-Learning-Frameworks zu ermöglichen.

Eric Roginek, Jingyan Xu, D. Frank. Hsu2026-03-12🤖 cs.LG

Where Do Flow Semantics Reside? A Protocol-Native Tabular Pretraining Paradigm for Encrypted Traffic Classification

Die Arbeit stellt FlowSem-MAE vor, einen tabellenbasierten Masked Autoencoder, der durch die Berücksichtigung protokollspezifischer Feldsemantik und die Vermeidung von Induktionsverzerrungen bei der Verschlüsselungstraffik-Klassifizierung den aktuellen Stand der Technik übertrifft und dabei deutlich weniger gelabelte Daten benötigt.

Sizhe Huang, Shujie Yang2026-03-12🤖 cs.AI

OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies

Das Paper stellt OMNIGUIDE vor, ein flexibles Framework, das die Leistung von allgemeinen Vision-Language-Action-Robotikmodellen bei komplexen Aufgaben durch die Integration verschiedener Guidance-Quellen als differenzierbare Energiefunktionen in einem einheitlichen Ansatz signifikant verbessert.

Yunzhou Song, Long Le, Yong-Hyun Park, Jie Wang, Junyao Shi, Lingjie Liu, Jiatao Gu, Eric Eaton, Dinesh Jayaraman, Kostas Daniilidis2026-03-12💻 cs

Cluster-Aware Attention-Based Deep Reinforcement Learning for Pickup and Delivery Problems

Die Arbeit stellt CAADRL vor, einen Deep-Reinforcement-Learning-Ansatz, der durch clusterbewusste Kodierung und hierarchische Dekodierung die Struktur des Pickup-and-Delivery-Problems explizit nutzt, um bei gleichzeitig geringerer Inferenzzeit als kollaborative Suchverfahren state-of-the-art-Ergebnisse auf instanziellen Clustern zu erzielen.

Wentao Wang, Lifeng Han, Guangyu Zou2026-03-12🤖 cs.LG

Quantization of Ricci Curvature in Information Geometry

Diese Arbeit bestätigt nach zwanzig Jahren die Vermutung einer universellen Quantisierung des krümmungsgewichteten Ricci-Skalars auf positive Halbzahlen für baum- und vollständig-graph-strukturierte binäre Bayes-Netze, widerlegt sie jedoch für allgemeine Graphen durch explizite Schleifen-Gegenbeispiele und erweitert die Analyse auf Gaußsche DAG-Netze, bei denen eine Vorzeichen-Dichotomie zwischen positiver diskreter und negativer kontinuierlicher Krümmung besteht.

Carlos C. Rodriguez2026-03-12🔢 math

Training Language Models via Neural Cellular Automata

Die Studie zeigt, dass das Vortraining von Sprachmodellen auf synthetischen, nicht-sprachlichen Daten aus neuronalen zellulären Automaten die Leistung und Konvergenzgeschwindigkeit im Vergleich zu herkömmlichen Textdaten verbessert und einen effizienteren Weg zu intelligenten Modellen durch vollständig synthetisches Pre-Training eröffnet.

Dan Lee, Seungwook Han, Akarsh Kumar, Pulkit Agrawal2026-03-12🤖 cs.LG

HTMuon: Improving Muon via Heavy-Tailed Spectral Correction

Die Arbeit stellt HTMuon vor, einen optimierten Muon-Algorithmus, der durch heavy-tailed spektrale Korrektur die Leistung von LLMs und Bildklassifizierung verbessert, indem er die Unterdrückung schwerer Verteilungsschwänze im Muon-Update vermeidet und theoretisch als steilster Abstieg unter Schatten-q-Norm-Bedingungen analysiert wird.

Tianyu Pang, Yujie Fang, Zihang Liu, Shenyang Deng, Lei Hsiung, Shuhua Yu, Yaoqing Yang2026-03-12🤖 cs.LG

Improving Search Agent with One Line of Code

Die Arbeit stellt SAPO vor, eine Methode, die durch eine einzige Codezeile-Änderung das Trainingskollaps bei suchbasierten Agenten verhindert und so eine deutliche Leistungssteigerung gegenüber bestehenden Ansätzen wie Search-R1 erzielt.

Jian Li, Dongsheng Chen, Zhenhua Xu, Yizhang Jin, Jiafu Wu, Chengjie Wang, Xiaotong Yuan, Yabiao Wang2026-03-12🤖 cs.LG

Dissecting Chronos: Sparse Autoencoders Reveal Causal Feature Hierarchies in Time Series Foundation Models

Die Studie wendet erstmals Sparse Autoencoder auf das Zeitreihen-Modell Chronos-T5 an und zeigt durch kausale Feature-Ablation, dass kritische Vorhersagefähigkeiten nicht in den semantisch reichsten, sondern in den mittleren Schichten verankert sind, die abrupte Dynamiken erkennen, während eine progressive Ablation der finalen Schichten die Prognosequalität paradoxerweise verbessert.

Anurag Mishra2026-03-12🤖 cs.LG

← Zurück Weiter →