cs Arbeiten | Gist.Science

RegionReasoner: Region-Grounded Multi-Round Visual Reasoning

Die Arbeit stellt mit RegionReasoner ein Reinforcement-Learning-Framework und den zugehörigen Benchmark RegionDial-Bench vor, die durch erzwungene Verankerung von Schlussfolgerungen in Bounding-Boxen sowie einen global-lokalen Konsistenz-Preis die mehrstufige visuelle Schlussfolgerung, die räumliche Verankerung und die semantische Kohärenz in großen Vision-Sprach-Modellen signifikant verbessern.

Wenfang Sun, Hao Chen, Yingjun Du, Yefeng Zheng, Cees G. M. Snoek2026-03-11💻 cs

Optimal conversion from Rényi Differential Privacy to $f$ -Differential Privacy

Die Arbeit beweist, dass die Konversionsregel, die auf dem Schnitt der RDP-Privatsphärenregionen basiert, die optimale und nicht weiter verbesserbare Methode ist, um aus Rénýi-Differentialprivacy-Garantien die schärfstmöglichen $f$ -Differentialprivacy-Grenzen abzuleiten.

Anneliese Riess, Juan Felipe Gomez, Flavio du Pin Calmon, Julia Anne Schnabel, Georgios Kaissis2026-03-11💻 cs

Pathwise Test-Time Correction for Autoregressive Long Video Generation

Die Arbeit stellt eine trainingsfreie Methode namens Test-Time Correction (TTC) vor, die durch die Kalibrierung stochastischer Zustände anhand des ersten Frames die Fehlerakkumulation bei der autoregressiven Generierung langer Videos in Echtzeit effektiv reduziert und dabei die Qualität trainingsbasierter Ansätze erreicht.

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao Guo2026-03-11💻 cs

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

Das 26 Gramm schwere, schmetterlingsinspirierte Robotersystem „AirPulse" demonstriert erstmals den autonomen, geschlossenen Regelkreis-Flug einer schwanzlosen Plattform durch Nachahmung biologischer Flügelschläge und eine hierarchische Steuerungsarchitektur, die stabile Manöver in einem bisher kaum erforschten aerodynamischen Regime ermöglicht.

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue Zhou2026-03-11💻 cs

Multimodal Classification via Total Correlation Maximization

Die Arbeit stellt TCMax vor, eine hyperparameterfreie Methode zur multimodalen Klassifizierung, die durch die Maximierung der totalen Korrelation zwischen Merkmalen und Labels mittels TCNE Modality-Konkurrenz überwindet und damit den Stand der Technik in Bezug auf Genauigkeit übertrifft.

Feng Yu, Xiangyu Wu, Yang Yang, Jianfeng Lu2026-03-11💻 cs

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Diese kritische Übersichtsarbeit analysiert die aktuelle Forschung zur Beziehung zwischen LGBTQIA+-Gemeinschaften und NLP-Technologien, identifiziert bestehende Lücken und Verzerrungen sowie einen überwiegend reaktiven Forschungsansatz und fordert als Aufruf zum Handeln eine proaktivere, intersektionale und inklusivere Entwicklung gerechterer NLP-Systeme.

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan Long2026-03-11💻 cs

A Calculus of Inheritance

Der Artikel stellt den Vererbungs-Kalkül vor, ein auf drei Primitiven basierendes, deklaratives Fundament, das durch die Modellierung von Vererbung als Mengenvereinigung das Problem der Mehrfachvererbung löst und eine streng ausdrucksstärkere Semantik als der $\lambda$ -Kalkül bietet.

Bo Yang2026-03-11✓ Author reviewed ⓘ💻 cs

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

Diese Arbeit stellt ein Meta-Spiel-Design vor, das die Entstehung algorithmischer Absprachen unter Testzeit-Bedingungen untersucht, indem es vortrainierte Strategien mit Anpassungsregeln kombiniert und deren Verhalten in wiederholten Preiswettbewerben mit Hilfe von empirischen Spielanalysen bewertet.

Yuhong Luo, Daniel Schoepflin, Xintong Wang2026-03-11💻 cs

Temporal Consistency-Aware Text-to-Motion Generation

Die Arbeit stellt TCA-T2M vor, ein Framework für die Text-zu-Bewegungs-Generierung, das durch einen temporal konsistenzbewussten räumlichen VQ-VAE, einen maskierten Motion-Transformer und kinematische Constraints realistische, physikalisch plausible und semantisch ausgerichtete Bewegungssequenzen erzeugt und damit den State-of-the-Art auf den Benchmarks HumanML3D und KIT-ML erreicht.

Hongsong Wang, Wenjing Yan, Qiuxia Lai + 1 more2026-03-11💻 cs

ChimeraLoRA: Multi-Head LoRA-Guided Synthetic Datasets

Die Arbeit stellt ChimeraLoRA vor, eine Methode, die durch die Kombination eines klassengeteilten LoRA-Adapters mit per-Bild-LoRAs und einer semantischen Verstärkung mittels Bounding-Box-Erhaltung synthetische Datensätze erzeugt, die sowohl vielfältig als auch detailreich sind und so die Genauigkeit von Few-Shot-Klassifikationsmodellen verbessern.

Hoyoung Kim, Minwoo Jang, Jabin Koo, Sangdoo Yun, Jungseul Ok2026-03-11💻 cs

DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

Die Arbeit stellt DOCFORGE-BENCH vor, das erste Zero-Shot-Benchmark für die Erkennung von Dokumentenfälschungen, das zeigt, dass bestehende Methoden aufgrund einer massiven Kalibrierungsproblematik bei der Schwellenwertwahl und nicht aufgrund mangelnder Diskriminierungsfähigkeit in realen Szenarien versagen.

Zengqi Zhao, Weidi Xia, En Wei, Yan Zhang, Jane Mo, Tiannan Zhang, Yuanqin Dai, Zexi Chen, Yiran Tao, Simiao Ren2026-03-11💻 cs

Multimodal Adversarial Quality Policy for Safe Grasping

Die Arbeit stellt die Multimodal Adversarial Quality Policy (MAQP) vor, ein Framework zur sicheren visuellen Greifsteuerung von Robotern, das durch eine heterogene Dual-Patch-Optimierung und eine gradientenbasierte Modalitätsausgewogenheit die Sicherheitsrisiken von Deep-Learning-Modellen in der Mensch-Roboter-Interaktion effektiv reduziert.

Kunlin Xie, Chenghao Li, Haolan Zhang, Nak Young Chong2026-03-11💻 cs

Hardness of the Binary Covering Radius Problem in Large $\ell_p$ Norms

Die Arbeit beweist erstmals die NP-Härte des approximativen Covering-Radius-Problems für Gitter in der $\ell_p$ -Norm für explizite Werte von $p > 35,31$ und zeigt, dass der Approximationsfaktor asymptotisch gegen $9/8$ konvergiert.

Huck Bennett, Peter Ly2026-03-11💻 cs

Scaling Multilingual Semantic Search in Uber Eats Delivery

Dieses Paper stellt ein produktionsreifes semantisches Suchsystem für Uber Eats vor, das durch Feinabstimmung eines Qwen2-Modells auf großen Datensätzen, den Einsatz von Matryoshka-Repräsentationslernen und eine kombinierte Verlustfunktion eine einheitliche und mehrsprachige Suche über Restaurants, Gerichte und Lebensmittelgeschäfte hinweg ermöglicht und dabei die Rückrufquote in mehreren Märkten signifikant verbessert.

Bo Ling, Zheng Liu, Haoyang Chen, Divya Nagar, Luting Yang, Mehul Parsana2026-03-11💻 cs

A Hybrid Residue Floating Numerical Architecture with Formal Error Bounds for High Throughput FPGA Computation

Diese Arbeit stellt die Hybrid Residue Floating Numerical Architecture (HRFNA) vor, eine neuartige numerische Architektur für FPGAs, die durch die Kombination von residueller Arithmetik und Exponenten-Skalierung hohe Durchsatzraten und Energieeffizienz bei formal nachweisbaren Fehlergrenzen erreicht.

Mostafa Darvishi2026-03-11💻 cs

On the Multi-Commodity Flow with convex objective function: Column-Generation approaches

Diese Arbeit stellt einen effizienten Algorithmus auf Basis der Spaltengenerierung vor, um das konvexe Multi-Commodity-Flow-Problem in Telekommunikationsnetzen zu lösen, bei dem die Kosten mit der Auslastung der Verbindungen konvex ansteigen, und bietet dabei Lösungen sowohl für splittbare als auch für unteilbare Flussvarianten.

Guillaume Beraud-Sudreau, Lucas Létocart, Youcef Magnouche, Sébastien Martin2026-03-11💻 cs

VeriInteresting: An Empirical Study of Model Prompt Interactions in Verilog Code Generation

Die Studie „VeriInteresting" liefert eine empirische Analyse der Wechselwirkungen zwischen verschiedenen Sprachmodellklassen und Prompt-Strategien bei der Verilog-Code-Generierung und identifiziert generalisierbare Muster sowie modellspezifische Trends.

Luca Collini, Andrew Hennesee, Patrick Yubeaton, Siddharth Garg, Ramesh Karri2026-03-11💻 cs

AnalogToBi: Device-Level Analog Circuit Topology Generation via Bipartite Graph and Grammar Guided Decoding

Das Paper stellt AnalogToBi vor, ein Framework zur automatischen Generierung von analogen Schaltungstopologien auf Bauteilebene, das durch eine bipartite Graphendarstellung, grammatikgesteuertes Decodieren und Daten-Augmentierung elektrische Validität sowie hohe Neuheit sicherstellt und dabei die Leistungsfähigkeit bestehender Methoden übertrifft.

Seungmin Kim, Mingun Kim, Yuna Lee, Yulhwa Kim2026-03-11💻 cs

Artificial Intelligence (AI) Maturity in Small and Medium-Sized Enterprises: A Framework of Internalized and Ecosystem-Embedded Capabilities

Diese Studie entwickelt ein kontextspezifisches Reifegradmodell für den Einsatz künstlicher Intelligenz in kleinen und mittleren Unternehmen (KMU), das die linearen, unternehmenszentrierten Ansätze durch ein multidimensionales, nicht-lineares und ökosystemvernetztes Rahmenwerk mit acht Fähigkeitsdimensionen, fünf Reifegradstufen und vier Entwicklungspfaden ersetzt, um den spezifischen Realitäten von KMU wie Ressourcenbeschränkungen und externer Abhängigkeit gerecht zu werden.

Sukanlaya Sawang, Virach Sornlertlamvanich2026-03-11💻 cs

Self-hosted Lecture-to-Quiz: Local LLM MCQ Generation with Deterministic Quality Control

Diese Arbeit stellt eine vollständig lokal gehostete Pipeline vor, die Vorlesungsinhalte ohne externe APIs in Multiple-Choice-Fragen umwandelt und dabei durch deterministische Qualitätskontrollen Datenschutz, Nachvollziehbarkeit und ökologische Nachhaltigkeit im Bildungsbereich sicherstellt.

Seine A. Shintani2026-03-11💻 cs

← Zurück Weiter →

cs