HybridStitch: Pixel and Timestep Level Model Stitching for Diffusion Acceleration

Die Arbeit stellt HybridStitch vor, ein neues Paradigma für die Text-zu-Bild-Generierung, das durch eine hybride Verarbeitungsebene, welche große und kleine Diffusionsmodelle kombiniert, um komplexe Bildbereiche mit dem großen Modell zu verfeinern und einfache Bereiche mit dem kleinen Modell zu rendern, eine 1,83-fache Beschleunigung bei Stable Diffusion 3 erreicht.

Desen Sun, Jason Hon, Jintao Zhang, Sihang Liu2026-03-10💻 cs

Gradient Iterated Temporal-Difference Learning

Die vorgestellte Arbeit stellt Gradient Iterated Temporal-Difference Learning vor, eine stabile Variante des iterierten TD-Lernens, die durch die Berechnung von Gradienten über bewegte Ziele eine mit semi-gradienten Methoden konkurrierende Lerngeschwindigkeit erreicht und dabei erstmals Gradient-TD-Methoden erfolgreich auf Atari-Spielen demonstriert.

Théo Vincent, Kevin Gerhardt, Yogesh Tripathi, Habib Maraqten, Adam White, Martha White, Jan Peters, Carlo D'Eramo2026-03-10🤖 cs.LG

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

Der Artikel argumentiert, dass der Missbrauch von KI im Bildungswesen weniger ein Detektions- als vielmehr ein Messproblem darstellt, und schlägt das „Learning Visibility Framework" vor, das durch transparente Prozessnachweise und klare Regeln für den KI-Einsatz anstelle von Überwachungstools ethische Integrität und Vertrauen zwischen Lehrenden und Lernenden wiederherstellt.

Eduardo Davalos, Yike Zhang2026-03-10💻 cs

AI Steerability 360: A Toolkit for Steering Large Language Models

Das Paper stellt „AI Steerability 360" vor, eine erweiterbare, quelloffene Python-Bibliothek von IBM, die ein einheitliches Interface für die Steuerung von Large Language Models über vier Kontrollflächen (Eingabe, Struktur, Zustand und Ausgabe) sowie Werkzeuge zur einfachen Entwicklung, Komposition und umfassenden Evaluierung von Steuerungsstrategien bietet.

Erik Miehling, Karthikeyan Natesan Ramamurthy, Praveen Venkateswaran, Irene Ko, Pierre Dognin, Moninder Singh, Tejaswini Pedapati, Avinash Balakrishnan, Matthew Riemer, Dennis Wei, Inge Vejsbjerg, Elizabeth M. Daly, Kush R. Varshney2026-03-10💬 cs.CL

SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans

Die Arbeit stellt SynPlanResearch-R1 vor, ein Framework, das durch synthetisierte Tool-Nutzungspfade die Exploration von Forschungsagenten während des kalten Start-Trainings verbessert und so die Leistung auf mehreren Benchmarks im Vergleich zu bestehenden Methoden signifikant steigert.

Hansi Zeng, Zoey Li, Yifan Gao, Chenwei Zhang, Xiaoman Pan, Tao Yang, Fengran Mo, Jiacheng Lin, Xian Li, Jingbo Shang2026-03-10💬 cs.CL

Hospitality-VQA: Decision-Oriented Informativeness Evaluation for Vision-Language Models

Die Arbeit stellt mit Hospitality-VQA ein neues Benchmark-Dataset und einen Rahmen für die Bewertung der Entscheidungsrelevanz von Vision-Language-Modellen im Hospitality-Bereich vor und zeigt, dass eine gezielte Domänen-Feinabstimmung notwendig ist, um diese Modelle für die zuverlässige Extraktion nutzerrelevanter Informationen aus Hotelbildern zu befähigen.

Jeongwoo Lee, Baek Duhyeong, Eungyeol Han, Soyeon Shin, Gukin han, Seungduk Kim, Jaehyun Jeon, Taewoo Jeong2026-03-10🤖 cs.LG

CCR-Bench: A Comprehensive Benchmark for Evaluating LLMs on Complex Constraints, Control Flows, and Real-World Cases

Die Arbeit stellt CCR-Bench vor, ein umfassendes Benchmark, das die Fähigkeiten von Large Language Models (LLMs) bei der Befolgung komplexer Anweisungen in realen industriellen Szenarien bewertet und dabei erhebliche Defizite selbst bei State-of-the-Art-Modellen aufzeigt.

Xiaona Xue, Yiqiao Huang, Jiacheng Li, Yuanhang Zheng, Huiqi Miao, Yunfei Ma, Rui Liu, Xinbao Sun, Minglu Liu, Fanyu Meng, Chao Deng, Junlan Feng2026-03-10💬 cs.CL

Reject, Resample, Repeat: Understanding Parallel Reasoning in Language Model Inference

Diese Arbeit untersucht paralleles Schließen in Sprachmodellen durch die Anwendung von Partikelfilter-Algorithmen wie Sequential Monte Carlo, um theoretische Garantien und fundamentale Grenzen für den Trade-off zwischen Genauigkeit und Kosten bei der Stichprobenziehung zu identifizieren.

Noah Golowich, Fan Chen, Dhruv Rohatgi, Raghav Singhal, Carles Domingo-Enrich, Dylan J. Foster, Akshay Krishnamurthy2026-03-10🤖 cs.LG

Designing probabilistic AI monsoon forecasts to inform agricultural decision-making

Diese Studie stellt ein entscheidungstheoretisches Framework vor, das KI-Wettervorhersagen mit einem statistischen Modell für sich wandelnde Bauernerwartungen kombiniert, um personalisierte, probabilistische Monsunprognosen zu erstellen, die 2025 erfolgreich 38 Millionen indischen Landwirten halfen, ihre Anbauentscheidungen zu optimieren.

Colin Aitken, Rajat Masiwal, Adam Marchakitus, Katherine Kowal, Mayank Gupta, Tyler Yang, Amir Jina, Pedram Hassanzadeh, William R. Boos, Michael Kremer2026-03-10🤖 cs.LG

EveryQuery: Zero-Shot Clinical Prediction via Task-Conditioned Pretraining over Electronic Health Records

Die Studie stellt EveryQuery vor, ein auf elektronischen Gesundheitsakten vortrainiertes Modell, das durch task-konditioniertes Pretraining klinische Vorhersagen in Null-Shot-Szenarien effizienter und genauer als autoregressive Baseline-Modelle trifft, indem es Patientenhistorie und strukturierte Abfragen direkt in eine Wahrscheinlichkeitsvorhersage umwandelt.

Payal Chandak, Gregory Kondas, Isaac Kohane, Matthew McDermott2026-03-10💻 cs