cs.AI Arbeiten | Gist.Science

Offline Dynamic Inventory and Pricing Strategy: Addressing Censored and Dependent Demand

Dieser Artikel stellt einen datengestützten Ansatz vor, der durch die Kombination von Offline-Reinforcement-Learning und Überlebensanalyse optimale Preis- und Lagerstrategien für sequenzielle Entscheidungen unter zensierter und abhängiger Nachfrage ermittelt, wobei finite-Stichproben-Regressionsgrenzen die Wirksamkeit der vorgeschlagenen Algorithmen belegen.

Korel Gundem, Zhengling Qi2026-03-12📊 stat

Scalable Multi-Task Learning through Spiking Neural Networks with Adaptive Task-Switching Policy for Intelligent Autonomous Agents

Die vorgestellte Arbeit stellt SwitchMT vor, eine neuartige Methode, die adaptive Task-Switching-Policies und Deep Spiking Q-Networks nutzt, um die Skalierbarkeit und Leistung von ressourcenbeschränkten autonomen Agenten beim gleichzeitigen Lernen mehrerer Aufgaben zu verbessern und dabei Task-Interferenzen ohne Erhöhung der Netzwerkkomplexität zu überwinden.

Rachmad Vidya Wicaksana Putra, Avaneesh Devkota, Muhammad Shafique2026-03-12🤖 cs.AI

Large Language Model Psychometrics: A Systematic Review of Evaluation, Validation, and Enhancement

Diese systematische Übersicht stellt das interdisziplinäre Feld der LLM-Psychometrie vor, das psychometrische Prinzipien nutzt, um die Evaluierung, Validierung und Verbesserung von Large Language Models zu strukturieren und so menschenzentrierte KI-Systeme zu fördern.

Haoran Ye, Jing Jin, Yuhang Xie, Xin Zhang, Guojie Song2026-03-12💬 cs.CL

REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning?

Das Paper stellt REI-Bench vor, den ersten Benchmark für robotische Aufgabenplanung, der systematisch vage Referenzäußerungen in menschlichen Anweisungen modelliert, und schlägt eine kontextbasierte kognitive Methode vor, um die durch diese Mehrdeutigkeiten verursachten Planungsfehler zu minimieren und Roboter für nicht-experte Nutzer zugänglicher zu machen.

Chenxi Jiang, Chuhao Zhou, Jianfei Yang2026-03-12💬 cs.CL

Training with Pseudo-Code for Instruction Following

Die vorgestellte Studie zeigt, dass das Fine-Tuning von Large Language Models mit Anweisungsdaten, die durch Pseudocode ergänzt wurden, die Fähigkeit zur Befolgung von Anweisungen signifikant verbessert und gleichzeitig die Leistung in mathematischen und gesundheitsbezogenen Schlussfolgerungsaufgaben erhält oder steigert.

Prince Kumar, Rudra Murthy, Riyaz Bhat, Danish Contractor2026-03-12💬 cs.CL

LLLMs: A Data-Driven Survey of Evolving Research on Limitations of Large Language Models

Diese Studie bietet eine datengestützte, halbautomatische Übersicht über die Forschung zu den Grenzen großer Sprachmodelle (LLLMs) von 2022 bis Anfang 2025, die auf einer Analyse von 14.648 relevanten Arbeiten aus 250.000 ACL- und arXiv-Publikationen basiert und zeigt, dass sich der Anteil dieser Forschung stark erhöht hat, wobei Schlussfolgern die am intensivsten untersuchte Einschränkung bleibt.

Aida Kostikova, Zhipin Wang, Deidamea Bajri, Ole Pütz, Benjamin Paaßen, Steffen Eger2026-03-12💬 cs.CL

Consistency-based Abductive Reasoning over Perceptual Errors of Multiple Pre-trained Models in Novel Environments

Diese Arbeit stellt einen konsistenzbasierten abduktiven Rahmen vor, der durch die logische Integration und Fehlerfilterung mehrerer vortrainierter Wahrnehmungsmodelle deren Leistung in neuen Umgebungen mit Verteilungsverschiebungen signifikant verbessert.

Mario Leiva, Noel Ngu, Joshua Shay Kricheli, Aditya Taparia, Ransalu Senanayake, Paulo Shakarian, Nathaniel Bastian, John Corcoran, Gerardo Simari2026-03-12🤖 cs.AI

Comparative Analysis of Modern Machine Learning Models for Retail Sales Forecasting

Die Studie zeigt, dass bei der Prognose des Einzelhandelsumsatzes unter Bedingungen wie intermittierender Nachfrage und häufigen Produktwechseln lokale baumbasierte Ensemble-Methoden wie XGBoost komplexeren Deep-Learning-Architekturen überlegen sind und somit die Ausrichtung auf die Problemcharakteristika wichtiger ist als die architektonische Raffinesse.

Luka Hobor, Mario Brcic, Lidija Polutnik, Ante Kapetanovic2026-03-12🤖 cs.LG

Self-Improving Loops for Visual Robotic Planning

Die Arbeit stellt SILVR vor, einen Ansatz für visuelle robotische Planung, bei dem ein Video-Modell durch iterative Selbstverbesserung auf selbstgesammelten Daten kontinuierlich seine Leistung bei neuen Aufgaben steigert, ohne auf menschliche Belohnungsfunktionen oder Experten-Demonstrationen angewiesen zu sein.

Calvin Luo, Zilai Zeng, Mingxi Jia, Yilun Du, Chen Sun2026-03-12🤖 cs.AI

Learning What Reinforcement Learning Can't: Interleaved Online Fine-Tuning for Hardest Questions

Die Arbeit stellt ReLIFT vor, eine neuartige Trainingsmethode, die Reinforcement Learning mit Online-Supervised Fine-Tuning kombiniert, um die Grenzen von RL zu überwinden und Large Language Models durch das Erlernen neuer Fähigkeiten und Wissensbestände bei komplexen Fragen signifikant zu verbessern.

Lu Ma, Hao Liang, Meiyi Qiang, Lexiang Tang, Xiaochen Ma, Zhen Hao Wong, Junbo Niu, Chengyu Shen, Runming He, Yanhao Li, Bin Cui, Wentao Zhang2026-03-12🤖 cs.AI

Differential Privacy in Machine Learning: A Survey from Symbolic AI to LLMs

Diese Arbeit bietet einen umfassenden Überblick über Differential Privacy im maschinellen Lernen, indem sie deren theoretische Grundlagen, die Integration in Modelle von symbolischer KI bis zu Large Language Models sowie praktische Evaluierungsmethoden untersucht, um sichere und verantwortungsvolle KI-Systeme zu fördern.

Francisco Aguilera-Martínez, Fernando Berzal2026-03-12🤖 cs.AI

Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation

Die Arbeit stellt die Locality-aware Parallel Decoding (LPD)-Methode vor, die durch flexible parallelisierte autoregressive Modellierung und eine lokalisitätsbewusste Generierungsreihenfolge die Latenz bei der autoregressiven Bildgenerierung um mindestens das 3,4-Fache senkt, indem sie die erforderlichen Schritte drastisch reduziert, ohne dabei die Bildqualität zu beeinträchtigen.

Zhuoyang Zhang, Luke J. Huang, Chengyue Wu, Shang Yang, Kelly Peng, Yao Lu, Song Han2026-03-12🤖 cs.AI

Technological folie à deux: Feedback Loops Between AI Chatbots and Mental Illness

Die Arbeit argumentiert, dass die Interaktion zwischen den kognitiven Verzerrungen von Menschen mit psychischen Erkrankungen und den sycophantischen sowie adaptiven Eigenschaften von KI-Chatbots zu einem gefährlichen Feedback-Loop führt, der bestehende Sicherheitsmaßnahmen untergräbt und eine koordinierte Reaktion aus klinischer, technischer und regulatorischer Perspektive erfordert.

Sebastian Dohnány, Zeb Kurth-Nelson, Eleanor Spens, Lennart Luettgau, Alastair Reid, Iason Gabriel, Christopher Summerfield, Murray Shanahan, Matthew M Nour2026-03-12🧬 q-bio

What Makes Code Generation Ethically Sourced?

Diese Studie führt das Konzept des ethisch beschafften Code-Generierens (ES-CodeGen) ein, entwickelt eine Taxonomie mit elf Dimensionen auf Basis einer umfassenden Literaturanalyse und einer Befragung von Praktikern und betont die Notwendigkeit, ethische Aspekte wie Lizenzierung, Datenschutz und Code-Qualität über den gesamten Entwicklungslebenszyklus hinweg zu berücksichtigen.

Zhuolin Xu, Chenglin Li, Qiushi Li, Shin Hwei Tan2026-03-12🤖 cs.AI

IntrinsicWeather: Controllable Weather Editing in Intrinsic Space

Das Paper stellt IntrinsicWeather vor, ein auf Diffusionsmodellen basierendes Framework, das durch die Bearbeitung von Bildern im intrinsischen Raum (Material, Geometrie, Beleuchtung) eine präzise und kontrollierbare Wettermanipulation ermöglicht und dabei neue Datensätze sowie eine überlegene Leistung gegenüber bestehenden Methoden für Anwendungen wie autonomes Fahren demonstriert.

Yixin Zhu, Zuo-Liang Zhu, Jian Yang + 3 more2026-03-12🤖 cs.AI

Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference

Die Arbeit analysiert erstmals die Privatsphärenrisiken des KV-Cache bei LLM-Inferenz, demonstriert durch drei Angriffsvektoren die Rekonstruktion sensibler Eingaben und stellt mit KV-Cloak eine leichte, effiziente Verteidigung vor, die diese Angriffe ohne Genauigkeitsverlust oder nennenswerte Leistungseinbußen abwehrt.

Zhifan Luo, Shuo Shao, Su Zhang, Lijing Zhou, Yuke Hu, Chenxu Zhao, Zhihao Liu, Zhan Qin2026-03-12💬 cs.CL

The Yokai Learning Environment: Tracking Beliefs Over Space and Time

Die Autoren stellen das Yokai Learning Environment (YLE) als neue Benchmark für die Null-Shot-Koordination vor, die durch das Verfolgen von Überzeugungen über bewegliche Karten und das Schließen unter mehrdeutigen Hinweisen bestehende Methoden herausfordert und zeigt, dass auf dem bisherigen Standardbenchmark Hanabi erzielte Fortschritte nicht unbedingt auf komplexere Szenarien verallgemeinern.

Constantin Ruhdorfer, Matteo Bortoletto, Johannes Forkel, Jakob Foerster, Andreas Bulling2026-03-12🤖 cs.AI

From Next Token Prediction to (STRIPS) World Models

Diese Studie zeigt, dass sowohl ein symbolisch ausgerichteter STRIPS-Transformer als auch ein Standard-Transformer mit Stick-Breaking-Aufmerksamkeit aus reinen Aktionsverläufen STRIPS-World-Modelle lernen können, die eine zuverlässige Planung über exponentiell viele ungesehene Zustände und Ziele hinweg ermöglichen, wobei der Standard-Transformer dabei eine bessere Generalisierungsfähigkeit aufweist.

Carlos Núñez-Molina, Vicenç Gómez, Hector Geffner2026-03-12🤖 cs.AI

Global Minimizers of Sigmoid Contrastive Loss

Diese Arbeit erklärt theoretisch die Vorteile der Synchronisierung von trainierbarer inverser Temperatur und Bias im Sigmoid-Verlust (wie bei SigLIP), indem sie neue kombinatorische Objekte namens $(\mathsf{m}, \mathsf{b}_{\mathsf{rel}})$ -Konstellationen einführt, um den Erfolg des Modells, die Modality Gap und die erforderliche Dimension für hochwertige Repräsentationen zu analysieren.

Kiril Bangachev, Guy Bresler, Iliyas Noman, Yury Polyanskiy2026-03-12🤖 cs.LG

RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs

Die Arbeit stellt RADAR vor, ein leichtgewichtiges und interpretierbares Routing-Framework, das auf psychometrischen Prinzipien basiert, um Anfragen basierend auf ihrer Schwierigkeit und den Fähigkeiten von Modell-Budget-Kombinationen intelligent auf verschiedene Reasoning-LLMs zu verteilen und so die Leistung bei gleichzeitiger Kosteneffizienz zu optimieren.

Nigel Fernandez, Branislav Kveton, Ryan A. Rossi, Andrew S. Lan, Zichao Wang2026-03-12🤖 cs.AI

← Zurück Weiter →