cs.AI Arbeiten | Gist.Science

Uncovering a Winning Lottery Ticket with Continuously Relaxed Bernoulli Gates

Diese Arbeit stellt einen vollständig differentierbaren Ansatz vor, der kontinuierlich relaxierte Bernoulli-Gatter nutzt, um überparametrisierte neuronale Netze ohne Gewichts-Training effizient in extrem spärliche, leistungsfähige Subnetze gemäß der Strong Lottery Ticket-Hypothese zu überführen.

Itamar Tsayag, Ofir LindenbaumWed, 11 Ma🤖 cs.AI

Quantifying Uncertainty in AI Visibility: A Statistical Framework for Generative Search Measurement

Diese Studie zeigt, dass die Sichtbarkeit von Domänen in generativen Suchmaschinen aufgrund ihrer inhärenten Nichtdeterministik erheblichen Schwankungen unterliegt und daher anstelle von einzelnen Punktwerten statistisch fundierte Unsicherheitsschätzungen und Konfidenzintervalle erfordert, um aussagekräftige Vergleiche zu ermöglichen.

Ronald SielinskiWed, 11 Ma🤖 cs.AI

Using Vision Language Foundation Models to Generate Plant Simulation Configurations via In-Context Learning

Diese Studie stellt ein synthetisches Benchmark vor, das zeigt, wie Vision-Language-Modelle wie Gemma 3 und Qwen3-VL mithilfe von In-Context-Learning aus Drohnenbildern JSON-Konfigurationen für die Simulation von Pflanzen in landwirtschaftlichen Digital Twins generieren können, wobei zwar strukturelle Parameter erfolgreich extrahiert werden, die Modelle jedoch bei unzureichenden visuellen Hinweisen anfällig für Kontextverzerrungen sind.

Heesup Yun, Isaac Kazuo Uyehara, Earl Ranario, Lars Lundqvist, Christine H. Diepenbrock, Brian N. Bailey, J. Mason EarlesWed, 11 Ma🤖 cs.AI

Interpretable Markov-Based Spatiotemporal Risk Surfaces for Missing-Child Search Planning with Reinforcement Learning and LLM-Based Quality Assurance

Das Paper stellt „Guardian" vor, ein interpretierbares, dreischichtiges Entscheidungssystem, das mithilfe von Markov-Ketten, Reinforcement Learning und LLM-basierter Qualitätsprüfung aus unstrukturierten Daten dynamische Suchpläne für vermisste Kinder innerhalb der ersten 72 Stunden erstellt.

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

PathoScribe: Transforming Pathology Data into a Living Library with a Unified LLM-Driven Framework for Semantic Retrieval and Clinical Integration

Die Studie stellt PathoScribe vor, ein einheitliches Framework auf Basis von Retrieval-Augmented Large Language Models, das statische Pathologie-Archive in eine interaktive Wissensdatenbank verwandelt und durch Funktionen wie semantische Suche, automatische Kohortenbildung sowie klinische Fragebeantwortung die Diagnoseunterstützung und Forschungseffizienz erheblich steigert.

Abdul Rehman Akbar, Samuel Wales-McGrath, Alejadro Levya, Lina Gokhale, Rajendra Singh, Wei Chen, Anil Parwani, Muhammad Khalid Khan NiaziWed, 11 Ma🤖 cs.AI

VoxEmo: Benchmarking Speech Emotion Recognition with Speech LLMs

Die Arbeit stellt VoxEmo vor, ein umfassendes Benchmark-Toolkit für die Spracherkennung von Emotionen mit Sprach-LLMs, das durch die Einbeziehung von 35 Korpora in 15 Sprachen, standardisierte Prompt-Strategien und ein weiches Labeling-Verfahren die subjektive Natur menschlicher Emotionen besser abbildet als herkömmliche Ansätze.

Hezhao Zhang, Huang-Cheng Chou, Shrikanth Narayanan, Thomas HainWed, 11 Ma🤖 cs.AI

AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem

Dieses Paper schlägt mit AgentOS ein neues Paradigma vor, das traditionelle Betriebssysteme durch eine natürliche Sprachschnittstelle und einen Agenten-Kern ersetzt, der als Echtzeit-Engine für Intent-Mining und Wissensentdeckung fungiert, um fragmentierte Anwendungsökosysteme in eine kohärente, datengesteuerte Umgebung zu überführen.

Rui Liu, Tao Zhe, Dongjie Wang, Zijun Yao, Kunpeng Liu, Yanjie Fu, Huan Liu, Jian PeiWed, 11 Ma🤖 cs.AI

BiCLIP: Domain Canonicalization via Structured Geometric Transformation

Das Paper stellt BiCLIP vor, einen extrem einfachen und parameterarmen Rahmen, der durch eine strukturierte geometrische Transformation multimodaler Merkmale, die auf wenigen Ankerpunkten basiert, das Zero-Shot-Lernen von Vision-Language-Modellen in spezialisierten Domänen auf den Stand des Kunstzustands bringt.

Pranav Mantini, Shishir K. ShahWed, 11 Ma🤖 cs.AI

A Consensus-Driven Multi-LLM Pipeline for Missing-Person Investigations

Die Arbeit stellt Guardian vor, ein konsensgesteuertes Multi-LLM-System mit QLoRA-Feinabstimmung, das spezialisierte Modelle und einen Konsens-Engine koordiniert, um die Informationsgewinnung und Suchplanung bei Vermisstenfällen in den kritischen ersten 72 Stunden zu unterstützen.

Joshua Castillo, Ravi MukkamalaWed, 11 Ma🤖 cs.AI

Automated Tensor-Relational Decomposition for Large-Scale Sparse Tensor Computation

Die Arbeit stellt \texttt{EinSum} vor, eine tensor-relationale Erweiterung der Einstein-Summation, die große, dünnbesetzte Berechnungen durch die automatische Umformulierung in relationale Operationen für die Sparsity-Verwaltung und effiziente numerische Kerne für rechenintensive Teile optimiert.

Yuxin Tang, Zhiyuan Xin, Zhimin Ding, Xinyu Yao, Daniel Bourgeois, Tirthak Patel, Chris JermaineWed, 11 Ma🤖 cs.AI

The FABRIC Strategy for Verifying Neural Feedback Systems

Die Arbeit stellt die FABRIC-Strategie vor, die durch die Integration neuer Algorithmen für die Rückwärtsreichbarkeitsanalyse mit bestehenden Vorwärtsanalysen die Verifikation von nichtlinearen neuronalen Feedback-Systemen signifikant verbessert.

I. Samuel Akinwande, Sydney M. Katz, Mykel J. Kochenderfer, Clark BarrettWed, 11 Ma🤖 cs.AI

Semantic Level of Detail: Multi-Scale Knowledge Representation via Heat Kernel Diffusion on Hyperbolic Manifolds

Die Arbeit stellt das SLoD-Framework vor, das durch Wärmeleitungs-Diffusion auf hyperbolischen Mannigfaltigkeiten eine kontinuierliche Zoom-Funktion für Wissensgraphen ermöglicht und dabei automatisch qualitative Abstraktionsgrenzen durch spektrale Lücken identifiziert.

Edward IzgorodinWed, 11 Ma🤖 cs.AI

Arbiter: Detecting Interference in LLM Agent System Prompts

Die Arbeit stellt Arbiter vor, ein Framework zur Erkennung von Interferenzmustern in Systemprompts von LLM-Coding-Agenten, das durch formale Regeln und Multi-Modell-Analysen bei drei großen Anbietern zahlreiche Schwachstellen aufdeckt und zeigt, dass die Prompt-Architektur die Fehlerklassen, nicht aber deren Schweregrad bestimmt.

Tony MasonWed, 11 Ma🤖 cs.AI

Security Considerations for Multi-agent Systems

Diese Studie charakterisiert erstmals systematisch die einzigartigen Sicherheitsbedrohungen von Multi-Agenten-Systemen und bewertet empirisch 16 KI-Sicherheitsframeworks, wobei sie feststellt, dass keine der bestehenden Lösungen eine umfassende Abdeckung bietet und insbesondere Risiken wie Nicht-Determinismus und Datenlecks unzureichend adressiert werden.

Tam Nguyen, Moses Ndebugre, Dheeraj ArremsettyWed, 11 Ma🤖 cs.AI

Gender Fairness in Audio Deepfake Detection: Performance and Disparity Analysis

Diese Studie analysiert Geschlechterverzerrungen in Audio-Deepfake-Erkennungsmodellen und zeigt, dass herkömmliche Leistungsmetriken Diskrepanzen in der Fehlerverteilung zwischen den Geschlechtern überdecken, wodurch geschlechtergerechte Evaluierungsmetriken für die Entwicklung fairer und robusterer Systeme unerlässlich sind.

Aishwarya Fursule, Shruti Kshirsagar, Anderson R. AvilaWed, 11 Ma🤖 cs.AI

Improving through Interaction: Searching Behavioral Representation Spaces with CMA-ES-IG

Die Arbeit stellt den CMA-ES-IG-Algorithmus vor, der durch die explizite Berücksichtigung von Nutzererwartungen und die Generierung von wahrnehmbar unterschiedlichen Trajektorien das Lernen von Benutzerpräferenzen in der Mensch-Roboter-Interaktion effizienter, robuster und nutzerfreundlicher gestaltet als bestehende Methoden.

Nathaniel Dennler, Zhonghao Shi, Yiran Tao, Andreea Bobu, Stefanos Nikolaidis, Maja MataricWed, 11 Ma🤖 cs.AI

Meissa: Multi-modal Medical Agentic Intelligence

Die Arbeit stellt Meissa vor, ein leichtgewichtiges, 4B-Parameter großes multimodales medizinisches KI-Modell, das durch fortschrittliche Trajektorien-Distillation komplexe agentische Fähigkeiten offline ermöglicht und dabei proprietäre Frontiersysteme in Effizienz und Latenz übertrifft.

Yixiong Chen, Xinyi Bai, Yue Pan, Zongwei Zhou, Alan YuilleWed, 11 Ma🤖 cs.AI

AI Phenomenology for Understanding Human-AI Experiences Across Eras

Dieses Paper plädiert für die „AI-Phänomenologie" als Forschungsansatz, der durch die Erforschung der subjektiven menschlichen Erfahrung mit KI-Systemen über die Zeit hinausgeht und dabei methodische Werkzeuge sowie Designkonzepte für eine bessere bidirektionale Ausrichtung zwischen Mensch und KI bereitstellt.

Bhada Yun, Evgenia Taranova, Dana Feng, Renn Su, April Yi WangWed, 11 Ma🤖 cs.AI

MEMO: Memory-Augmented Model Context Optimization for Robust Multi-Turn Multi-Agent LLM Games

Die Arbeit stellt MEMO vor, ein selbstspielendes Framework, das durch die Kombination von persistenter Wissensspeicherung und explorativer Prompt-Optimierung die Instabilität und Leistung von mehrstufigen Multi-Agenten-LLM-Spielen signifikant verbessert.

Yunfei Xie, Kevin Wang, Bobby Cheng, Jianzhu Yao, Zhizhou Sha, Alexander Duffy, Yihan Xi, Hongyuan Mei, Cheston Tan, Chen Wei, Pramod Viswanath, Zhangyang WangWed, 11 Ma🤖 cs.AI

The Missing Memory Hierarchy: Demand Paging for LLM Context Windows

Die Arbeit stellt Pichay vor, ein Demand-Paging-System für LLM-Kontextfenster, das durch transparente Interposition und Auslagerung veralteter Inhalte die Kontextnutzung um bis zu 93 % reduziert und damit etablierte Konzepte der virtuellen Speicherverwaltung auf die Skalierung von Sprachmodellen anwendet.

Tony MasonWed, 11 Ma🤖 cs.AI

← Zurück Weiter →