Automated Pest Counting in Water Traps through Active Robotic Stirring for Occlusion Handling

Diese Arbeit stellt ein automatisiertes System zur Zählung von Schädlingen in Wasserfallen vor, das durch einen robotergesteuerten Rührmechanismus mit adaptiver Geschwindigkeit und optimierten Rührmustern die durch Überlappungen verursachten Zählfehler signifikant reduziert und gleichzeitig die Effizienz im Vergleich zu herkömmlichen statischen Bildanalysen steigert.

Xumin Gao, Mark Stevens, Grzegorz Cielniak2026-03-10💻 cs

Jr. AI Scientist and Its Risk Report: Autonomous Scientific Exploration from a Baseline Paper

Die Studie stellt „Jr. AI Scientist" als fortschrittliches autonomes System vor, das menschliche Forschungsabläufe nachahmt, um neue wissenschaftliche Beiträge zu generieren, und bewertet dabei sowohl dessen Leistungsfähigkeit als auch die damit verbundenen Risiken und Grenzen für die Zukunft der KI-gestützten Wissenschaft.

Atsuyuki Miyai, Mashiro Toyooka, Takashi Otonari, Zaiying Zhao, Kiyoharu Aizawa2026-03-10🤖 cs.LG

Counting Through Occlusion: Framework for Open World Amodal Counting

Die Arbeit stellt CountOCC vor, ein Framework für das amodale Zählen in offenen Umgebungen, das durch hierarchische multimodale Führung und einen visuellen Äquivalenz-Objektiv die durch Verdeckung verursachten Fehlerzustände überwindet und damit neue State-of-the-Art-Ergebnisse auf verdeckungsreichen Datensätzen erzielt.

Safaeid Hossain Arib, Rabeya Akter, Abdul Monaf Chowdhury, Md Jubair Ahmed Sourov, Md Mehedi Hasan2026-03-10💻 cs

Video2Layout: Recall and Reconstruct Metric-Grounded Cognitive Map for Spatial Reasoning

Der Artikel stellt Video2Layout vor, ein Framework, das mithilfe von kontinuierlichen Objektgrenzkoordinaten und einem zweistufigen Feinabstimmungsprozess metrisch fundierte räumliche Layouts aus Videos rekonstruiert, um die Fähigkeiten von Multimodalen Large Language Models zur räumlichen推理 im Vergleich zu diskretisierten Gitterkarten signifikant zu verbessern.

Yibin Huang, Wang Xu, Wanyue Zhang, Helu Zhi, Jingjing Huang, Yangbin Xu, Yangang Sun, Conghui Zhu, Tiejun Zhao2026-03-10💻 cs

Learning to Think Fast and Slow for Visual Language Models

Die Arbeit stellt DualMindVLM vor, ein visuelles Sprachmodell, das durch eine adaptive Dual-System-Architektur und GRPO-basiertes Training die natürliche Tendenz von Modellen zu unterschiedlich langen Antworten nutzt, um bei komplexen Aufgaben tiefgründiges Nachdenken mit effizienten, schnellen Reaktionen bei einfachen Fragen zu verbinden und dabei sowohl die Leistung als auch die Token-Effizienz zu maximieren.

Chenyu Lin, Cheng Chi, Jinlin Wu, Sharon Li, Kaiyang Zhou2026-03-10💻 cs

Radiative-Structured Neural Operator for Continuous and Extrapolative Spectral Super-Resolution

Die vorgestellte Arbeit stellt den Radiative-Structured Neural Operator (RSNO) vor, einen neuartigen Ansatz zur kontinuierlichen spektralen Super-Auflösung, der physikalische Strahlungsprinzipien und eine mehrstufige Architektur nutzt, um realistischere hyperspektrale Bilder aus multispektralen Beobachtungen zu rekonstruieren und dabei Farbverzerrungen zu minimieren.

Ziye Zhang, Bin Pan, Zhenwei Shi2026-03-10💻 cs

Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion

Die Arbeit stellt Yo'City vor, ein neuartiges agentic Framework, das mithilfe von Large Language Models eine personalisierte, hierarchisch geplante und unendlich erweiterbare Generierung realistischer 3D-Stadtlandschaften ermöglicht und dabei bestehende Methoden in allen Bewertungskriterien übertrifft.

Keyang Lu, Sifan Zhou, Hongbin Xu, Gang Xu, Zhifei Yang, Yikai Wang, Zhen Xiao, Jieyi Long, Ming Li2026-03-10💻 cs

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Die Studie stellt ForamDeepSlice vor, ein hochpräzises Deep-Learning-Framework, das auf einem Ensemble von CNN-Architekturen basiert und eine Genauigkeit von 95,64 % bei der automatisierten Klassifizierung von Foraminiferen-Arten aus 2D-Mikro-CT-Schnitten erreicht, wodurch ein neuer Benchmark für die KI-gestützte mikropaläontologische Identifizierung gesetzt wird.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG