Multispectral airborne laser scanning for tree species classification: a benchmark of machine learning and deep learning algorithms

Diese Studie präsentiert einen Benchmark von maschinellen Lern- und Deep-Learning-Algorithmen zur Klassifizierung von Baumarten mittels hochauflösender multispektraler ALS-Daten und zeigt, dass ein Point-Transformer-Modell auf der Grundlage von 5000 Trainingssegmenten mit einer Gesamtgenauigkeit von 92,0 % die besten Ergebnisse erzielt.

Josef Taher, Eric Hyyppä, Matti Hyyppä + 46 more2026-02-18💻 cs

Multimodal Integrated Knowledge Transfer to Large Language Models through Preference Optimization with Biomedical Applications

Das Paper stellt MINT vor, ein Framework, das durch Präferenzoptimierung spezialisiertes multimodales biomedizinisches Wissen von einem Upstream-Modell auf downstreame unimodale Large Language Models überträgt, um deren Leistung bei Aufgaben wie der Vorhersage seltener genetischer Krankheiten und der Klassifizierung von Gewebetypen signifikant zu verbessern.

Zhanliang Wang, Da Wu, Quan Nguyen + 2 more2026-02-18🧬 q-bio

APCoTTA: Continual Test-Time Adaptation for Semantic Segmentation of Airborne LiDAR Point Clouds

Die Arbeit stellt APCoTTA vor, ein neuartiges Framework für die kontinuierliche Testzeit-Adaptierung zur semantischen Segmentierung von airborne LiDAR-Punktwolken, das durch gezielte Schichtauswahl, Entropie-basierte Konsistenzregularisierung und Parameter-Interpolation die Leistungsfähigkeit unter Domänenverschiebungen verbessert und gleichzeitig katastrophales Vergessen verhindert, wobei zwei neue Benchmarks zur Evaluierung bereitgestellt werden.

Yuan Gao, Shaobo Xia, Sheng Nie + 3 more2026-02-18💻 cs

DreamAnywhere: Object-Centric Panoramic 3D Scene Generation

Das Paper stellt DreamAnywhere vor, ein modulares System zur schnellen Generierung und Prototypisierung von 360°-Panorama-3D-Szenen aus Text, das durch die Trennung von Hintergrund und Objekten sowie deren Umwandlung in detaillierte 3D-Modelle eine überlegene Kohärenz bei neuen Ansichten und eine intuitive Bearbeitung für Anwendungen wie Low-Budget-Filmproduktionen ermöglicht.

Edoardo Alberto Dominici, Jozef Hladky, Floor Verhoeven + 9 more2026-02-18💻 cs

Towards Geometric and Textural Consistency 3D Scene Generation via Single Image-guided Model Generation and Layout Optimization

Die vorgeschlagene dreistufige Methode ermöglicht die Generierung geometrisch und texturkonsistenter 3D-Szenen aus einem einzelnen RGB-Bild, indem sie durch Inpainting verdeckte Objekte vervollständigt, über Pseudo-Stereo-Ansichten die räumliche Geometrie erfasst und durch Layout-Optimierung eine präzise Ausrichtung der 3D-Assets mit dem Eingabebild sicherstellt.

Xiang Tang, Ruotong Li, Xiaopeng Fan2026-02-18💻 cs

Long Grounded Thoughts: Synthesizing Visual Problems and Reasoning Chains at Scale

Die Arbeit stellt ein Framework zur Synthese von über einer Million visuell zentrierter Probleme vor, das durch eine zweistufige Generierung komplexer Aufgaben und das Training von Qwen2.5-VL-7B nicht nur bestehende Open-Source-Modelle übertrifft, sondern auch signifikante Verbesserungen bei rein textbasierten, auditiven und embodied-Aufgaben sowie neue Erkenntnisse für den gesamten VLM-Post-Training-Prozess liefert.

David Acuna, Chao-Han Huck Yang, Yuntian Deng + 6 more2026-02-18💬 cs.CL