eess.IV Arbeiten | Gist.Science

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

Der Artikel stellt ECLARE vor, eine effiziente selbstüberwachte Methode zur anisotropen Auflösungssteigerung von 2D-MRT-Schichtbildern, die durch die Schätzung des Schichtprofils und das Lernen innerhalb derselben Volumina Interpolationsfehler, Domänenverschiebungen und Lücken zwischen den Schichten überwindet und dabei alle aktuellen Methoden in der Signalwiederherstellung sowie bei nachgelagerten Aufgaben übertrifft.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs

Evaluating quality metrics through the lenses of psychophysical measurements of low-level vision

Diese Arbeit stellt einen neuen Testrahmen vor, der anhand psychophysischer Messungen der niederen visuellen Wahrnehmung (wie Kontrastsensitivität und -maskierung) die Leistungsfähigkeit von 34 etablierten Bild- und Videoqualitätsmetriken bewertet und dabei deren spezifische Stärken sowie systematische Schwächen im Vergleich zu menschlichen Sehprinzipien aufdeckt.

Dounia Hammou, Yancheng Cai, Pavan Madhusudanarao, Christos G. Bampis, Rafał K. MantiukMon, 09 Ma💻 cs

Multivariate Fields of Experts for Convergent Image Reconstruction

Die Arbeit stellt ein neues Framework namens „multivariate Fields of Experts" vor, das durch die Verwendung von Multivariaten-Potenzialfunktionen auf Basis von Moreau-Umhüllungen der $\ell_\infty$ -Norm bei inversen Bildproblemen wie Entrauschen und Rekonstruktion eine höhere Effizienz und Interpretierbarkeit als univariate Modelle bietet und dabei die Leistung tiefer neuronaler Netze bei deutlich geringerem Ressourcenbedarf erreicht.

Stanislas Ducotterd, Michael UnserMon, 09 Ma🤖 cs.LG

SAAIPAA: Optimizing aspect-angles-invariant physical adversarial attacks on SAR target recognition models

Die Studie stellt SAAIPAA vor, ein physikbasiertes Framework für physische adversarial Attacks auf SAR-Zielerkennungsmodelle, das durch die Optimierung von Reflektoren auch bei unbekannter Blickrichtung des SAR-Systems eine hohe Täuschungsrate erzielt.

Isar Lemeire, Yee Wei Law, Sang-Heon Lee, William Meakin, Tat-Jun ChinMon, 09 Ma⚡ eess

Learning Latent Transmission and Glare Maps for Lens Veiling Glare Removal

Die Autoren stellen VeilGen und DeVeiler vor, ein System, das mittels eines generativen Modells und latenter Transmission- sowie Blendkarten realistische Linsenblendung simuliert und darauf aufbauend eine physikalisch fundierte Restaurierung für vereinfachte optische Systeme ermöglicht.

Xiaolong Qian, Qi Jiang, Lei Sun, Zongxi Yu, Kailun Yang, Peixuan Wu, Jiacheng Zhou, Yao Gao, Yaoguang Ma, Ming-Hsuan Yang, Kaiwei WangMon, 09 Ma🔬 physics.optics

In-batch Relational Features Enhance Precision in An Unsupervised Medical Anomaly Detection Task

Die vorgestellte Methode verbessert die unüberwachte Erkennung medizinischer Anomalien in MRT-Bildern, indem sie durch Batch-basierte Hypergraph-Schätzung und Graph-Convolution-Netze kontextuelle Ähnlichkeiten innerhalb einer gesunden Kohorte in die latente Repräsentation integriert, was zu einer signifikanten Reduktion von falsch-positiven Ergebnissen und einer Steigerung der Genauigkeit führt.

P. Bilha Githinji, Xi Yuan, Ijaz Gul, Lian Zhang, Jinhao Xu, Zhenglin Chen, Peiwu Qin, Dongmei YuMon, 09 Ma🧬 q-bio

Clinical-Injection Transformer with Domain-Adapted MAE for Lupus Nephritis Prognosis Prediction

Die Studie stellt einen neuartigen multimodalen Deep-Learning-Ansatz vor, der klinische Daten mit routinemäßigen PAS-gefärbten Nierenbiopsien kombiniert, um die Prognose der Lupus-Nephritis bei pädiatrischen Patienten mit hoher Genauigkeit vorherzusagen.

Yuewen Huang, Zhitao Ye, Guangnan Feng, Fudan Zheng, Xia Gao, Yutong LuMon, 09 Ma🤖 cs.LG

Edges Are All You Need: Robust Gait Recognition via Label-Free Structure

Die Arbeit stellt SKETCHGAIT vor, ein robustes Gait-Recognition-Framework, das eine neue, label-freie visuelle Modalität namens SKETCH nutzt, um durch die Extraktion hochfrequenter Strukturränder aus RGB-Bildern die Limitationen herkömmlicher Silhouetten- und Parsing-Ansätze zu überwinden und durch eine hierarchisch entkoppelte Multi-Modal-Architektur mit komplementären Datenströmen state-of-the-art Ergebnisse zu erzielen.

Chao Zhang, Zhuang Zheng, Ruixin Li, Zhanyong MeiMon, 09 Ma💻 cs

Privacy-Preserving Collaborative Medical Image Segmentation Using Latent Transform Networks

Die Arbeit stellt ein privatsphäreschonendes Framework (PPCMI-SF) für die kollaborative medizinische Bildsegmentierung vor, das durch verschlüsselte latente Transformationen und serverseitige Übersetzung eine hohe Segmentierungsgenauigkeit über mehrere Institutionen hinweg ermöglicht, ohne dass sensible Rohdaten geteilt werden müssen.

Saheed Ademola Bello, Muhammad Shahid Jabbar, Muhammad Sohail Ibrahim, Shujaat KhanMon, 09 Ma💻 cs

Gabor Primitives for Accelerated Cardiac Cine MRI Reconstruction

Die vorgestellte Arbeit schlägt Gabor-Primitiven vor, die durch Modulation von Gaußschen Hüllkurven mit komplexen Exponentialfunktionen eine effiziente und physikalisch interpretierbare Rekonstruktion von beschleunigter kardialer Cine-MRT aus stark unterabgetasteten Daten ermöglichen und dabei sowohl glatte Strukturen als auch scharfe Kanten besser darstellen als bestehende Methoden.

Wenqi Huang, Veronika Spieker, Nil Stolt-Ansó, Natascha Niessen, Maik Dannecker, Sevgi Gokce Kafali, Sila Kurugol, Julia A. Schnabel, Daniel RueckertMon, 09 Ma💻 cs

Longitudinal Lesion Inpainting in Brain MRI via 3D Region Aware Diffusion

Die Studie stellt ein neuartiges, auf Denoising Diffusion Probabilistic Models basierendes Framework vor, das durch die Erweiterung von Region-Aware Diffusion und die Nutzung longitudinaler Kontextinformationen effizient und präzise Läsionen in 3D-MRT-Aufnahmen des Gehirns rekonstruiert, wodurch die Bildqualität verbessert und die Verarbeitungszeit im Vergleich zu bestehenden Methoden um das Zehnfache reduziert wird.

Zahra Karimaghaloo, Dumitru Fetco, Haz-Edine Assemlal, Hassan Rivaz, Douglas L. ArnoldMon, 09 Ma🤖 cs.AI

Interpretable Motion Artificat Detection in structural Brain MRI

Diese Arbeit stellt einen leichten und interpretierbaren Rahmen vor, der durch die Erweiterung des diskriminativen Histogramms von Gradientenmagnituden (DHoGM) auf drei Dimensionen und die Kombination von 2D- und 3D-Features eine robuste und generalisierbare Erkennung von Bewegungsartefakten in strukturellen T1-gewichteten Gehirn-MRTs ermöglicht.

Naveetha Nithianandam, Prabhjot Kaur, Anil Kumar SaoMon, 09 Ma💻 cs

Uni-LVC: A Unified Method for Intra- and Inter-Mode Learned Video Compression

Die Arbeit stellt Uni-LVC vor, eine einheitliche Methode für gelerntes Videocompression, die Intra- und Inter-Coding in einem einzigen Modell vereint und durch einen Zuverlässigkeits-basierten Mechanismus sowie Cross-Attention-Adaption eine überlegene Rate-Distortion-Leistung bei unzuverlässigen Referenzrahmen gewährleistet.

Yichi Zhang, Ruoyu Yang, Fengqing ZhuMon, 09 Ma💻 cs

Architectural Unification for Polarimetric Imaging Across Multiple Degradations

Die Arbeit stellt ein einheitliches Architektur-Framework für die polarimetrische Bildgebung vor, das durch eine einzelne Verarbeitungsstufe und die gleichzeitige Bild- und Stokes-Domänen-Bearbeitung physikalische Konsistenz gewährleistet und damit bei verschiedenen Degradationen wie Rauschen, Bewegungsunschärfe und Mosaikartefakten state-of-the-art Ergebnisse erzielt.

Chu Zhou, Yufei Han, Junda Liao, Linrui Dai, Wangze Xu, Art Subpa-Asa, Heng Guo, Boxin Shi, Imari SatoMon, 09 Ma💻 cs

Technical Report: Automated Optical Inspection of Surgical Instruments

Dieser Bericht beschreibt die Entwicklung eines automatisierten optischen Inspektionssystems auf Basis von Deep-Learning-Architekturen wie YOLOv8, ResNet-152 und EfficientNet-b4, das unter Einbeziehung von Industriepartnern aus Sialkot auf einem Datensatz von 4.414 Bildern trainiert wurde, um Fertigungsfehler bei chirurgischen Instrumenten aus Pakistan zu erkennen und so die Patientensicherheit sowie die Produktionsqualität zu gewährleisten.

Zunaira Shafqat, Atif Aftab Ahmed Jilani, Qurrat Ul AinMon, 09 Ma🤖 cs.AI

Enhancing Neural Video Compression of Static Scenes with Positive-Incentive Noise

Der vorgestellte Ansatz verbessert die neuronale Videokompression für statische Szenen durch die Einbeziehung von positiv-incentiviertem Rauschen, das kurzfristige Änderungen von persistenten Hintergründen trennt, um bei gleichbleibender Pixelgenauigkeit eine signifikante Bandbreitenreduktion zu erreichen.

Cheng Yuan, Zhenyu Jia, Jiawei Shao, Xuelong LiMon, 09 Ma💻 cs

NOVA: Next-step Open-Vocabulary Autoregression for 3D Multi-Object Tracking in Autonomous Driving

Das Paper stellt NOVA vor, ein innovatives 3D-Multi-Object-Tracking-Verfahren für das autonome Fahren, das mithilfe von Large Language Models und autoregressiver Generierung offene Vokabulare nutzt, um die Identitätserhaltung über lange Sequenzen hinweg zu verbessern und dabei signifikante Fortschritte bei der Verfolgung unbekannter Objekttypen erzielt.

Kai Luo, Xu Wang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

Can we Trust Unreliable Voxels? Exploring 3D Semantic Occupancy Prediction under Label Noise

Die Arbeit stellt mit OccNL das erste Benchmark für 3D-semantische Belegungsvorhersage unter verrauschten Labels vor und schlägt DPR-Occ vor, ein robustes Framework, das durch duale partielle Label-Logik die katastrophalen Auswirkungen von Rauschen in 3D-Voxelräumen überwindet und so die Zuverlässigkeit robotischer Wahrnehmung in dynamischen Umgebungen sicherstellt.

Wenxin Li, Kunyu Peng, Di Wen, Junwei Zheng, Jiale Wei, Mengfei Duan, Yuheng Zhang, Rui Fan, Kailun YangMon, 09 Ma💻 cs

AI End-to-End Radiation Treatment Planning Under One Second

Die Studie stellt AIRT vor, ein tiefes Lernframework, das innerhalb einer Sekunde auf einer einzigen GPU direkt aus CT-Bildern und Konturen strahlentherapeutische Behandlungspläne für Prostatakrebs generiert und dabei eine Qualität aufweist, die mit dem etablierten RapidPlan Eclipse vergleichbar ist.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin ComaniciuMon, 09 Ma🤖 cs.AI

EquivAnIA: A Spectral Method for Rotation-Equivariant Anisotropic Image Analysis

Das Paper stellt EquivAnIA vor, eine neue spektrale Methode zur anisotropen Bildanalyse, die mithilfe von Cake-Wavelets und Ridge-Filtern eine robuste Rotationsäquivarianz aufweist und erfolgreich für Aufgaben wie die Winkel-Registrierung eingesetzt werden kann.

Jérémy Scanvic, Nils LaurentFri, 13 Ma⚡ eess

← Zurück Weiter →