Mitigating Long-Tail Bias in HOI Detection via Adaptive Diversity Cache

Deze paper introduceert de Adaptive Diversity Cache (ADC), een trainingsvrije en plug-and-play module die de langstaartbias in mens-objectinteractie-detectie vermindert door tijdens de inferentie adaptieve, diverse kenmerken op te slaan, waardoor zeldzame interacties op de HICO-DET en V-COCO-datasets aanzienlijk worden verbeterd zonder extra rekencapaciteit.

Yuqiu Jiang, Xiaozhen Qiao, Yifan Chen, Ye Zheng, Zhe Sun, Xuelong LiWed, 11 Ma🤖 cs.AI

AVGGT: Rethinking Global Attention for Accelerating VGGT

Dit paper introduceert AVGGT, een trainingsvrije tweestapsversnelling die de globale aandacht in VGGT en π3\pi^3 analyseert en optimaliseert door vroege lagen om te zetten in frame-aandacht en latere lagen te subsamplen, wat leidt tot een aanzienlijke versnelling van de inferentie (tot 10x) zonder in te leveren op nauwkeurigheid.

Xianbing Sun, Zhikai Zhu, Zhengyu Lou, Bo Yang, Jinyang Tang, Liqing Zhang, He Wang, Jianfu ZhangWed, 11 Ma💻 cs

LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

Dit paper introduceert LiM-YOLO, een gestroomlijnde objectdetector die de prestaties van scheepsdetectie in optische satellietbeelden verbetert door een verschuiving van de piramide-niveaus (van P3-P5 naar P2-P4) en het gebruik van genormaliseerde hulpvertakkingen, waardoor een betere balans tussen nauwkeurigheid en efficiëntie wordt bereikt.

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin KimWed, 11 Ma⚡ eess

ADHint: Adaptive Hints with Difficulty Priors for Reinforcement Learning

ADHint is een nieuwe methode voor versterkingsleren die de beperkte schaalbaarheid en lage sample-efficiëntie aanpakt door moeilijkheidsgraden expliciet te integreren in het plannen van hints en de schatting van voordelen, waardoor een betere balans tussen exploratie en imitatie wordt bereikt en superieure redeneervermogens worden gerealiseerd.

Feng Zhang, Zezhong Tan, Xinhong Ma, Ziqiang Dong, Xi Leng, Jianfei Zhao, Xin Sun, Yang YangWed, 11 Ma🤖 cs.LG

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

Deze paper introduceert D²-Align, een nieuw raamwerk dat 'Preference Mode Collapse' in diffusion modellen voor menselijke voorkeursuitlijning aanpakt door de beloningssignalen directioneel te decoupleren, waardoor zowel de kwaliteit als de diversiteit van de gegenereerde afbeeldingen wordt verbeterd.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu LiWed, 11 Ma💻 cs

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

Het paper introduceert CLEAR-Mamba, een geoptimaliseerd raamwerk dat hypernetwerk-gebaseerde adaptieve conditionering en betrouwbaarheidsbewuste voorspelling combineert om de nauwkeurigheid, generalisatie en betrouwbaarheid van de classificatie van oogangiografie-beelden (FFA en ICGA) te verbeteren.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin OoiWed, 11 Ma🤖 cs.AI

Pathwise Test-Time Correction for Autoregressive Long Video Generation

Dit paper introduceert Test-Time Correction (TTC), een trainingsvrije methode die autoregressieve lange video-generatie verbetert door het gebruik van het eerste frame als stabiel anker om drift te corrigeren, waardoor hoge kwaliteit op lange duur wordt bereikt zonder de kosten van training.

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao GuoWed, 11 Ma💻 cs

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

Deze paper introduceert een energiebewust spike-budgeteringskader voor continue learning in spiking neural networks dat, door ervaringen te herhalen en neuronparameters aan te passen, zowel de nauwkeurigheid verbetert als het energieverbruik verlaagt voor zowel frame-gebaseerde als event-gebaseerde neuromorfe visiesystemen.

Anika Tabassum Meem, Muntasir Hossain Nadid, Md Zesun Ahmed MiaWed, 11 Ma🤖 cs.AI