UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

Dit paper introduceert UniBYD, een unificerend raamwerk dat dynamisch versterkend leren en een unificerende morfologische representatie combineert om robotmanipulatie te optimaliseren die is afgestemd op de fysieke kenmerken van diverse robothanden, waardoor de beperkingen van puur imiteren van menselijke demonstraties worden overwonnen en de prestaties aanzienlijk worden verbeterd.

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

Deze paper introduceert D²-Align, een nieuw raamwerk dat 'Preference Mode Collapse' in diffusion modellen voor menselijke voorkeursuitlijning aanpakt door de beloningssignalen directioneel te decoupleren, waardoor zowel de kwaliteit als de diversiteit van de gegenereerde afbeeldingen wordt verbeterd.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu LiWed, 11 Ma💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

Dit paper introduceert Preguss, een modulair raamwerk dat statische analyse en deductieve verificatie combineert met LLM-ondersteunde synthesese om formele specificaties te genereren en zo de verificatie van grote, real-world programma's met meer dan 1000 regels code aanzienlijk te automatiseren en de menselijke inspanning met 80,6% tot 88,9% te verminderen.

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei YinWed, 11 Ma💻 cs

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

Dit paper introduceert CovertComBench, een specifiek testplatform dat aantoont dat hoewel grote taalmodellen (LLMs) goed zijn in conceptueel inzicht en codegeneratie voor covert communicatie, ze aanzienlijke beperkingen vertonen in het uitvoeren van de complexe wiskundige afleidingen die nodig zijn voor strikte beveiligingsgaranties.

Zhaozhi Liu, Jiaxin Chen, Yuanai Xie, Yuna Jiang, Minrui Xu, Xiao Zhang, Pan Lai, Zan ZhouWed, 11 Ma💻 cs

Pathwise Test-Time Correction for Autoregressive Long Video Generation

Dit paper introduceert Test-Time Correction (TTC), een trainingsvrije methode die autoregressieve lange video-generatie verbetert door het gebruik van het eerste frame als stabiel anker om drift te corrigeren, waardoor hoge kwaliteit op lange duur wordt bereikt zonder de kosten van training.

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao GuoWed, 11 Ma💻 cs

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Dit artikel biedt een kritisch overzicht van het onderzoek naar queer NLP, waarbij het vaststelt dat de huidige literatuur vooral reageert op bestaande vooroordelen in plaats van proactief nieuwe oplossingen te bieden, en pleit voor meer inclusieve, interdisciplinaire en intersectionele toekomstige studies.

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan LongWed, 11 Ma💻 cs

DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

Dit paper introduceert DOCFORGE-BENCH, het eerste zero-shot benchmark voor documentvervalsing, en onthult dat bestaande methoden door een gebrek aan kalibratie en een extreem onevenwichtige verdeling van vervalsde pixels in plaats van door representatiefalen onbetrouwbaar zijn voor praktische toepassing.

Zengqi Zhao, Weidi Xia, En Wei, Yan Zhang, Jane Mo, Tiannan Zhang, Yuanqin Dai, Zexi Chen, Yiran Tao, Simiao RenWed, 11 Ma💻 cs

Scaling Multilingual Semantic Search in Uber Eats Delivery

Dit artikel beschrijft een geproduceerde semantische zoekoplossing voor Uber Eats die een gefinetuned Qwen2-twee-torenmodel gebruikt, getraind op honderden miljoenen geanonimiseerde interacties met InfoNCE en triplet-NCE-verlies, om zoekresultaten voor winkels, gerechten en supermarktartikelen in meerdere talen te verenigen en de recall significant te verbeteren.

Bo Ling, Zheng Liu, Haoyang Chen, Divya Nagar, Luting Yang, Mehul ParsanaWed, 11 Ma💻 cs

A Hybrid Residue Floating Numerical Architecture with Formal Error Bounds for High Throughput FPGA Computation

Dit artikel introduceert de Hybrid Residue Floating Numerical Architecture (HRFNA), een nieuwe numerieke architectuur voor FPGA's die residuele rekenkunde combineert met exponentiële schaling om een hoge doorvoer en energie-efficiëntie te bereiken met formele foutgrenzen, wat aanzienlijke prestatieverbeteringen oplevert ten opzichte van de IEEE 754 FP32-standaard.

Mostafa DarvishiWed, 11 Ma💻 cs