UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

本論文は、ロボットの物理的特性に適合した操作ポリシーを学習し、人間のデモンストレーションの単なる模倣を超えて多様なロボット形態に対応するよう、ユニファイド形態表現(UMR)と動的強化学習を組み合わせた「UniBYD」という統一フレームワークを提案し、その有効性を新規ベンチマーク「UniManip」を用いて実証したものである。

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

この論文は、拡散モデルの強化学習における「好意モード崩壊(多様性の欠如)」を定量化する新しいベンチマーク「DivGenBench」を提案し、報酬モデルの埋め込み空間内で方向性補正を行う「方向性分離アライメント(D²-Align)」という手法により、多様性を維持しつつ人間の好みに優れた生成を実現することを示しています。

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu LiWed, 11 Ma💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

本論文は、大規模プログラムの形式検証におけるスケーラビリティ課題を解決するため、静的解析と大規模言語モデル(LLM)を協調させ、潜在的なランタイムエラーに基づいて検証単位を優先的に選定・合成するモジュール型フレームワーク「Preguss」を提案し、千行を超える実世界プログラムにおいて人間の手間を最大 88.9% 削減する高い自動化を実現したことを示しています。

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei YinWed, 11 Ma💻 cs

Low-rank Orthogonal Subspace Intervention for Generalizable Face Forgery Detection

本論文は、顔偽造検出における汎化性能の向上を目指し、因果表現学習の観点から「低ランクの誤ったバイアス」を低ランク部分空間として特定し、その直交補空間を学習することで偽造痕跡に特化した検出器 SeLop を提案し、極めて少ない学習パラメータで最先端の性能を実現したことを報告しています。

Chi Wang, Xinjue Hu, Boyu Wang, Ziwen He, Zhangjie FuWed, 11 Ma💻 cs

Towards a Goal-Centric Assessment of Requirements Engineering Methods for Privacy by Design

この論文は、GDPR に基づくプライバシー・バイ・デザイン(PbD)の実装において、組織の目標に合致する要件工学手法を評価するための「目標中心アプローチ」を提案し、プロセス特性だけでなく組織目標に基づいた評価の重要性を指摘するものである。

Oleksandr Kosenkov, Ehsan Zabardast, Jannik Fischbach, Tony Gorschek, Daniel MendezWed, 11 Ma💻 cs

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

本論文は、無線秘匿通信の厳格な検出理論制約下での LLM 能力を評価する新たなベンチマーク「CovertComBench」を提案し、概念理解やコード生成では高い性能を示すものの、セキュリティ保証に必要な高度な数学的導出においては大幅な性能不足があることを明らかにし、信頼性の高い無線 AI システム構築には外部ツールの活用が不可欠であると結論付けています。

Zhaozhi Liu, Jiaxin Chen, Yuanai Xie, Yuna Jiang, Minrui Xu, Xiao Zhang, Pan Lai, Zan ZhouWed, 11 Ma💻 cs

Exploiting the Final Component of Generator Architectures for AI-Generated Image Detection

この論文は、拡散モデルや自己回帰モデルなど多様な生成モデルが共有する最終的なアーキテクチャ成分を悪用して実画像を「汚染」し、その特徴を学習させることで、未見の生成モデルに対しても高い汎化性能(平均精度 98.83%)を実現する AI 生成画像検出手法を提案しています。

Yanzhu Liu, Xiao Liu, Yuexuan Wang, Mondal SoumikWed, 11 Ma💻 cs

RegionReasoner: Region-Grounded Multi-Round Visual Reasoning

本論文は、推論過程で参照bounding boxの明示を強制し、大域・局所キャプションとの整合性を報酬として活用する強化学習フレームワーク「RegionReasoner」と、それを評価するための新しいベンチマーク「RegionDial-Bench」を提案し、検出・セグメンテーションタスクにおける多段階視覚推論の精度と空間的根拠付けを大幅に向上させることを示しています。

Wenfang Sun, Hao Chen, Yingjun Du, Yefeng Zheng, Cees G. M. SnoekWed, 11 Ma💻 cs

Optimal conversion from Rényi Differential Privacy to ff-Differential Privacy

本論文は、Rényi 微分プライバシー(RDP)プロファイルをff-微分プライバシーに変換する際、単一次数の RDP プライバシー領域の交差に基づく変換則が、すべての有効な RDP プロファイルと第 1 種誤り率に対して最適であることを証明し、RDP 保証のみから導き出せるプライバシーの限界を確立しました。

Anneliese Riess, Juan Felipe Gomez, Flavio du Pin Calmon, Julia Anne Schnabel, Georgios KaissisWed, 11 Ma💻 cs

Pathwise Test-Time Correction for Autoregressive Long Video Generation

この論文は、長期動画生成におけるエラー蓄積の問題を、トレーニング不要で初期フレームを基準にサンプリング経路を補正する「Test-Time Correction(TTC)」という手法により解決し、既存のテスト時間最適化法よりも安定した高品質な 30 秒動画生成を実現することを提案しています。

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao GuoWed, 11 Ma💻 cs

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

この論文は、生物学的な蝶の飛行力学を模倣し、26 グラムの軽量で柔軟な構造を持つ自律制御可能なロボット「AirPulse」を開発することで、従来のドローンでは困難とされていた低周波・大振幅の羽ばたきによる振動環境下での安定した飛行を実現したことを報告しています。

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue ZhouWed, 11 Ma💻 cs

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

この論文は、ACL アンソロジーに掲載された LGBTQIA+ コミュニティと自然言語処理(NLP)の関係を扱った研究を体系的にレビューし、現状の偏りや課題を指摘するとともに、より公正で包括的な NLP 技術の実現に向けた将来の研究方向性と行動を呼びかける批判的調査である。

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan LongWed, 11 Ma💻 cs

ChimeraLoRA: Multi-Head LoRA-Guided Synthetic Datasets

本論文は、クラス共有 LoRA と画像固有 LoRA を組み合わせ、セマンティックなボスト手法とディリクレ分布に基づく混合生成を採用することで、データ不足領域において多様性と詳細さを両立した合成データを生成し、下流タスクの分類精度を向上させる「ChimeraLoRA」を提案するものである。

Hoyoung Kim, Minwoo Jang, Jabin Koo, Sangdoo Yun, Jungseul OkWed, 11 Ma💻 cs

DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

本論文は、文書偽造検出のゼロショットベンチマーク「DOCFORGE-BENCH」を提案し、既存手法が事前学習済み重みのままでは閾値の較正失敗により実用できないことを示し、再学習ではなく閾値の適応が実運用におけるボトルネックの解決鍵であることを明らかにしています。

Zengqi Zhao, Weidi Xia, En Wei, Yan Zhang, Jane Mo, Tiannan Zhang, Yuanqin Dai, Zexi Chen, Yiran Tao, Simiao RenWed, 11 Ma💻 cs

Multimodal Adversarial Quality Policy for Safe Grasping

本論文は、RGB と深度の両モダリティ間の分布の不一致と最適化の偏りを解消する「異種二重パッチ最適化スキーム」と「勾配レベルのモダリティバランス戦略」を備えたマルチモーダル敵対的品質ポリシー(MAQP)を提案し、人間とロボットの相互作用における安全な把持を実現するものである。

Kunlin Xie, Chenghao Li, Haolan Zhang, Nak Young ChongWed, 11 Ma💻 cs

Scaling Multilingual Semantic Search in Uber Eats Delivery

Uber Eats は、Qwen2 ベースの双塔モデルを大規模なクエリ - ドキュメント相互作用データで微調整し、Matryoshka 表現学習や多様な損失関数を活用して、店舗・料理・小売品といった多言語・多垂直分野にまたがる統合セマンティック検索システムを構築し、複数の市場で基線モデルを上回るリコール性能を達成した。

Bo Ling, Zheng Liu, Haoyang Chen, Divya Nagar, Luting Yang, Mehul ParsanaWed, 11 Ma💻 cs

A Hybrid Residue Floating Numerical Architecture with Formal Error Bounds for High Throughput FPGA Computation

本論文は、FPGA 上の浮動小数点演算の効率化を目指し、キャリーフリーの剰余演算と軽量な指数スケーリングを組み合わせ、厳密な誤差保証と高いスループットを実現する「ハイブリッド剰余浮動数値アーキテクチャ(HRFNA)」を提案し、その数学的基礎、FPGA 実装、および数値的安定性を検証したものである。

Mostafa DarvishiWed, 11 Ma💻 cs