cs 件の論文 | Gist.Science

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

本論文は、ロボットの物理的特性に適合した操作ポリシーを学習し、人間のデモンストレーションの単なる模倣を超えて多様なロボット形態に対応するよう、ユニファイド形態表現（UMR）と動的強化学習を組み合わせた「UniBYD」という統一フレームワークを提案し、その有効性を新規ベンチマーク「UniManip」を用いて実証したものである。

Tingyu Yuan, Biaoliang Guan, Wen Ye, Ziyan Tian, Yi Yang, Weijie Zhou, Zhaowen Li, Yan Huang, Peng Wang, Chaoyang Zhao, Jinqiao WangWed, 11 Ma💻 cs

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

この論文は、拡散モデルの強化学習における「好意モード崩壊（多様性の欠如）」を定量化する新しいベンチマーク「DivGenBench」を提案し、報酬モデルの埋め込み空間内で方向性補正を行う「方向性分離アライメント（D²-Align）」という手法により、多様性を維持しつつ人間の好みに優れた生成を実現することを示しています。

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu LiWed, 11 Ma💻 cs

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

本論文は、大規模プログラムの形式検証におけるスケーラビリティ課題を解決するため、静的解析と大規模言語モデル（LLM）を協調させ、潜在的なランタイムエラーに基づいて検証単位を優先的に選定・合成するモジュール型フレームワーク「Preguss」を提案し、千行を超える実世界プログラムにおいて人間の手間を最大 88.9% 削減する高い自動化を実現したことを示しています。

Zhongyi Wang, Tengjie Lin, Mingshuai Chen, Haokun Li, Mingqi Yang, Xiao Yi, Shengchao Qin, Yixing Luo, Xiaofeng Li, Bin Gu, Liqiang Lu, Jianwei YinWed, 11 Ma💻 cs

Low-rank Orthogonal Subspace Intervention for Generalizable Face Forgery Detection

本論文は、顔偽造検出における汎化性能の向上を目指し、因果表現学習の観点から「低ランクの誤ったバイアス」を低ランク部分空間として特定し、その直交補空間を学習することで偽造痕跡に特化した検出器 SeLop を提案し、極めて少ない学習パラメータで最先端の性能を実現したことを報告しています。

Chi Wang, Xinjue Hu, Boyu Wang, Ziwen He, Zhangjie FuWed, 11 Ma💻 cs

Towards a Goal-Centric Assessment of Requirements Engineering Methods for Privacy by Design

この論文は、GDPR に基づくプライバシー・バイ・デザイン（PbD）の実装において、組織の目標に合致する要件工学手法を評価するための「目標中心アプローチ」を提案し、プロセス特性だけでなく組織目標に基づいた評価の重要性を指摘するものである。

Oleksandr Kosenkov, Ehsan Zabardast, Jannik Fischbach, Tony Gorschek, Daniel MendezWed, 11 Ma💻 cs

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

本論文は、無線秘匿通信の厳格な検出理論制約下での LLM 能力を評価する新たなベンチマーク「CovertComBench」を提案し、概念理解やコード生成では高い性能を示すものの、セキュリティ保証に必要な高度な数学的導出においては大幅な性能不足があることを明らかにし、信頼性の高い無線 AI システム構築には外部ツールの活用が不可欠であると結論付けています。

Zhaozhi Liu, Jiaxin Chen, Yuanai Xie, Yuna Jiang, Minrui Xu, Xiao Zhang, Pan Lai, Zan ZhouWed, 11 Ma💻 cs

Exploiting the Final Component of Generator Architectures for AI-Generated Image Detection

この論文は、拡散モデルや自己回帰モデルなど多様な生成モデルが共有する最終的なアーキテクチャ成分を悪用して実画像を「汚染」し、その特徴を学習させることで、未見の生成モデルに対しても高い汎化性能（平均精度 98.83%）を実現する AI 生成画像検出手法を提案しています。

Yanzhu Liu, Xiao Liu, Yuexuan Wang, Mondal SoumikWed, 11 Ma💻 cs

RegionReasoner: Region-Grounded Multi-Round Visual Reasoning

本論文は、推論過程で参照bounding boxの明示を強制し、大域・局所キャプションとの整合性を報酬として活用する強化学習フレームワーク「RegionReasoner」と、それを評価するための新しいベンチマーク「RegionDial-Bench」を提案し、検出・セグメンテーションタスクにおける多段階視覚推論の精度と空間的根拠付けを大幅に向上させることを示しています。

Wenfang Sun, Hao Chen, Yingjun Du, Yefeng Zheng, Cees G. M. SnoekWed, 11 Ma💻 cs

Optimal conversion from Rényi Differential Privacy to $f$ -Differential Privacy

本論文は、Rényi 微分プライバシー（RDP）プロファイルを $f$ -微分プライバシーに変換する際、単一次数の RDP プライバシー領域の交差に基づく変換則が、すべての有効な RDP プロファイルと第 1 種誤り率に対して最適であることを証明し、RDP 保証のみから導き出せるプライバシーの限界を確立しました。

Anneliese Riess, Juan Felipe Gomez, Flavio du Pin Calmon, Julia Anne Schnabel, Georgios KaissisWed, 11 Ma💻 cs

Pathwise Test-Time Correction for Autoregressive Long Video Generation

この論文は、長期動画生成におけるエラー蓄積の問題を、トレーニング不要で初期フレームを基準にサンプリング経路を補正する「Test-Time Correction（TTC）」という手法により解決し、既存のテスト時間最適化法よりも安定した高品質な 30 秒動画生成を実現することを提案しています。

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao GuoWed, 11 Ma💻 cs

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

この論文は、生物学的な蝶の飛行力学を模倣し、26 グラムの軽量で柔軟な構造を持つ自律制御可能なロボット「AirPulse」を開発することで、従来のドローンでは困難とされていた低周波・大振幅の羽ばたきによる振動環境下での安定した飛行を実現したことを報告しています。

Weibin Gu, Chenrui Feng, Lian Liu, Chen Yang, Xingchi Jiao, Yuhe Ding, Xiaofei Shi, Chao Gao, Alessandro Rizzo, Guyue ZhouWed, 11 Ma💻 cs

Multimodal Classification via Total Correlation Maximization

この論文は、情報理論的観点からマルチモーダル学習におけるモダリティ間の競合を分析し、特徴とラベル間の総相関を最大化する新たな手法「TCMax」を提案することで、既存の手法を上回る分類性能を実現したことを示しています。

Feng Yu, Xiangyu Wu, Yang Yang, Jianfeng LuWed, 11 Ma💻 cs

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

この論文は、ACL アンソロジーに掲載された LGBTQIA+ コミュニティと自然言語処理（NLP）の関係を扱った研究を体系的にレビューし、現状の偏りや課題を指摘するとともに、より公正で包括的な NLP 技術の実現に向けた将来の研究方向性と行動を呼びかける批判的調査である。

Sabine Weber, Angelina Wang, Ankush Gupta, Arjun Subramonian, Dennis Ulmer, Eshaan Tanwar, Geetanjali Aich, Hannah Devinney, Jacob Hobbs, Jennifer Mickel, Joshua Tint, Mae Sosto, Ray Groshan, Simone Astarita, Vagrant Gautam, Verena Blaschke, William Agnew, Wilson Y Lee, Yanan LongWed, 11 Ma💻 cs

← 前へ次へ →

cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

Low-rank Orthogonal Subspace Intervention for Generalizable Face Forgery Detection

Towards a Goal-Centric Assessment of Requirements Engineering Methods for Privacy by Design

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

Exploiting the Final Component of Generator Architectures for AI-Generated Image Detection

RegionReasoner: Region-Grounded Multi-Round Visual Reasoning

Optimal conversion from Rényi Differential Privacy to $f$ -Differential Privacy

Pathwise Test-Time Correction for Autoregressive Long Video Generation

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

Multimodal Classification via Total Correlation Maximization

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

ChimeraLoRA: Multi-Head LoRA-Guided Synthetic Datasets

DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

Multimodal Adversarial Quality Policy for Safe Grasping

Hardness of the Binary Covering Radius Problem in Large $\ell_p$ Norms

Scaling Multilingual Semantic Search in Uber Eats Delivery

A Hybrid Residue Floating Numerical Architecture with Formal Error Bounds for High Throughput FPGA Computation

cs

UniBYD: A Unified Framework for Learning Robotic Manipulation Across Embodiments Beyond Imitation of Human Demonstrations

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

A Tale of 1001 LoC: Potential Runtime Error-Guided Specification Synthesis for Verifying Large-Scale Programs

Low-rank Orthogonal Subspace Intervention for Generalizable Face Forgery Detection

Towards a Goal-Centric Assessment of Requirements Engineering Methods for Privacy by Design

CovertComBench: A First Domain-Specific Testbed for LLMs in Wireless Covert Communication

Exploiting the Final Component of Generator Architectures for AI-Generated Image Detection

RegionReasoner: Region-Grounded Multi-Round Visual Reasoning

Optimal conversion from Rényi Differential Privacy to fff-Differential Privacy

Pathwise Test-Time Correction for Autoregressive Long Video Generation

A 26-Gram Butterfly-Inspired Robot Achieving Autonomous Tailless Flight

Multimodal Classification via Total Correlation Maximization

Queer NLP: A Critical Survey on Literature Gaps, Biases and Trends

Algorithmic Collusion at Test Time: A Meta-game Design and Evaluation

ChimeraLoRA: Multi-Head LoRA-Guided Synthetic Datasets

DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

Multimodal Adversarial Quality Policy for Safe Grasping

Hardness of the Binary Covering Radius Problem in Large ℓp\ell_pℓp​ Norms

Scaling Multilingual Semantic Search in Uber Eats Delivery

A Hybrid Residue Floating Numerical Architecture with Formal Error Bounds for High Throughput FPGA Computation

Optimal conversion from Rényi Differential Privacy to $f$ -Differential Privacy

Hardness of the Binary Covering Radius Problem in Large $\ell_p$ Norms