Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach

この論文は、既存のデータセットが見過ごしていた広範なシーン編集を含む大規模な局所偽造画像データセット「BR-Gen」と、ノイズ指紋を用いて偽造痕跡を画像全体に伝播させることで検出性能を向上させる「NFA-ViT」という新しいモデルを提案し、AI 生成画像の局所偽造検出における新たな基準を確立したことを示しています。

Lvpan Cai, Haowei Wang, Jiayi Ji, Yanshu Zhoumen, Shen Chen, Taiping Yao, Xiaoshuai Sun2026-03-11💻 cs

Scalable and Performant Data Loading

Facebook 研究チームが開発したオープンソースライブラリ「SPDL」は、Python の GIL(グローバルインタプリタロック)を回避する仕組みにより、PyTorch の DataLoader と比較して ImageNet データセットの反復速度を 74% 向上させながら CPU 使用量とメモリ使用量を大幅に削減し、Free-Threaded Python 環境ではさらに 33% の性能向上を実現する、GPU 向けに最適化されたスケーラブルかつ高性能なデータ読み込みフレームワークです。

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman Krishnamoorthi2026-03-11💻 cs

Physics-Conditioned Grasping for Stable Tool Use

本論文は、タスク誘発トルクによる工具の滑りや回転を抑制し、実世界での成功率を向上させるため、タスク条件付き軌道に沿って相互作用のワレンスを最小化するグリップを選択する「iTuP」と「SDG-Net」を提案し、工具使用には知覚だけでなくワレンス感知に基づくグリップ選択が不可欠であることを実証しています。

Noah Trupin, Zixing Wang, Ahmed H. Qureshi2026-03-11💻 cs

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

この論文は、光学画像と SAR 画像の融合による物体検出の性能向上を可能にする大規模な統合データセット「M4-SAR」と、その評価基準および新しい検出フレームワーク「E2E-OSDet」を提案し、複雑な環境下での検出精度を大幅に改善することを示しています。

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei Luo2026-03-11💻 cs

EasyText: Controllable Diffusion Transformer for Multilingual Text Rendering

この論文は、Diffusion Transformer を基盤とし、文字位置エンコーディングや位置エンコーディング補間などの新技術、さらに大規模な多言語合成データセットを活用することで、高精度かつ制御可能な多言語テキスト描画を実現する「EasyText」というフレームワークを提案するものである。

Runnan Lu, Yuxuan Zhang, Jiaming Liu, Haofan Wang, Yiren Song2026-03-11💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

この論文は、7 つのプログラミング言語にまたがる 3 万枚以上のパッチを用いた大規模な実証研究を通じて、指示微調整と少数ショットプロンプティングを適用した GPT-4o が、従来の事前学習言語モデル(PLM)を上回る多言語・多粒度(関数レベルおよび行レベル)の脆弱性検出能力を有することを明らかにしています。

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka Kamei2026-03-11💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

本論文は、生物学的なシナプスフィルタリング機構に着想を得たクロススケールゲーティング符号化(CSGC)と軽量残差ブロックを導入し、低消費電力かつ高精度な単眼 3 次元物体検出を実現するスパイクニューラルネットワーク「SpikeSMOKE」を提案するものである。

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen Huang2026-03-11💻 cs

Approximations for Fault-Tolerant Total and Partial Positive Influence Domination

本論文は、最大次数Δ\Deltaと耐故障数mmを用いた故障耐性総支配数問題に対する$1 + \ln(\Delta + m - 1)$近似アルゴリズムの構築、および重み付き部分正影響支配集合問題の単純・総・連結版に対する対数近似アルゴリズムの提案(特に連結版では整数値から分数値への一般近似枠組みの拡張を含む)を報告するものである。

Ioannis Lamprou, Ioannis Sigalas, Ioannis Vaxevanakis + 1 more2026-03-11💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

この論文は、オーストリアの新聞『デア・シュタント』の 10 年間(2013-2022 年)にわたる 7500 万件以上のコメントと 4 億件以上の投票を含む大規模な縦断データセットを提示し、ユーザーの匿名性を保ちつつドイツ語のオンライン議論の動態やネットワーク構造、意味分析を可能にする前計算済みベクトル表現を公開している。

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max Pellert2026-03-11💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

この論文は、物理場データ(流体力学など)の解釈を強化するため、物理的特徴を構造化されたテキストに変換する手法とデータ圧縮戦略を組み合わせた新しい大規模視覚言語モデル「FieldLVLM」を提案し、既存手法を上回る性能を実証したものです。

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang Zhang2026-03-11💻 cs

Analysis and virtual element discretisation of a Stokes/Biot--Kirchhoff bulk--surface model

本論文は、バルク領域でのストークス流と表面でのビオト・キルヒホフ方程式に基づく多孔質弾性プレートが結合した 3 次元 -2 次元モデルの解析と、安定した仮想要素法による離散化、収束性の証明、およびシリコンナノポーア膜を用いた免疫隔離シミュレーションへの応用を提案するものである。

Franco Dassi, Rekha Khot, Andres E. Rubiano + 1 more2026-03-11💻 cs

A robust and compliant robotic assembly control strategy for batch precision assembly task with uncertain fit types and fit amounts

本論文は、不確実な嵌合タイプと嵌合量を有するバッチ精密組立タスクに対し、力・視覚融合制御駆動のマルチタスク強化学習と教師政策蒸留を用いて、複数のサブタスクに対応する堅牢でコンプライアンス性の高い統合制御戦略を構築する手法を提案し、実機実験で高い成功率と力制御性能を実証している。

Bin Wang, Jiwen Zhang, Song Wang + 1 more2026-03-11💻 cs

You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation

この論文は、単一の RGB 画像から未見の物体カテゴリの 9 自由度姿勢を推定する新たな単一段階のトランスフォーマーベースの手法「YOPO」を提案し、追加データや深度情報なしで既存の RGB 専用手法を凌駕する性能を達成したことを報告しています。

Hakjin Lee, Junghoon Seo, Jaehoon Sim2026-03-11💻 cs