Modeling Concurrency Control as a Learnable Function

本論文は、ベイズ最適化とグラフ削減探索アルゴリズムを用いて既存の並行制御アルゴリズムの設計選択を学習し、効率的なデータベース内ルックアップテーブルとして実装された新しい学習型並行制御アルゴリズム「NeurCC」を提案し、多様なワークロードにおいて従来の最先端手法を上回る高いトランザクションスループットと最適化速度を実現することを示しています。

Hexiang Pan, Shaofeng Cai, Tien Tuan Anh Dinh, Yuncheng Wu, Yeow Meng Chee, Gang Chen, Beng Chin OoiWed, 11 Ma💻 cs

Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach

この論文は、既存のデータセットが見過ごしていた広範なシーン編集を含む大規模な局所偽造画像データセット「BR-Gen」と、ノイズ指紋を用いて偽造痕跡を画像全体に伝播させることで検出性能を向上させる「NFA-ViT」という新しいモデルを提案し、AI 生成画像の局所偽造検出における新たな基準を確立したことを示しています。

Lvpan Cai, Haowei Wang, Jiayi Ji, Yanshu Zhoumen, Shen Chen, Taiping Yao, Xiaoshuai SunWed, 11 Ma💻 cs

Scalable and Performant Data Loading

Facebook 研究チームが開発したオープンソースライブラリ「SPDL」は、Python の GIL(グローバルインタプリタロック)を回避する仕組みにより、PyTorch の DataLoader と比較して ImageNet データセットの反復速度を 74% 向上させながら CPU 使用量とメモリ使用量を大幅に削減し、Free-Threaded Python 環境ではさらに 33% の性能向上を実現する、GPU 向けに最適化されたスケーラブルかつ高性能なデータ読み込みフレームワークです。

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman KrishnamoorthiWed, 11 Ma💻 cs

Physics-Conditioned Grasping for Stable Tool Use

本論文は、タスク誘発トルクによる工具の滑りや回転を抑制し、実世界での成功率を向上させるため、タスク条件付き軌道に沿って相互作用のワレンスを最小化するグリップを選択する「iTuP」と「SDG-Net」を提案し、工具使用には知覚だけでなくワレンス感知に基づくグリップ選択が不可欠であることを実証しています。

Noah Trupin, Zixing Wang, Ahmed H. QureshiWed, 11 Ma💻 cs

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

この論文は、光学画像と SAR 画像の融合による物体検出の性能向上を可能にする大規模な統合データセット「M4-SAR」と、その評価基準および新しい検出フレームワーク「E2E-OSDet」を提案し、複雑な環境下での検出精度を大幅に改善することを示しています。

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei LuoWed, 11 Ma💻 cs

EasyText: Controllable Diffusion Transformer for Multilingual Text Rendering

この論文は、Diffusion Transformer を基盤とし、文字位置エンコーディングや位置エンコーディング補間などの新技術、さらに大規模な多言語合成データセットを活用することで、高精度かつ制御可能な多言語テキスト描画を実現する「EasyText」というフレームワークを提案するものである。

Runnan Lu, Yuxuan Zhang, Jiaming Liu, Haofan Wang, Yiren SongWed, 11 Ma💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

この論文は、7 つのプログラミング言語にまたがる 3 万枚以上のパッチを用いた大規模な実証研究を通じて、指示微調整と少数ショットプロンプティングを適用した GPT-4o が、従来の事前学習言語モデル(PLM)を上回る多言語・多粒度(関数レベルおよび行レベル)の脆弱性検出能力を有することを明らかにしています。

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka KameiWed, 11 Ma💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

本論文は、生物学的なシナプスフィルタリング機構に着想を得たクロススケールゲーティング符号化(CSGC)と軽量残差ブロックを導入し、低消費電力かつ高精度な単眼 3 次元物体検出を実現するスパイクニューラルネットワーク「SpikeSMOKE」を提案するものである。

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen HuangWed, 11 Ma💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

この論文は、オーストリアの新聞『デア・シュタント』の 10 年間(2013-2022 年)にわたる 7500 万件以上のコメントと 4 億件以上の投票を含む大規模な縦断データセットを提示し、ユーザーの匿名性を保ちつつドイツ語のオンライン議論の動態やネットワーク構造、意味分析を可能にする前計算済みベクトル表現を公開している。

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max PellertWed, 11 Ma💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

この論文は、物理場データ(流体力学など)の解釈を強化するため、物理的特徴を構造化されたテキストに変換する手法とデータ圧縮戦略を組み合わせた新しい大規模視覚言語モデル「FieldLVLM」を提案し、既存手法を上回る性能を実証したものです。

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang ZhangWed, 11 Ma💻 cs

You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation

この論文は、単一の RGB 画像から未見の物体カテゴリの 9 自由度姿勢を推定する新たな単一段階のトランスフォーマーベースの手法「YOPO」を提案し、追加データや深度情報なしで既存の RGB 専用手法を凌駕する性能を達成したことを報告しています。

Hakjin Lee, Junghoon Seo, Jaehoon SimWed, 11 Ma💻 cs

Lightening the Load: A Cluster-Based Framework for A Lower-Overhead, Provable Website Fingerprinting Defense

この論文は、正規化と超系列アプローチの長所を統合し、トラフィックのクラスタリングに基づいてパディングパラメータを動的に調整することで、高いプライバシー保護を保証しつつオーバーヘッドを最大 99% 削減する新しいウェブサイト指紋防御フレームワーク「Adaptive Tamaraw」を提案しています。

Khashayar Khajavi, Tao WangWed, 11 Ma💻 cs

CoRe-GS: Coarse-to-Refined Gaussian Splatting with Semantic Object Focus

この論文は、ロボティクス応用に不可欠な高速かつ効率的な 3 次元再構成を実現するため、関心領域(POI)に特化した粗から細への最適化フレームワーク「CoRe-GS」を提案し、背景の計算を削減しながら浮遊ノイズを抑制し、再構成品質と訓練速度を同時に向上させる手法を提示しています。

Hannah Schieber, Dominik Frischmann, Victor Schaack, Simon Boche, Angela Schoellig, Stefan Leutenegger, Daniel RothWed, 11 Ma💻 cs

Floating-Point Usage on GitHub: A Large-Scale Study of Statically Typed Languages

この論文は、静的型付け言語を対象とした大規模な実証研究を通じて、GitHub の公開リポジトリにおける浮動小数点演算の使用状況を初めて包括的に分析し、既存のベンチマークと実世界のコードの類似点と相違点を明らかにするとともに、1000 万個の浮動小数点関数からなるデータセットを公開して将来の技術開発を支援することを目的としています。

Andrea Gilot, Tobias Wrigstad, Eva DarulovaWed, 11 Ma💻 cs

VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

本論文は、音声と音韻情報を視覚情報と統合するマルチモーダル学習フレームワーク「VocSegMRI」を提案し、リアルタイム MRI における発音器官の高精度なセグメンテーションを実現したものである。

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-ToroWed, 11 Ma💻 cs