M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

この論文は、光学画像と SAR 画像の融合による物体検出の性能向上を可能にする大規模な統合データセット「M4-SAR」と、その評価基準および新しい検出フレームワーク「E2E-OSDet」を提案し、複雑な環境下での検出精度を大幅に改善することを示しています。

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei Luo2026-03-11💻 cs

EasyText: Controllable Diffusion Transformer for Multilingual Text Rendering

この論文は、Diffusion Transformer を基盤とし、文字位置エンコーディングや位置エンコーディング補間などの新技術、さらに大規模な多言語合成データセットを活用することで、高精度かつ制御可能な多言語テキスト描画を実現する「EasyText」というフレームワークを提案するものである。

Runnan Lu, Yuxuan Zhang, Jiaming Liu, Haofan Wang, Yiren Song2026-03-11💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

この論文は、7 つのプログラミング言語にまたがる 3 万枚以上のパッチを用いた大規模な実証研究を通じて、指示微調整と少数ショットプロンプティングを適用した GPT-4o が、従来の事前学習言語モデル(PLM)を上回る多言語・多粒度(関数レベルおよび行レベル)の脆弱性検出能力を有することを明らかにしています。

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka Kamei2026-03-11💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

本論文は、生物学的なシナプスフィルタリング機構に着想を得たクロススケールゲーティング符号化(CSGC)と軽量残差ブロックを導入し、低消費電力かつ高精度な単眼 3 次元物体検出を実現するスパイクニューラルネットワーク「SpikeSMOKE」を提案するものである。

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen Huang2026-03-11💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

この論文は、オーストリアの新聞『デア・シュタント』の 10 年間(2013-2022 年)にわたる 7500 万件以上のコメントと 4 億件以上の投票を含む大規模な縦断データセットを提示し、ユーザーの匿名性を保ちつつドイツ語のオンライン議論の動態やネットワーク構造、意味分析を可能にする前計算済みベクトル表現を公開している。

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max Pellert2026-03-11💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

この論文は、物理場データ(流体力学など)の解釈を強化するため、物理的特徴を構造化されたテキストに変換する手法とデータ圧縮戦略を組み合わせた新しい大規模視覚言語モデル「FieldLVLM」を提案し、既存手法を上回る性能を実証したものです。

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang Zhang2026-03-11💻 cs

You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation

この論文は、単一の RGB 画像から未見の物体カテゴリの 9 自由度姿勢を推定する新たな単一段階のトランスフォーマーベースの手法「YOPO」を提案し、追加データや深度情報なしで既存の RGB 専用手法を凌駕する性能を達成したことを報告しています。

Hakjin Lee, Junghoon Seo, Jaehoon Sim2026-03-11💻 cs

Lightening the Load: A Cluster-Based Framework for A Lower-Overhead, Provable Website Fingerprinting Defense

この論文は、正規化と超系列アプローチの長所を統合し、トラフィックのクラスタリングに基づいてパディングパラメータを動的に調整することで、高いプライバシー保護を保証しつつオーバーヘッドを最大 99% 削減する新しいウェブサイト指紋防御フレームワーク「Adaptive Tamaraw」を提案しています。

Khashayar Khajavi, Tao Wang2026-03-11💻 cs

CoRe-GS: Coarse-to-Refined Gaussian Splatting with Semantic Object Focus

この論文は、ロボティクス応用に不可欠な高速かつ効率的な 3 次元再構成を実現するため、関心領域(POI)に特化した粗から細への最適化フレームワーク「CoRe-GS」を提案し、背景の計算を削減しながら浮遊ノイズを抑制し、再構成品質と訓練速度を同時に向上させる手法を提示しています。

Hannah Schieber, Dominik Frischmann, Victor Schaack, Simon Boche, Angela Schoellig, Stefan Leutenegger, Daniel Roth2026-03-11💻 cs

Floating-Point Usage on GitHub: A Large-Scale Study of Statically Typed Languages

この論文は、静的型付け言語を対象とした大規模な実証研究を通じて、GitHub の公開リポジトリにおける浮動小数点演算の使用状況を初めて包括的に分析し、既存のベンチマークと実世界のコードの類似点と相違点を明らかにするとともに、1000 万個の浮動小数点関数からなるデータセットを公開して将来の技術開発を支援することを目的としています。

Andrea Gilot, Tobias Wrigstad, Eva Darulova2026-03-11💻 cs

VocSegMRI: Multimodal Learning for Precise Vocal Tract Segmentation in Real-time MRI

本論文は、音声と音韻情報を視覚情報と統合するマルチモーダル学習フレームワーク「VocSegMRI」を提案し、リアルタイム MRI における発音器官の高精度なセグメンテーションを実現したものである。

Daiqi Liu, Tomás Arias-Vergara, Johannes Enk, Fangxu Xing, Maureen Stone, Jerry L. Prince, Jana Hutter, Andreas Maier, Jonghye Woo, Paula Andrea Pérez-Toro2026-03-11💻 cs

Automated Coral Spawn Monitoring for Reef Restoration: The Coral Spawn and Larvae Imaging Camera System (CSLICS)

この論文は、人手に依存するサンゴの産卵計測の課題を解決し、大規模なサンゴ礁の修復を可能にするため、低コストなカメラと人間によるラベル付けを組み合わせた物体検出技術を用いて、サンゴの産卵と幼生を自動的に検出・分類・計数する「CSLICS」と呼ばれるシステムを提案し、その有効性を検証したものです。

Dorian Tsai, Christopher A. Brunner, Riki Lamont, F. Mikaela Nordborg, Andrea Severati, Java Terry, Karen Jackel, Matthew Dunbabin, Tobias Fischer, Scarlett Raine2026-03-11💻 cs

Mapping Historic Urban Footprints in France: Balancing Quality, Scalability and AI Techniques

この論文は、1925 年から 1950 年にかけてのフランスの歴史的都市拡大を分析するため、古地図の複雑な特徴を処理する双段階の深層学習パイプラインを開発し、初の全国規模のオープンアクセス都市フットプリントデータセットを生成したことを報告しています。

Walid Rabehi, Marion Le Texier, Rémi Lemoy2026-03-11💻 cs

Connectivity Maintenance and Recovery for Multi-Robot Motion Planning

この論文は、障害物に満ちた環境における多ロボットシステムの接続維持と回復を可能にするため、高次制御バリア関数と制御リアプノフ関数を用いたリアルタイムのベジェ曲線ベースの MPC-CLF-CBF 運動計画アルゴリズムを提案し、シミュレーションおよび 8 機の Crazyflie による物理実験でその有効性を検証したものである。

Yutong Wang, Lishuo Pan, Yichun Qu, Tengxiang Wang, Nora Ayanian2026-03-11💻 cs

LARA-Gen: Enabling Continuous Emotion Control for Music Generation Models via Latent Affective Representation Alignment

この論文は、外部の音楽理解モデルとの潜在感情表現の整合化と連続的な価・覚醒空間に基づく制御モジュールを導入することで、テキストプロンプトの限界を克服し、音楽生成モデルにおける連続的かつ微細な感情制御を実現する「LARA-Gen」というフレームワークを提案し、その有効性を示したものである。

Jiahao Mei, Xuenan Xu, Zeyu Xie, Zihao Zheng, Ye Tao, Yue Ding, Mengyue Wu2026-03-11💻 cs