cs 件の論文 | Gist.Science

Modeling Concurrency Control as a Learnable Function

本論文は、ベイズ最適化とグラフ削減探索アルゴリズムを用いて既存の並行制御アルゴリズムの設計選択を学習し、効率的なデータベース内ルックアップテーブルとして実装された新しい学習型並行制御アルゴリズム「NeurCC」を提案し、多様なワークロードにおいて従来の最先端手法を上回る高いトランザクションスループットと最適化速度を実現することを示しています。

Hexiang Pan, Shaofeng Cai, Tien Tuan Anh Dinh, Yuncheng Wu, Yeow Meng Chee, Gang Chen, Beng Chin OoiWed, 11 Ma💻 cs

Actegories, Copowers, and Higher-Order Message Passing Semantics

本論文は、CaMPL における高次プロセスのセマンティクスを動機として、非閉かつ非対称なモノイダル基盤においても「右作用圏（右 actegory）」と「コパワを持つ右 enriched 圏」が同値であることを証明したものである。

Robin Cockett (University of Calgary), Melika Norouzbeygi (University of Calgary)Wed, 11 Ma💻 cs

Semi-Supervised Biomedical Image Segmentation via Diffusion Models and Teacher-Student Co-Training

本論文は、拡散モデルと教師 - 学生協調学習を組み合わせた新たな半教師あり学習フレームワークを提案し、限られたアノテーションデータでも最先端の性能を発揮する生体医学画像セグメンテーション手法を確立したものである。

Luca Ciampi, Gabriele Lagani, Giuseppe Amato, Fabrizio FalchiWed, 11 Ma💻 cs

Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach

この論文は、既存のデータセットが見過ごしていた広範なシーン編集を含む大規模な局所偽造画像データセット「BR-Gen」と、ノイズ指紋を用いて偽造痕跡を画像全体に伝播させることで検出性能を向上させる「NFA-ViT」という新しいモデルを提案し、AI 生成画像の局所偽造検出における新たな基準を確立したことを示しています。

Lvpan Cai, Haowei Wang, Jiayi Ji, Yanshu Zhoumen, Shen Chen, Taiping Yao, Xiaoshuai SunWed, 11 Ma💻 cs

Scalable and Performant Data Loading

Facebook 研究チームが開発したオープンソースライブラリ「SPDL」は、Python の GIL（グローバルインタプリタロック）を回避する仕組みにより、PyTorch の DataLoader と比較して ImageNet データセットの反復速度を 74% 向上させながら CPU 使用量とメモリ使用量を大幅に削減し、Free-Threaded Python 環境ではさらに 33% の性能向上を実現する、GPU 向けに最適化されたスケーラブルかつ高性能なデータ読み込みフレームワークです。

Moto Hira, Christian Puhrsch, Valentin Andrei, Roman Malinovskyy, Gael Le Lan, Abhinandan Krishnan, Joseph Cummings, Victor Bourgin, Olga Gerasimova, Miguel Martin, Gokul Gunasekaran, Yuta Inoue, Alex J Turner, Raghuraman KrishnamoorthiWed, 11 Ma💻 cs

Physics-Conditioned Grasping for Stable Tool Use

本論文は、タスク誘発トルクによる工具の滑りや回転を抑制し、実世界での成功率を向上させるため、タスク条件付き軌道に沿って相互作用のワレンスを最小化するグリップを選択する「iTuP」と「SDG-Net」を提案し、工具使用には知覚だけでなくワレンス感知に基づくグリップ選択が不可欠であることを実証しています。

Noah Trupin, Zixing Wang, Ahmed H. QureshiWed, 11 Ma💻 cs

M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for optical-SAR Object Detection

この論文は、光学画像と SAR 画像の融合による物体検出の性能向上を可能にする大規模な統合データセット「M4-SAR」と、その評価基準および新しい検出フレームワーク「E2E-OSDet」を提案し、複雑な環境下での検出精度を大幅に改善することを示しています。

Chao Wang, Wei Lu, Xiang Li, Jian Yang, Lei LuoWed, 11 Ma💻 cs

MARRS: Masked Autoregressive Unit-based Reaction Synthesis

この論文は、離散化による情報損失を回避し、身体部位間の相互感知を考慮した連続表現に基づく新しいフレームワーク「MARRS」を提案し、他者の動作に応じた協調的で微細な反応動作の生成を実現するものです。

Yabiao Wang, Shuo Wang, Jiangning Zhang, Jiafu Wu, Qingdong He, Yong LiuWed, 11 Ma💻 cs

EasyText: Controllable Diffusion Transformer for Multilingual Text Rendering

この論文は、Diffusion Transformer を基盤とし、文字位置エンコーディングや位置エンコーディング補間などの新技術、さらに大規模な多言語合成データセットを活用することで、高精度かつ制御可能な多言語テキスト描画を実現する「EasyText」というフレームワークを提案するものである。

Runnan Lu, Yuxuan Zhang, Jiaming Liu, Haofan Wang, Yiren SongWed, 11 Ma💻 cs

Evaluating Large Language Models for Multilingual Vulnerability Detection at Dual Granularities

この論文は、7 つのプログラミング言語にまたがる 3 万枚以上のパッチを用いた大規模な実証研究を通じて、指示微調整と少数ショットプロンプティングを適用した GPT-4o が、従来の事前学習言語モデル（PLM）を上回る多言語・多粒度（関数レベルおよび行レベル）の脆弱性検出能力を有することを明らかにしています。

Honglin Shu, Michael Fu, Junji Yu, Dong Wang, Chakkrit Tantithamthavorn, Junjie Chen, Yasutaka KameiWed, 11 Ma💻 cs

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

本論文は、生物学的なシナプスフィルタリング機構に着想を得たクロススケールゲーティング符号化（CSGC）と軽量残差ブロックを導入し、低消費電力かつ高精度な単眼 3 次元物体検出を実現するスパイクニューラルネットワーク「SpikeSMOKE」を提案するものである。

Xuemei Chen, Huamin Wang, Jing Peng, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen HuangWed, 11 Ma💻 cs

A Decade of News Forum Interactions: Threaded Conversations, Signed Votes, and Topical Tags

この論文は、オーストリアの新聞『デア・シュタント』の 10 年間（2013-2022 年）にわたる 7500 万件以上のコメントと 4 億件以上の投票を含む大規模な縦断データセットを提示し、ユーザーの匿名性を保ちつつドイツ語のオンライン議論の動態やネットワーク構造、意味分析を可能にする前計算済みベクトル表現を公開している。

Emma Fraxanet, Vicenç Gómez, Andreas Kaltenbrunner, Max PellertWed, 11 Ma💻 cs

Improving Large Vision-Language Models' Understanding for Flow Field Data

この論文は、物理場データ（流体力学など）の解釈を強化するため、物理的特徴を構造化されたテキストに変換する手法とデータ圧縮戦略を組み合わせた新しい大規模視覚言語モデル「FieldLVLM」を提案し、既存手法を上回る性能を実証したものです。

Xiaomei Zhang, Hanyu Zheng, Xiangyu Zhu, Jinghuan Wei, Junhong Zou, Zhen Lei, Zhaoxiang ZhangWed, 11 Ma💻 cs

You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation

この論文は、単一の RGB 画像から未見の物体カテゴリの 9 自由度姿勢を推定する新たな単一段階のトランスフォーマーベースの手法「YOPO」を提案し、追加データや深度情報なしで既存の RGB 専用手法を凌駕する性能を達成したことを報告しています。

Hakjin Lee, Junghoon Seo, Jaehoon SimWed, 11 Ma💻 cs

← 前へ次へ →

cs