cs 件の論文 | Gist.Science

UHD Image Deblurring via Autoregressive Flow with Ill-conditioned Constraints

この論文は、UHD 画像のデブラリングにおいて、粗から細への段階的なアップサンプリングと残差生成を流形マッチングでモデル化する自己回帰フロー手法を提案し、条件数正則化による ill-conditioned 制約の抑制を通じて、計算効率と高解像度での細部復元を両立させることを目的としています。

Yucheng Xin, Dawei Zhao, Xiang Chen, Chen Wu, Pu Wang, Dianjie Lu, Guijuan Zhang, Xiuyi Jia, Zhuoran Zheng2026-03-12💻 cs

Visually-Guided Controllable Medical Image Generation via Fine-Grained Semantic Disentanglement

この論文は、複雑な視覚的特徴と抽象的な臨床テキストの間のモダリティギャップおよび意味の混在という課題を解決するため、視覚的ガイダンスを用いたテキストの細粒度意味分離とハイブリッド特徴融合モジュールを拡散トランスフォーマに統合し、医療画像生成の制御性と品質を大幅に向上させるフレームワークを提案しています。

Xin Huang, Junjie Liang, Qingshan Hou, Peng Cao, Jinzhu Yang, Xiaoli Liu, Osmar R. Zaiane2026-03-12💻 cs

Sparse Task Vector Mixup with Hypernetworks for Efficient Knowledge Transfer in Whole-Slide Image Prognosis

本論文は、限られたスライド画像データにおけるがん予後予測の課題に対し、タスクベクトルのミックスアップとハイパーネットワークを用いて他種がんの一般化知識を効率的に統合する「STEPH」という新しい手法を提案し、従来の学習法や既存の転移学習手法を上回る性能と計算効率を実現したことを報告しています。

Pei Liu, Xiangxiang Zeng, Tengfei Ma, Yucheng Xing, Xuanbai Ren, Yiping Liu2026-03-12💻 cs

BinWalker: Development and Field Evaluation of a Quadruped Manipulator Platform for Sustainable Litter Collection

本論文は、不整地での移動とアームによる把持・収納を統合した四足歩行ロボット「BinWalker」を開発し、屋外環境における持続可能なゴミ収集の実現可能性をフィールド評価で実証したものである。

Giulio Turrisi, Angelo Bratta, Giovanni Minelli, Gabriel Fischer Abati, Amir H. Rad, João Carlos Virgolino Soares, Claudio Semini2026-03-12💻 cs

Graphing Inline: Understanding Word-scale Graphics Use in Scientific Papers

この論文は、12 万 6 千以上の科学論文から抽出された 909 件の単語規模のグラフィックを分析し、その配置、機能、視覚表現を特徴づける枠組みを提案するとともに、学術コミュニケーションの向上に向けた可能性を論じています。

Siyu Lu, Yanhan Liu, Shiyu Xu, Ruishi Zou, Chen Ye2026-03-12💻 cs

An Event-Driven E-Skin System with Dynamic Binary Scanning and real time SNN Classification

この論文は、イベント駆動型のバイナリ走査戦略と FPGA 実装のスパイキングニューラルネットワーク（SNN）を統合し、データ収集のオーバーヘッドを劇的に削減しながらリアルタイムで高精度な手書き数字認識を実現する、完全統合型の電子皮膚システムを提案しています。

Gaishan Li, Zhengnan Fu, Anubhab Tripathi, Junyi Yang, Arindam Basu2026-03-12💻 cs

DSFlash: Comprehensive Panoptic Scene Graph Generation in Realtime

DSFlash は、リソース制約のあるエッジデバイスでも実用的なリアルタイム処理（RTX 3090 で 56fps）と低コストな学習環境（古型 GPU で 24 時間未満）を実現しつつ、既存の最先端手法と同等の性能を維持しながら包括的なパンオプティックなシーングラフを生成する低遅延モデルです。

Julian Lorenz, Vladyslav Kovganko, Elias Kohout, Mrunmai Phatak, Daniel Kienzle, Rainer Lienhart2026-03-12💻 cs

In-Memory ADC-Based Nonlinear Activation Quantization for Efficient In-Memory Computing

本論文は、深層学習における活性化値の境界外れ値を抑制する新しい非線形量子化手法「BS-KMQ」を提案し、これによりメモリ内計算システムにおける ADC の解像度要件を低減するとともに、既存手法と比較して大幅な量子化誤差の低減、精度向上、およびエネルギー効率と速度の大幅な改善を実現することを示しています。

Shuai Dong, Junyi Yang, Biyan Zhou, Hongyang Shang, Gourav Datta, Arindam Basu2026-03-12💻 cs

P-GSVC: Layered Progressive 2D Gaussian Splatting for Scalable Image and Video

本論文は、画像と動画の両方に対してスケーラブルな表現を提供する初の階層的逐次 2D ガウススプラッティングフレームワーク「P-GSVC」を提案し、層間互換性を確保する同時学習戦略により、逐次学習と比較して画質を大幅に向上させることを示しています。

Longan Wang, Yuang Shi, Wei Tsang Ooi2026-03-12💻 cs

CD-Raft: Reducing the Latency of Distributed Consensus in Cross-Domain Sites

本論文は、異ドメイン間のレイテンシ課題を解決し、TLA+ による形式仕様検証で強一貫性を保証するとともに、YCSB ベンチマークにおいてクラシックな Raft と比較して平均レイテンシを約 33%、99 パーセンタイルのテールレイテンシを約 49% 削減する分散合意プロトコル「CD-Raft」を提案したものである。

Yangyang Wang, Ziqian Cheng, Yucong Dong, Zichen Xu2026-03-12💻 cs

FP-Predictor - False Positive Prediction for Static Analysis Reports

この論文は、コードプロパティグラフを用いたグラフ畳み込みネットワーク（GCN）モデルを開発し、静的解析レポートの誤検知（False Positive）を高精度に予測することで、開発者の負担軽減とツールへの信頼性向上を実現したことを報告しています。

Tom Ohlmer, Michael Schlichtig, Eric Bodden2026-03-12💻 cs

PET-F2I: A Comprehensive Benchmark and Parameter-Efficient Fine-Tuning of LLMs for PET/CT Report Impression Generation

PET/CT 画像診断レポートの要約生成を目的とした大規模ベンチマーク「PET-F2I-41K」を構築し、臨床的に妥当な評価指標を導入してパラメータ効率型ファインチューニング手法を適用した結果、既存モデルを凌駕する高精度な生成モデル「PET-F2I-7B」を開発したことを報告する論文です。

Yuchen Liu, Wenbo Zhang, Liling Peng, Yichi Zhang, Yu Fu, Xin Guo, Chao Qu, Yuan Qi, Le Xue2026-03-12💻 cs

TacLoc: Global Tactile Localization on Objects from a Registration Perspective

本論文は、視覚が遮断された環境下での物体把持を可能にするため、事前学習モデルやレンダリングデータに依存せず、触覚センサーから得られる点群と法線ベクトルを用いたグラフ理論に基づく部分 - 全体登録手法「TacLoc」を提案し、YCB データセットおよび実世界物体での有効性を検証したものである。

Zirui Zhang, Boyang Zhang, Fumin Zhang, Huan Yin2026-03-12💻 cs

UniStitch: Unifying Semantic and Geometric Features for Image Stitching

この論文は、手動設計された幾何学的特徴とニューラルネットワークに基づく意味的特徴を、それぞれを2次元マップに変換するニューラルポイントトランスフォーマーと、信頼性に応じて動的に重み付けする適応型混合専門家モジュールによって統合する「UniStitch」という画期的な画像ステッチングフレームワークを提案し、既存の最先端手法を大幅に凌駕する性能を実現したことを示しています。

Yuan Mei, Lang Nie, Kang Liao, Yunqiu Xu, Chunyu Lin, Bin Xiao2026-03-12💻 cs

Safety-critical Control Under Partial Observability: Reach-Avoid POMDP meets Belief Space Control

この論文は、不確実性下での安全かつ目標指向の意思決定を可能にするため、目標到達、情報収集、安全性をモジュール化し、信念空間における制御リアプノフ関数と制御バリア関数を組み合わせた軽量な階層型制御アーキテクチャを提案し、その有効性をシミュレーションおよび宇宙ロボットプラットフォームで実証したものである。

Matti Vahs, Joris Verhagen, Jana Tumova2026-03-12💻 cs

R4-CGQA: Retrieval-based Vision Language Models for Computer Graphics Image Quality Assessment

本論文は、没入型コンピュータグラフィックス（CG）の品質評価における課題を解決するため、6 つの知覚次元に基づく大規模データセットと質問応答ベンチマークを構築し、視覚的に類似した画像の説明を検索して生成に活用する「R4-CGQA」という検索拡張生成フレームワークを提案し、既存の視覚言語モデルの CG 品質評価性能を大幅に向上させることを示しています。

Zhuangzi Li, Jian Jin, Shilv Cai, Weisi Lin2026-03-12💻 cs

Attribution as Retrieval: Model-Agnostic AI-Generated Image Attribution

この論文は、既存の手法が抱えるモデル依存性の限界を克服するため、AI 生成画像の帰属を分類問題ではなくインスタンス検索問題として定式化し、低ビット平面に基づく指紋生成と半教師あり学習を組み合わせたモデル非依存のフレームワーク「LIDA」を提案し、ゼロショットおよび少ショット設定において最先端の性能を達成することを示しています。

Hongsong Wang, Renxi Cheng, Chaolei Han, Jie Gui2026-03-12💻 cs

Need for Speed: Zero-Shot Depth Completion with Single-Step Diffusion

本論文では、拡散モデルの推論時の最適化コストを排除し、学習コストを最小化しながらリアルタイム制約下で効率的かつ頑健な深度補完を実現する、単一ステップの遅延融合フレームワーク「Marigold-SSD」を提案し、既存手法との効率性ギャップを大幅に縮小するとともに、ゼロショット性能とクロスドメイン汎化能力を実証しています。

Jakub Gregorek, Paraskevas Pegios, Nando Metzger, Konrad Schindler, Theodora Kontogianni, Lazaros Nalpantidis2026-03-12💻 cs

Distilling LLM Semantic Priors into Encoder-Only Multi-Talker ASR with Talker-Count Routing

この論文は、LLM の意味的事前知識をエンコーダに蒸着させ、話者数を予測して動的にデコード経路を選択する「Talker-Count Routing」を導入することで、LLM をデコーダとして使用せずとも高速かつ高精度なマルチトークア ASR を実現する新しいフレームワークを提案しています。

Hao Shi, Yusuke Fujita, Roman Koshkin, Mengjie Zhao, Yuan Gao, Lianbo Liu, Yui Sudo2026-03-12💻 cs

Exact Interpolation under Noise: A Reproducible Comparison of Clough-Tocher and Multiquadric RBF Surfaces

この論文は、Clough-Tocher 法と多二次関数 RBF 法を用いた多変数表面解析の再現性ある比較を通じて、ノイズのある観測データを単純に棄却するのではなく構造化して補間することで、熱力学プロセスシステムにおいて物理的に意味のある挙動を回復できることを示しています。

Mirkan Emir Sancak2026-03-12💻 cs

← 前へ次へ →