cs 件の論文 | Gist.Science

WaLi: Can Pressure Sensors in HVAC Systems Capture Human Speech?

本論文は、HVAC システムに組み込まれた圧力センサーのデータから複雑値コンフォーマーなどの技術を用いて明瞭な音声まで復元する「WaLi」という新たなプライバシー脅威を提示し、その有効性と対策を議論するものである。

Tarikul Islam Tamiti, Biraj Joshi, Rida Hasan, Anomadarshi Barua2026-03-10💻 cs

SUBARU: A Practical Approach to Power Saving in Hearables Using SUB-Nyquist Audio Resolution Upsampling

本論文は、サブ・ナイキストサンプリングと低ビット解像度を意図的に採用することで消費電力を 3.31 倍削減しつつ、モバイルプラットフォーム上でリアルタイムに動作する広帯域音声再構成手法「SUBARU」を提案し、ノイズ環境下での高品質な音声強調を実現する実践的なアプローチを提示しています。

Tarikul Islam Tamiti, Sajid Fardin Dipto, Luke Benjamin Baja-Ricketts, David C Vergano, Anomadarshi Barua2026-03-10💻 cs

Autonomous Vision-Aided UAV Positioning for Obstacle-Aware Wireless Connectivity

本論文は、都市環境における障害物やトラフィックをコンピュータビジョンでリアルタイムに検知し、地上ユーザーとの見通し通信を最適化する自律型ドローン位置決めアルゴリズム「VTOPA」を提案し、シミュレーションによりスループット向上と遅延削減を実証したものである。

Kamran Shafafi, Manuel Ricardo, Rui Campos2026-03-10💻 cs

LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling

本論文は、事前学習された潜在拡散モデルとマルチモーダル理解モデルを活用し、対データなしで多様な画像劣化をゼロショットで統一復元する「LD-RPS」を提案し、既存手法を上回る性能を実証したものです。

Huaqiu Li, Yong Wang, Tongwen Huang, Hailang Huang, Haoqian Wang, Xiangxiang Chu2026-03-10💻 cs

Query-Based Adaptive Aggregation for Multi-Dataset Joint Training Toward Universal Visual Place Recognition

本論文は、複数のデータセットをまたぐ汎用的な視覚的場所認識を実現するため、学習されたクエリを参照コードブックとして活用し、計算コストを大幅に増やさずに特徴集約の能力を向上させる「クエリベース適応集約（QAA）」を提案し、既存の単一データセット特化モデルと同等の性能を維持しながら多様なデータセット間でのバランスの取れた汎化性能を達成することを示しています。

Jiuhong Xiao, Yang Zhou, Giuseppe Loianno2026-03-10💻 cs

Hybrid Diffusion Policies with Projective Geometric Algebra for Efficient Robot Manipulation Learning

本論文は、Projective Geometric Algebra（PGA）の幾何学的帰納バイアスをネットワーク構造に組み込んだハイブリッド拡散方策「hPGA-DP」を提案し、ロボット操作学習における訓練効率とタスク性能の大幅な向上を実証しています。

Xiatao Sun, Yuxuan Wang, Shuo Yang, Yinxing Chen, Daniel Rakita2026-03-10💻 cs

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

本論文は、センサー故障やプライバシー保護により生じる不完全なマルチモーダルデータの問題に対処するため、モダリティ組合せごとの共有情報と固有特徴を分離し、表現空間の分離性に基づいて動的に学習比率を調整する新しいパラメータ効率型学習フレームワーク「MCULoRA」を提案し、感情認識タスクにおいて既存手法を上回る性能を達成したことを示しています。

Xinkui Zhao, Jinsong Shu, Yangyang Wu, Guanjie Cheng, Zihe Liu, Naibo Wang, Shuiguang Deng, Zhongle Xie, Jianwei Yin2026-03-10💻 cs

Unified Medical Image Segmentation with State Space Modeling Snake

本論文は、状態空間モデルを活用した新しいディープスネークフレームワーク「Mamba Snake」を提案し、多スケールの構造的異質性や器官間の関係性を効果的にモデル化することで、医用画像の統一セグメンテーションにおいて最先端の手法を上回る性能を達成したことを示しています。

Ruicheng Zhang, Haowei Guo, Kanghui Tian, Jun Zhou, Mingliang Yan, Zeyu Zhang, Shen Zhao2026-03-10💻 cs

$\pi^3$ : Permutation-Equivariant Visual Geometry Learning

この論文は、特定の基準視点に依存せず入力順序に対して置換等価性を備えたニューラルネットワーク「 $π^3$ 」を提案し、カメラ姿勢推定や深度推定など多様な視覚幾何学タスクにおいて最先端の性能を達成することを示しています。

Yifan Wang, Jianjun Zhou, Haoyi Zhu, Wenzheng Chang, Yang Zhou, Zizun Li, Junyi Chen, Jiangmiao Pang, Chunhua Shen, Tong He2026-03-10💻 cs

Post-Disaster Affected Area Segmentation with a Vision Transformer (ViT)-based EVAP Model using Sentinel-2 and Formosat-5 Imagery

本論文は、台湾宇宙機関（TASA）の緊急付加価値製品（EVAP）を支援するため、Sentinel-2 と Formosat-5 画像を用いた主成分分析と信頼度指標に基づく弱教師あり学習により、ViT（Vision Transformer）ベースのモデルで災害被災域のセグメンテーション精度と信頼性を向上させるフレームワークを提案するものである。

Yi-Shan Chu, Hsuan-Cheng Wei2026-03-10💻 cs

Auto-scaling Approaches for Microservice Applications: A Survey and Taxonomy

この論文は、2018 年以降のマイクロサービス向け自動スケーリング手法を、インフラ、アーキテクチャ、スケーリング方法、最適化目標、行動モデルという 5 つの次元で分類・比較分析し、リソース効率と SLA 保証の両立を目指す包括的な調査と分類体系を提示するものである。

Minxian Xu, Junhan Liao, Linfeng Wen, Huaming Wu, Kejiang Ye, Rajkumar Buyya, Chengzhong Xu2026-03-10💻 cs

BrownoutServe: SLO-Aware Inference Serving under Bursty Workloads for MoE-based LLMs

本論文は、バーストワークロード下での MoE 型 LLM 推論効率と SLO 遵守を両立させるため、複数の専門家の知識を統合する「united experts」と動的な brownout メカニズムを導入した新しい推論サービスフレームワーク「BrownoutServe」を提案し、vLLM と比較してスループットを最大 2.07 倍に向上させ、SLO 違反を 90.28% 削減する効果を実証したものである。

Jianmin Hu, Minxian Xu, Kejiang Ye + 1 more2026-03-10💻 cs

C-Koordinator: Interference-aware Management for Large-scale and Co-located Microservice Clusters

本論文は、大規模かつ混在環境におけるマイクロサービスクラスターで発生するリソース競合と干渉を、CPI（命令あたりのサイクル数）に基づく高精度な予測モデルを用いて検知・緩和し、応答時間を大幅に改善するオープンソースプラットフォーム「C-Koordinator」の設計と実証結果を報告するものである。

Shengye Song, Minxian Xu, Zuowei Zhang + 5 more2026-03-10💻 cs

They See Me Rolling: High-Speed Event Vision-Based Tactile Roller Sensor for Large Surface Inspection

この論文は、従来の視覚触覚センサーの速度限界を突破し、ニューロモルフィックカメラとローラー機構を統合することで、航空機などの大型表面を高速かつ高精度に 3D 再構成する革新的な触覚センサーを開発したことを報告しています。

Akram Khairi, Hussain Sajwani, Abdallah Mohammad Alkilany, Laith AbuAssi, Mohamad Halwani, Islam Mohamed Zaid, Ahmed Awadalla, Dewald Swart, Abdulla Ayyad, Yahya Zweiri2026-03-10💻 cs

Dynamic Symbolic Execution for Semantic Difference Analysis of Component and Connector Architectures

本論文は、モンティアーク（MontiArc）モデルを用いたコンポーネント・コネクタアーキテクチャの意味的差異分析に対し、動的記号実行（DSE）を適用する手法を提案し、その有効性とスケーラビリティの限界を評価したものである。

Johanna Grahl, Bernhard Rumpe, Max Stachon, Sebastian Stüber2026-03-10💻 cs

Empowering Microscopic Traffic Simulators with Realistic Perception using Surrogate Sensor Models

本論文は、マイクロ交通シミュレータの拡張性を維持しつつ、高レベル特徴量のみから現実的な LiDAR 検出を生成する代理モデル「MIDAR」を提案し、大規模な交通シミュレーションにおける自律走行車の知覚能力を効率的に強化する手法を提示しています。

Tianheng Zhu, Yiheng Feng2026-03-10💻 cs

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

Diabetic foot ulcer segmentation の課題である長距離依存性のモデル化と説明可能性を解決するため、Vision Transformer と U-Net を融合した TransUNet-GradCAM 手法を提案し、公開データセットおよび外部臨床データセットにおける高い汎化性能と臨床的有用性を検証しました。

Akwasi Asare, Mary Sagoe, Justice Williams Asare, Stephen Edward Moore2026-03-10💻 cs

← 前へ次へ →

cs

WaLi: Can Pressure Sensors in HVAC Systems Capture Human Speech?

SUBARU: A Practical Approach to Power Saving in Hearables Using SUB-Nyquist Audio Resolution Upsampling

Autonomous Vision-Aided UAV Positioning for Obstacle-Aware Wireless Connectivity

LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling

Query-Based Adaptive Aggregation for Multi-Dataset Joint Training Toward Universal Visual Place Recognition

Hybrid Diffusion Policies with Projective Geometric Algebra for Efficient Robot Manipulation Learning

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

Unified Medical Image Segmentation with State Space Modeling Snake

$\pi^3$ : Permutation-Equivariant Visual Geometry Learning

Post-Disaster Affected Area Segmentation with a Vision Transformer (ViT)-based EVAP Model using Sentinel-2 and Formosat-5 Imagery

Auto-scaling Approaches for Microservice Applications: A Survey and Taxonomy

BrownoutServe: SLO-Aware Inference Serving under Bursty Workloads for MoE-based LLMs

C-Koordinator: Interference-aware Management for Large-scale and Co-located Microservice Clusters

They See Me Rolling: High-Speed Event Vision-Based Tactile Roller Sensor for Large Surface Inspection

Dynamic Symbolic Execution for Semantic Difference Analysis of Component and Connector Architectures

Empowering Microscopic Traffic Simulators with Realistic Perception using Surrogate Sensor Models

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

S $^2$ Q-VDiT: Accurate Quantized Video Diffusion Transformer with Salient Data and Sparse Token Distillation

SPEX: A Vision-Language Model for Land Cover Extraction on Spectral Remote Sensing Images

3D Gaussian Splatting with Fisheye Images: Field of View Analysis and Depth-Based Initialization

cs

WaLi: Can Pressure Sensors in HVAC Systems Capture Human Speech?

SUBARU: A Practical Approach to Power Saving in Hearables Using SUB-Nyquist Audio Resolution Upsampling

Autonomous Vision-Aided UAV Positioning for Obstacle-Aware Wireless Connectivity

LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling

Query-Based Adaptive Aggregation for Multi-Dataset Joint Training Toward Universal Visual Place Recognition

Hybrid Diffusion Policies with Projective Geometric Algebra for Efficient Robot Manipulation Learning

A Robust Incomplete Multimodal Low-Rank Adaptation Approach for Emotion Recognition

Unified Medical Image Segmentation with State Space Modeling Snake

π3\pi^3π3: Permutation-Equivariant Visual Geometry Learning

Post-Disaster Affected Area Segmentation with a Vision Transformer (ViT)-based EVAP Model using Sentinel-2 and Formosat-5 Imagery

Auto-scaling Approaches for Microservice Applications: A Survey and Taxonomy

BrownoutServe: SLO-Aware Inference Serving under Bursty Workloads for MoE-based LLMs

C-Koordinator: Interference-aware Management for Large-scale and Co-located Microservice Clusters

They See Me Rolling: High-Speed Event Vision-Based Tactile Roller Sensor for Large Surface Inspection

Dynamic Symbolic Execution for Semantic Difference Analysis of Component and Connector Architectures

Empowering Microscopic Traffic Simulators with Realistic Perception using Surrogate Sensor Models

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

S2^22Q-VDiT: Accurate Quantized Video Diffusion Transformer with Salient Data and Sparse Token Distillation

SPEX: A Vision-Language Model for Land Cover Extraction on Spectral Remote Sensing Images

3D Gaussian Splatting with Fisheye Images: Field of View Analysis and Depth-Based Initialization

$\pi^3$ : Permutation-Equivariant Visual Geometry Learning

S $^2$ Q-VDiT: Accurate Quantized Video Diffusion Transformer with Salient Data and Sparse Token Distillation