WaLi: Can Pressure Sensors in HVAC Systems Capture Human Speech?
本論文は、HVAC システムに組み込まれた圧力センサーのデータから複雑値コンフォーマーなどの技術を用いて明瞭な音声まで復元する「WaLi」という新たなプライバシー脅威を提示し、その有効性と対策を議論するものである。
6336 件の論文
本論文は、HVAC システムに組み込まれた圧力センサーのデータから複雑値コンフォーマーなどの技術を用いて明瞭な音声まで復元する「WaLi」という新たなプライバシー脅威を提示し、その有効性と対策を議論するものである。
本論文は、サブ・ナイキストサンプリングと低ビット解像度を意図的に採用することで消費電力を 3.31 倍削減しつつ、モバイルプラットフォーム上でリアルタイムに動作する広帯域音声再構成手法「SUBARU」を提案し、ノイズ環境下での高品質な音声強調を実現する実践的なアプローチを提示しています。
本論文は、都市環境における障害物やトラフィックをコンピュータビジョンでリアルタイムに検知し、地上ユーザーとの見通し通信を最適化する自律型ドローン位置決めアルゴリズム「VTOPA」を提案し、シミュレーションによりスループット向上と遅延削減を実証したものである。
本論文は、事前学習された潜在拡散モデルとマルチモーダル理解モデルを活用し、対データなしで多様な画像劣化をゼロショットで統一復元する「LD-RPS」を提案し、既存手法を上回る性能を実証したものです。
本論文は、複数のデータセットをまたぐ汎用的な視覚的場所認識を実現するため、学習されたクエリを参照コードブックとして活用し、計算コストを大幅に増やさずに特徴集約の能力を向上させる「クエリベース適応集約(QAA)」を提案し、既存の単一データセット特化モデルと同等の性能を維持しながら多様なデータセット間でのバランスの取れた汎化性能を達成することを示しています。
本論文は、Projective Geometric Algebra(PGA)の幾何学的帰納バイアスをネットワーク構造に組み込んだハイブリッド拡散方策「hPGA-DP」を提案し、ロボット操作学習における訓練効率とタスク性能の大幅な向上を実証しています。
本論文は、センサー故障やプライバシー保護により生じる不完全なマルチモーダルデータの問題に対処するため、モダリティ組合せごとの共有情報と固有特徴を分離し、表現空間の分離性に基づいて動的に学習比率を調整する新しいパラメータ効率型学習フレームワーク「MCULoRA」を提案し、感情認識タスクにおいて既存手法を上回る性能を達成したことを示しています。
本論文は、状態空間モデルを活用した新しいディープスネークフレームワーク「Mamba Snake」を提案し、多スケールの構造的異質性や器官間の関係性を効果的にモデル化することで、医用画像の統一セグメンテーションにおいて最先端の手法を上回る性能を達成したことを示しています。
この論文は、特定の基準視点に依存せず入力順序に対して置換等価性を備えたニューラルネットワーク「」を提案し、カメラ姿勢推定や深度推定など多様な視覚幾何学タスクにおいて最先端の性能を達成することを示しています。
本論文は、台湾宇宙機関(TASA)の緊急付加価値製品(EVAP)を支援するため、Sentinel-2 と Formosat-5 画像を用いた主成分分析と信頼度指標に基づく弱教師あり学習により、ViT(Vision Transformer)ベースのモデルで災害被災域のセグメンテーション精度と信頼性を向上させるフレームワークを提案するものである。
この論文は、2018 年以降のマイクロサービス向け自動スケーリング手法を、インフラ、アーキテクチャ、スケーリング方法、最適化目標、行動モデルという 5 つの次元で分類・比較分析し、リソース効率と SLA 保証の両立を目指す包括的な調査と分類体系を提示するものである。
本論文は、バーストワークロード下での MoE 型 LLM 推論効率と SLO 遵守を両立させるため、複数の専門家の知識を統合する「united experts」と動的な brownout メカニズムを導入した新しい推論サービスフレームワーク「BrownoutServe」を提案し、vLLM と比較してスループットを最大 2.07 倍に向上させ、SLO 違反を 90.28% 削減する効果を実証したものである。
本論文は、大規模かつ混在環境におけるマイクロサービスクラスターで発生するリソース競合と干渉を、CPI(命令あたりのサイクル数)に基づく高精度な予測モデルを用いて検知・緩和し、応答時間を大幅に改善するオープンソースプラットフォーム「C-Koordinator」の設計と実証結果を報告するものである。
この論文は、従来の視覚触覚センサーの速度限界を突破し、ニューロモルフィックカメラとローラー機構を統合することで、航空機などの大型表面を高速かつ高精度に 3D 再構成する革新的な触覚センサーを開発したことを報告しています。
本論文は、モンティアーク(MontiArc)モデルを用いたコンポーネント・コネクタアーキテクチャの意味的差異分析に対し、動的記号実行(DSE)を適用する手法を提案し、その有効性とスケーラビリティの限界を評価したものである。
本論文は、マイクロ交通シミュレータの拡張性を維持しつつ、高レベル特徴量のみから現実的な LiDAR 検出を生成する代理モデル「MIDAR」を提案し、大規模な交通シミュレーションにおける自律走行車の知覚能力を効率的に強化する手法を提示しています。
Diabetic foot ulcer segmentation の課題である長距離依存性のモデル化と説明可能性を解決するため、Vision Transformer と U-Net を融合した TransUNet-GradCAM 手法を提案し、公開データセットおよび外部臨床データセットにおける高い汎化性能と臨床的有用性を検証しました。
この論文は、動画生成モデルにおける量子化の課題を解決し、Hessian に基づく重要データの選択とアテンションに基づくスパースなトークンの蒸留を導入することで、W4A6 量子化下でも損失なしで高い圧縮率と推論加速を実現する「SQ-VDiT」というポストトレーニング量子化フレームワークを提案しています。
SPEX は、古典的なスペクトル指標に基づいて土地被覆オブジェクトのスペクトル事前知識をテキスト属性として符号化した大規模言語モデル向けデータセット SPIE を構築し、マルチスペクトルリモートセンシング画像における高精度な土地被覆抽出と説明可能な予測を実現する初のビジョンランゲージモデルです。
本論文は、180 度を超える広角の魚眼画像を用いた 3D ガウススプラッティングの初評価を行い、160 度の視野角が最適な結果をもたらすことを示すとともに、SfM による初期化が困難な状況に対処するため、200 度を超える魚眼画像への初適用となる UniK3D を用いた深度ベースの初期化手法を提案し、その有効性を検証した。