Decoder-Free Distillation for Quantized Image Restoration
この論文は、エッジデバイス向けの画像復元タスクにおいて、FP32 自己蒸留、デコーダフリー蒸留、学習可能重み付け、および軽量な劣化ゲート機構を導入することで、量子化ノイズや容量の不一致といった課題を解決し、Int8 モデルで FP32 パフォーマンスの 96.5% を維持しつつ高速推論と高精度な物体検出を実現する「QDR」というフレームワークを提案しています。
6096 件の論文
この論文は、エッジデバイス向けの画像復元タスクにおいて、FP32 自己蒸留、デコーダフリー蒸留、学習可能重み付け、および軽量な劣化ゲート機構を導入することで、量子化ノイズや容量の不一致といった課題を解決し、Int8 モデルで FP32 パフォーマンスの 96.5% を維持しつつ高速推論と高精度な物体検出を実現する「QDR」というフレームワークを提案しています。
本論文は、低テクスチャ環境や急激な照明変化下でもロバストな推定を可能にするため、線分に対して専用の学習不要な記述子を導入し、エントロピー正則化付き最適輸送を用いた対応付けと信頼度に基づく適応重み付けを備えた新しいステレオ視覚慣性オドメトリシステム「OTPL-VIO」を提案するものである。
この論文は、参加型予算配分における「比例性の度合い」を初めて研究し、メソッド・オブ・イコール・シェアーズとフレーゲンの逐次ルールという 2 つの主要な手法について、理論的な厳密な境界値の導出と実データを用いた実験的検証を通じて、両者が定量的には同等の比例性を有することを示しています。
この論文は、風という不可視で時空間的に変化する力と複雑に変形する物体の相互作用を、物理情報に基づく微分可能なフレームワーク「DiffWind」を用いて動画から再構成・シミュレーションする手法を提案し、新しいデータセット「WD-Objects」も公開している。
本論文は、3D ガウススプラッティングを用いた SLAM において、各スプラットの外観分散を明示的に学習し、単一パスのラスタライゼーションで信頼性の高い領域に焦点を当てた追跡とマッピングを実現する「VarSplat」という不確実性意識型のシステムを提案し、実世界および合成データセットにおいて既存手法を上回るロバスト性と精度を達成したことを報告しています。
既存のモーションキャプチャモデルの精度を向上させるため、2D 足関節キーポイントから 3D 残差運動を推定する手法「FootMR」と、その評価用データセット「MOOF」を提案し、特に足部の微細な動きの再構成において最先端の手法を上回る性能を達成した論文です。
この論文は、4D レーダーの低密度な点群データから高精度な自動運転知覚を実現するため、局所的な詳細特徴と大域的な文脈情報を双経路アーキテクチャで融合する「DRIFT」というモデルを提案し、物体検出や自由道路推定において既存手法を上回る性能を示したことを述べています。
本論文は、手術動画の質問応答タスクにおいて言語的バイアスへの頑健性と時間的根拠の把握を両立させるため、低ランク適応(LoRA)の学習可能ブランチに軽量な時間的注意機構を組み込んだ新しいパラメータ効率的微調整手法「TemporalDoRA」を提案し、新たに作成したREAL-Colon-VQAデータセットなどを用いた実験でその有効性を実証しています。
本論文は、マルチターン人間-LLM 協調コード生成における「インタラクションスメル」という新たな問題領域を定義し、実世界データに基づく分類体系の確立、主要モデル間の分布分析、そしてグローバル不変性の抽出と事前品質監査を行うマルチエージェントフレームワーク「InCE」による効果的な軽減手法の提案を通じて、この課題を体系的に解明した研究である。
本論文は、離散ウェーブレット変換を用いた周波数帯域分解と条件付き拡散モデルを組み合わせた「TriFusion-SR」という新しいフレームワークを提案し、MRI、CT、PET といった 3 種類の医療画像の融合と超解像を同時に処理することで、既存手法の限界を克服し、画質と診断精度を大幅に向上させることを示しています。
本論文は、3D ガウススプラッティングのデータ圧縮とストリーミング配信の課題を解決するため、オクトリー構造と相互情報量強化メカニズムを導入し、保存容量を 45 倍削減しながら視覚品質を 10% 以上向上させるプログレッシブ符号化方式「ProGS」を提案するものである。
本論文は、既存のロボット操作軌跡を視覚的プロンプトで編集する「Robotic Scene Cloning(RSC)」を提案し、ゼロショット学習による実世界でのロボットタスク適応と汎化性能の向上を実現する手法を提示しています。
本論文は、3D ガウススプラッティングの大容量データ問題に対処するため、複数ユーザーの行動を学習する協調的ビューポート予測と深層強化学習に基づくビットレート適応を組み合わせた、高画質かつ効率的な volumetric シーンストリーミングシステム「GSStream」を提案し、その有効性を検証したものである。
本論文は、拡散モデルにおける高忠実度動画生成の課題を解決するため、フレーム全体を行列として処理する「Matrix Attention」を導入し、大規模な動きの捕捉と効率的な計算を両立する新しいアーキテクチャ「FrameDiT」を提案し、複数のベンチマークで最先端の性能を達成したことを報告しています。
この論文は、ランキングアルゴリズムのデータへの微小な変化に対する感度を評価する「局所安定性」という新たな指標を提案し、その計算の困難さを克服するための近似アルゴリズムと密な領域の検出手法を開発して、大規模な実験によりその有効性を検証したものである。
この論文は、一般的な制御フローグラフに適用可能な健全かつ効率的な「冪等バックスライス」の定式化と抽出アルゴリズムを提案し、これを用いて非連続な命令シーケンスをマージする疎なコードサイズ削減最適化を実現し、LLVM テストスイートにおいて最大 7.24% のコードサイズ削減を達成したことを報告しています。
この論文は、センサーからの観測データを用いて破壊モデルの状態(変位と位相場)をベイズ推論により更新する正則化されたアンサンブルカルマンフィルタ手法を提案し、その有効性を数値例で示すものである。
LLM の推論インフラにおけるリソース効率と SLO 維持を両立するため、推論サーバーの内部状態と密接に連携し、プロアクティブなスケール制御と断片化を考慮したスケールダウンを行う「WVA」という制御平面を提案し、従来の HPA と比較して実効スループットを 37% 向上させ、リクエスト失敗を 10 倍削減する効果を実証した。
本論文は、診断・計測・セグメンテーションの各タスクを専門とする複数のエージェントを動的に調整し、静止画解析から動画ストリームの構造化臨床レポート生成までを一貫して支援する、初めての包括的な胎児超音波画像・動画解析マルチエージェントシステム「FetalAgents」を提案し、その多施設外部評価における卓越した性能を実証しています。
この論文は、安全クリティカルな自律システムにおいて、データの鮮度制約に基づいてタスクのオフセットを最適化し、Just-in-Time 方式でデータ生成を調整することで、LET パラダイムの遅延や過剰サンプリングを排除しつつ、エンドツーエンドのデータ鮮度を保証し、かつグローバル EDF の 100% のスケジューラビリティを維持する新しいタスクベースのスケジューリング枠組みを提案しています。