NLiPsCalib: An Efficient Calibration Framework for High-Fidelity 3D Reconstruction of Curved Visuotactile Sensors
本論文は、従来の較正が手間とコストを要していた湾曲視触覚センサーに対し、身近な物体との数回の接触だけで高精度な 3 次元再構成を可能にする効率的な較正フレームワーク「NLiPsCalib」と、その検証用センサー「NLiPsTac」を提案するものである。
2644 件の論文
本論文は、従来の較正が手間とコストを要していた湾曲視触覚センサーに対し、身近な物体との数回の接触だけで高精度な 3 次元再構成を可能にする効率的な較正フレームワーク「NLiPsCalib」と、その検証用センサー「NLiPsTac」を提案するものである。
この論文は、 Unreal Engine 5 を用いて生成され、136 種類の衛星モデルからなる大規模なマルチモーダルデータセット「SpaceSense-Bench」を提案し、宇宙機認識における小規模部品や未知ターゲットの認識といった課題を特定するとともに、大規模で多様なデータセットの重要性を実証したものです。
本論文は、マルチモーダル大規模言語モデルの細粒度視覚差異検出能力の欠如を明らかにする新たなベンチマーク「OddGridBench」を提案し、カリキュラム学習と距離認識型報酬を統合した強化学習フレームワーク「OddGrid-GRPO」によってその検出能力を大幅に向上させる手法を提示しています。
本論文は、LLM の静的な推論能力だけでなく、対戦環境における戦略的計画と迅速な意思決定のバランスを評価する新たなベンチマーク「STAR」を提案し、高度な推論モデルがリアルタイム環境では遅延により劣る一方で、高速なモデルが優位に立つという「戦略と実行のギャップ」を実証しています。
本論文は、分類タスクに特化した既存のテスト時適応手法の限界を克服し、ソースデータなしで画像回帰タスクの分布シフトに強靭に対応できるよう、サブ空間アライメントをブロックスペクトルマッチングに拡張した「予測スペクトル較正(PSC)」という新しいフレームワークを提案するものである。
この論文は、暗号空間における反復最適化を用いて、画像圧縮や処理に対する頑健性を大幅に向上させつつ、埋め込みの証明可能なセキュリティを維持する新しい画像ステガノグラフィフレームワークを提案し、その有効性を示しています。
本論文は、物理制約の違反に伴う不確実性を定量化し、脳梗塞の CT 灌流画像解析における精度と信頼性を向上させるために、証拠深層学習と物理情報ニューラルネットワークを統合した「EPPINN」という新しい枠組みを提案し、その有効性を検証したものである。
本論文は、既存の自己教師あり骨格ベース動作認識手法が抱える課題を解決するため、無限骨格データゲームの均衡定理に基づき多視点ミニマックス最適化と二重損失均衡オプティマイザを導入した「M3GCLR」を提案し、主要ベンチマークで最先端の性能を達成したことを報告しています。
本論文は、限られたアノテーションと大規模な画像を扱う乳腺撮影の分類タスクにおいて、事前学習済み基盤モデルの特徴量を凍結し、軽量なマルチインスタンス学習ヘッドのみを学習することで、計算コストを大幅に削減しつつ臨床規模で最先端の性能を達成する「MIL-PF」というスケーラブルなフレームワークを提案するものです。
本論文は、異なる視野や向きに対する頑健性を欠く既存の手法の問題を解決し、単一のモデルで卓越した性能を発揮する「SinGeo」というフレームワークを提案し、二重の識別学習とカリキュラム学習を導入することで、クロスビュー地理定位の分野において最先端の結果を達成したことを示しています。
本論文は、イベントカメラの時間的連続性を活用し、Visual Geometry Grounded Transformer(VGGT)から時空間および幾何学的な事前知識を蒸留する新たなフレームワーク「EventVGGT」を提案し、既存手法を大幅に上回る一貫性のある深度推定を実現するものである。
この論文は、拡散モデルの潜在空間融合とランダム基底メカニズムを活用し、既存のトレーニング不要なカバレス隠蔽法を凌駕する画質、多様性、耐ノイズ性、そしてステガノ分析への耐性を備えつつ、ユーザーごとのアクセス制御を可能にする新しいフレームワーク「MIDAS」を提案するものである。
ICDAR 2025 における複雑なレイアウトを持つ文書画像の機械翻訳コンペティションは、OCR 不要・OCR 利用の 2 つのトラックで 69 チームが参加し、大規模モデルが複雑な文書画像の翻訳において有望な新たなパラダイムを確立したことを示す結果を報告しています。
この論文は、YOLO 系オブジェクト検出器のニューラルアーキテクチャ探索における高コストな評価問題を解決するため、COCO-mini 上で学習した 1,500 個のアーキテクチャと、高性能領域に特化して自己進化するメカニズムにより精度を向上させた LightGBM 代理モデルを組み合わせた、初の YOLO 向け代理ベンチマーク「YOLO-NAS-Bench」を提案し、公式 YOLO バイアスを超えた高性能アーキテクチャの発見を実証しています。
本論文は、DiT-XL/2 の FLOPs の 50% 未満で同等の性能を達成し、さらに 4 GPU 環境でのトレーニングを可能にする「FCDM」と呼ばれる完全畳み込み拡散モデルを提案し、現代の畳み込み設計が拡散モデルのスケーリングにおいて効率的かつ競争力のある代替手段となり得ることを示しています。
この論文は、向き付き物体検出の課題を解決し、リアルタイム性と高精度を両立する初の検出トランスフォーマー「RiO-DETR」を提案し、主要なデータセットで新たな速度と精度のトレードオフを確立したことを報告しています。
この論文は、異なるドメインのレイアウト構造やラベル付けスタイルの差異を考慮し、記述知識を手がかりとしてドメイン固有のプロンプトを生成する「PromptDLA」という新しいドメイン認識型プロンプターを提案し、複数の主要なドキュメントレイアウト分析データセットにおいて最先端の性能を達成したことを示しています。
CIGPose は、視覚的コンテキストに起因する偽の相関を構造的因果モデルに基づいて特定し、予測不確実性を用いた因果介入モジュールと階層的グラフニューラルネットワークを組み合わせることで、解剖学的に妥当な全身ポーズ推定を実現し、COCO-WholeBody ベンチマークで新たな最先端性能を達成するフレームワークです。
この論文は、メタ学習による事前学習と、テスト時のデータ特性に応じた学習率や更新頻度を動的に調整するデータ適応型メカニズムを導入することで、分布シフト下における軌道予測の性能を大幅に向上させる手法「MetaDAT」を提案しています。
この論文は、認識の不完全さや物体カテゴリの時間的変化といった現実世界の課題に対処するため、新しい物体クラスが逐次導入される「オープンワールド運動予測」という新たな設定を提案し、擬似ラベリングと視覚言語モデル、そしてクエリ特徴量分散に基づくリプレイサンプリングを組み合わせたエンドツーエンドのクラス増分学習フレームワークを構築し、忘却を抑制しつつ新規クラスへの適応とゼロショット転送を実現したことを示しています。