Viewpoint-Agnostic Grasp Pipeline using VLM and Partial Observations
本論文は、視点を問わない部分観測条件下での頑健な把持を実現するため、自然言語指示に基づき視覚言語モデルと点雲補完技術を活用して安全な把持動作を生成するエンドツーエンドのパイプラインを提案し、実ロボットによる実験で既存手法を大幅に上回る成功率を達成したことを報告しています。
8709 件の論文
本論文は、視点を問わない部分観測条件下での頑健な把持を実現するため、自然言語指示に基づき視覚言語モデルと点雲補完技術を活用して安全な把持動作を生成するエンドツーエンドのパイプラインを提案し、実ロボットによる実験で既存手法を大幅に上回る成功率を達成したことを報告しています。
この論文は、生物学的な睡眠と記憶の再活性化に着想を得た「睡眠リプレイ統合(SRC)」という手法を提案し、教師あり再学習なしに人工ニューラルネットワークの過信問題を解決し、信頼性の高い確率推定を実現することを示しています。
本論文は、観光・ホスピタリティ分野における意思決定支援に焦点を当て、画像から得られる有用な情報を定量化する「情報性(Informativeness)」という新たな枠組みを提案し、これに基づいて構築された専用データセットを用いた評価により、最先端の視覚言語モデルがドメイン固有の微調整を経て初めて信頼性の高い意思決定支援が可能になることを明らかにしています。
本論文は、自律走行におけるエンドツーエンドの性能向上を目指し、従来のペアワイズ類似度ではなくマルチモーダル類似度テンソルとテンソル損失を導入することで、テキスト・画像・点雲を統一的な埋め込み空間に同時に整列させる「Contrastive Tensor Pre-training (CTP)」フレームワークを提案するものである。
この論文は、粒子フィルタリング(特に逐次モンテカルロ法)の理論的枠組みを用いて、言語モデル推論における並列サンプリング手法の精度とコストのトレードオフを厳密に分析し、その理論的限界と実証的な知見を明らかにしています。
本論文は、産業・医療・航空など多様な領域における微妙な視覚的差異の識別を評価する新たなベンチマーク「VLM-SubtleBench」を提案し、既存の VLM が人間のレベルに達するまでには、属性や状態などの細かな違いに対する推論能力において依然として大きな課題が残っていることを明らかにしています。
この論文は、多様な農家の事情に合わせた意思決定を支援するため、AI 気象予測モデルと「変化する農家の期待」を反映した統計モデルを融合させた確率的なモンスーン予報システムを開発し、2025 年にインドの 3800 万人の農家に展開して効果を実証したことを報告しています。
この論文は、学習インターフェースの進化を制御する構造モデル(SMGI)を提案し、その数学的枠組みを通じて従来の学習手法を包含する一般人工知能の理論的基礎と一般化保証を確立するものである。
本論文は、LLM エージェントと RAG、およびツールチェインを統合した「LeJOT-AutoML」フレームワークを提案し、Databricks 環境におけるジョブ実行時間の予測精度向上と特徴量エンジニアリングの自動化を実現することで、クラウドコストを約 19% 削減することを示しています。
本論文は、既知クラスと未知クラスの両方を効果的に活用し、追加のオプセット検出器を必要としない統合フレームワーク「EOAL」を提案し、既存の手法よりも高い精度と効率性でオープンセット能動学習を実現するものである。
本論文は、モンテカルロドロップアウト、変分フィードフォワード層、および確率的アテンションという 3 つの不確実性メカニズムを統合したベイズ変換器(BT)を提案し、極端な気象条件下でも優れた較正と不確実性推定を実現することで、スマートグリッドの確率的負荷予測において最先端の性能を達成したことを報告しています。
この論文は、大規模なナビゲーターと軽量なドライバーを分離することで、推論能力と運動計画の両立、学習コストの削減、そして解釈性の向上を実現し、nuScenes ベンチマークで既存の VLM ベースラインを上回る自律運転フレームワーク「NaviDriveVLM」を提案しています。
本論文は、実体型ビジョン・言語・アクション(VLA)モデルの推論オーバーヘッドを削減するため、時間的ダイナミクスに敏感なビット幅の動的割り当てを行う新しい量子化フレームワーク「DyQ-VLA」を提案し、メモリ使用量を約 30.9% に削減しながら性能を 99.5% 維持し、シミュレーションおよび実世界での高速化を実現したことを報告しています。
本論文は、リレーショナルデータベースにおける不均衡データ問題に初めて着目し、関係性ごとのゲート制御と関係性ガイドの少数派合成を用いて不均衡なエンティティ分類を改善する深層学習手法「Rel-MOSS」を提案し、既存手法を上回る性能を実証したものである。
この論文は、ソースとターゲットのダイナミクスに関するサイド情報(特徴モーメントの境界、分布距離、密度比など)を制約付き推定に統合して不確実性集合を構築するフレームワークを提案し、環境の大きなシフト下でも過度に保守的にならない頑健な転移学習を実現し、サンプル効率と目標ドメインでの性能を向上させることを示しています。
この論文は、医療機関における部門間データ共有の課題を解決し、HIPAA などの規制を遵守しながら統計的開示を未然に防ぐため、SQL メトリクスの構文と意味的特徴を CodeBERT と XGBoost を用いて分析し、事前実行段階でリスクスコアと説明可能な警告を生成する AI 駆動型のガバナンスフレームワークを提案するものである。
この論文は、台風やパンデミックなどの大規模社会イベント下での人間移動を生成する際、既存の手法が抱えるイベント注釈付きデータセットの欠如と習慣的パターンとイベント制約の競合を解決するため、初めてイベント注釈付きデータセットを構築し、Fuzzy-Trace 理論に基づく自己整合型 LLM フレームワーク「ELLMob」を提案するものです。
この論文は、強化学習を用いて任意の結び目を単純化するパイプラインを開発し、極めて複雑なアンノット図やのような結び目に対しても、そのアンノッティング数を推定する新たな手法を提案している。
この論文は、物理法則をアーキテクチャに直接組み込んだ軽量ニューラルネットワーク「PSTNet」を提案し、限られた計算リソースを持つ航空機のオンボードシステムにおいて、従来の手法や大規模モデルよりも効率的かつ高精度に大気乱流を推定できることを実証しています。
高次元制約付き最適化問題の次元の呪いを克服し、制約ペナルティ付き代理モデルの微分可能な地形を活用して局所探索と探索を交互に行う「局所制約ベイズ最適化(LCBO)」を提案し、その収束性の理論的保証と 100 次元までのベンチマークにおける最先端手法を上回る性能を実証した。