calibfusion: Transformer-Based Differentiable Calibration for Radar-Camera Fusion Detection in Water-Surface Environments
本論文は、水面環境における特徴の欠如や干渉ノイズといった課題に対処するため、変換器(トランスフォーマー)を用いた微分可能な外パラメータ最適化を統合し、レーダーとカメラの融合検出精度を向上させる「CalibFusion」を提案するものである。
8400 件の論文
本論文は、水面環境における特徴の欠如や干渉ノイズといった課題に対処するため、変換器(トランスフォーマー)を用いた微分可能な外パラメータ最適化を統合し、レーダーとカメラの融合検出精度を向上させる「CalibFusion」を提案するものである。
本論文は、ERP 財務リスク検出におけるデータリーク問題を解消し、再構築された実験フレームワーク「ERP-RiskBench」とスタッキングアンサンブル学習を用いて、より信頼性の高い検出精度と解釈可能性を実現する手法を提案しています。
画像生成モデルで有効とされる意味ノイズ初期化が動画生成にも転用可能か検証した本研究は、統計的に有意な改善は見られなかったものの、時間的関連性の向上傾向が示唆されたことから、動画生成における初期化スキームの評価にはプロンプトレベルの対比較とノイズ空間の診断が重要であると結論付けています。
この論文は、長文の科学テキストから参照画像に基づくスタイル適応を可能にし、ネイティブな SVG 形式で完全な編集性を備えた科学図表を生成するエンドツーエンドシステム「AutoFigure-Edit」を提案するものです。
この論文は、限られたアノテーションデータ条件下でトウモロコシ、イネ、小麦の葉病を高精度に分類し、Grad-CAM による可視化で意思決定の透明性を確保する、XAI と少数ショット学習を統合したハイブリッド分類モデルを提案するものである。
本論文は、チャートの深層分析能力の向上に向けた課題として、多様な報酬信号やデータ間の競合を解消する並列相対方策最適化(PRPO)と、エラー注入に基づく客観的評価ベンチマーク(MCDR-Bench)を提案し、これらを通じてチャート深層分析のトレーニングと評価を体系的に改善する統合フレームワークを構築したことを示しています。
この論文は、ユーザーによる環境の編集可能性とマルチプレイヤー間の一貫性を確保するため、拡散ゲームエンジンにユーザー行動によって更新・参照される外部メモリを統合し、生成プロセスをメモリ・観測・ダイナミクスに分解する「MultiGen」という新しいアプローチを提案しています。
本論文は、画像内の視認性と視点推論を評価し、モデルが「見える/見えない」を判断するだけでなく、人間にも判断できない場合に棄権できる能力を検証する新しいベンチマーク「VB」を提案し、主要な大規模言語モデルの性能を比較評価したものである。
本論文は、マルチモーダル大規模言語モデルによる物語計画と動的メモリバンクを備えた制御モジュールを統合し、長期的な視覚的一貫性と物語の整合性を維持する「Narrative Weaver」を提案するとともに、関連タスクの初となる大規模データセット「EAVSD」を公開し、生成 AI による長編コンテンツ制作の可能性を拓いたことを述べています。
この論文は、放射線科医の視覚的検索プロセスを捉えた時間順の視線追跡データを「視線トークン」として VLM に導入し、医療画像の視覚的推論を人間のように順序立てて行うことで、MIMIC-EYE などのベンチマークにおいて最先端の性能とドメイン外での頑健性を達成した手法を提案しています。
本論文は、Syntax Guided Synthesis 技術と TSL(Temporal Stream Logic の有限接頭辞解釈)を組み合わせることで、ブール値抽象化の限界を超え、データ変換と時制仕様を同時に学習し、より頑健かつ効率的にリアクティブプログラムを合成する手法を提案しています。
本論文は、大規模なツール環境において小規模言語モデル(SLM)がコンテキストの制御と実行構造を学習し、ルブリックに基づく強化学微細調整を通じて、パラメータやコンテキスト制約が厳しい条件下でも最先端のエージェントに匹敵する性能を発揮できるようにする「ATLAS」というフレームワークを提案するものである。
本論文は、静止衛星からの補足データを用いて長期計画を策定し、搭載センサーのデータで短期計画を微調整する階層的計画手法を提案することで、従来の動的目標指定システムが直面する制約を克服し、特に標的が疎に分布する動的なシナリオにおいて観測効率を最大 41% 向上させることを示しています。
本論文は、タンパク質の配列と構造の情報を対照学習を用いて統合し、両者の埋め込み空間を一致させることで、クロスモーダル検索や機能予測などの下流タスクの性能向上とタンパク質の理解・設計への新たな洞察を提供する「ProtAlign」というフレームワークを提案しています。
この論文は、埋め込みアルゴリズムに依存せず画像の透かし有無を検出する新しいタスク「UWPD」を提案し、大規模データセット「UniFreq-100K」と、周波数帯域を動的に制御して透かし信号を抽出する「FSNet」モデルを開発することで、未知の透かしに対するゼロショット検出性能を大幅に向上させたことを示しています。
この論文は、人間の行動と環境要因の双方向フィードバック融合を活用して、室内の二酸化炭素と PM2.5 濃度を高精度かつ解釈可能に予測する新しいフレームワークを提案し、既存の手法を上回る性能を実証したものである。
本論文は、時系列基盤モデルが捉えた過去のパターンを予測特徴量として回帰モデルに注入する「FutureBoosting」という新しいハイブリッド AI 手法を提案し、電力価格予測の精度を大幅に向上させることを実証しています。
この論文は、事前学習済み言語モデルの層間に明示的な「安全ビット」を挿入するモジュール型アプローチ「Safe Transformer」を提案し、安全性判断の解釈性と手動制御を両立させながら、軽量な微調整のみで高い攻撃耐性を実現することを示しています。
この論文は、密度不変な観測エンコーディングと密度ランダム化トレーニング、および物理情報に基づく報酬設計を導入した強化学習アプローチを提案し、訓練時よりも高密度な混雑環境においても「凍結」や「衝突」を回避しつつ目標地点へ到達する汎用的なナビゲーションを実現するものです。
この論文は、ベイズ的不確実性の把握、公平性制約付き勾配ブースティング、シフト認識型融合戦略を統合した「Calibrated Credit Intelligence(CCI)」フレームワークを提案し、Home Credit のベンチマークにおいて、時間的分布のシフト下でも高い識別力、較正精度、公平性を同時に達成するcredit スコアリング手法を示しています。