Training-Free Coverless Multi-Image Steganography with Access Control
この論文は、拡散モデルの潜在空間融合とランダム基底メカニズムを活用し、既存のトレーニング不要なカバレス隠蔽法を凌駕する画質、多様性、耐ノイズ性、そしてステガノ分析への耐性を備えつつ、ユーザーごとのアクセス制御を可能にする新しいフレームワーク「MIDAS」を提案するものである。
4004 件の論文
この論文は、拡散モデルの潜在空間融合とランダム基底メカニズムを活用し、既存のトレーニング不要なカバレス隠蔽法を凌駕する画質、多様性、耐ノイズ性、そしてステガノ分析への耐性を備えつつ、ユーザーごとのアクセス制御を可能にする新しいフレームワーク「MIDAS」を提案するものである。
本論文は、サイクリングや航空、海事追跡などの実世界のユースケースを反映し、スケーラビリティや設定の影響、プラットフォーム間の性能比較を含む包括的な評価を可能にする、オープンソースのアプリケーション中心時空間データベースベンチマークスイート「GeoBenchr」を提案するものである。
本論文は、視覚情報を摩擦の事前知識として活用し、S4 モデルで動的残差を補正するハイブリッド手法を提案することで、自律レーシングにおけるタイヤ動力学の同定精度と冷間起動時の収束速度を大幅に向上させることを示しています。
この論文は、YOLO 系オブジェクト検出器のニューラルアーキテクチャ探索における高コストな評価問題を解決するため、COCO-mini 上で学習した 1,500 個のアーキテクチャと、高性能領域に特化して自己進化するメカニズムにより精度を向上させた LightGBM 代理モデルを組み合わせた、初の YOLO 向け代理ベンチマーク「YOLO-NAS-Bench」を提案し、公式 YOLO バイアスを超えた高性能アーキテクチャの発見を実証しています。
この論文は、向き付き物体検出の課題を解決し、リアルタイム性と高精度を両立する初の検出トランスフォーマー「RiO-DETR」を提案し、主要なデータセットで新たな速度と精度のトレードオフを確立したことを報告しています。
本論文は、ブールテンソルネットワークの複雑性二分定理を統合する包括的な枠組みを提案し、未解決問題が複素数上の 2 次元行列で構成される有限群として分類され、その 9 つのケースについて行列形式の簡略化や四元数部分群の障壁、循環群の場合の進展と解決を論じている。
CIGPose は、視覚的コンテキストに起因する偽の相関を構造的因果モデルに基づいて特定し、予測不確実性を用いた因果介入モジュールと階層的グラフニューラルネットワークを組み合わせることで、解剖学的に妥当な全身ポーズ推定を実現し、COCO-WholeBody ベンチマークで新たな最先端性能を達成するフレームワークです。
この論文は、メタ学習による事前学習と、テスト時のデータ特性に応じた学習率や更新頻度を動的に調整するデータ適応型メカニズムを導入することで、分布シフト下における軌道予測の性能を大幅に向上させる手法「MetaDAT」を提案しています。
この論文は、WebAssembly モジュールにおけるバッファオーバーフローなどのバイナリ脆弱性が、SQL インジェクションや XS-Leaks といった Web 固有のセキュリティ侵害を引き起こし、既存の防御策を無効化する可能性を示し、そのリスクを軽減するためのベストプラクティスを提案しています。
この論文は、人工生命の分野における Fontana と Buss の計算モデル「AlChemy」を一般化し、圏論を用いて代数的人工化学の相互作用コンポーネントに動的な性質を与える関数を構築し、代数と力学の側面を結びつける枠組みを提案するものである。
本論文は、医療画像診断における単一ビュー内の異常間の依存関係と複数ビュー間の動的変化を同時にモデル化し、欠損データにも頑健な新しいグラフベースの学習フレームワーク「GIIM」を提案し、その有効性を CT、MRI、マンモグラフィーなど多様な画像モダリティで実証したものである。
この論文は、拡散モデルの出力に対する知的財産保護の課題に対し、ノイズの構造パターンに透かし情報を符号化し、かつノイズ要素の位置をランダム化することで、既存手法の弱点であった頑健性と生成多様性の両立を実現する「ShapeMark」という新しい透かし手法を提案しています。
本論文は、複雑な 3 次元表面の包括的なカバレッジと SE(3) 制約の厳密な維持を両立させるため、事前条件付き SE(3) スティーン変分勾配降下法を用いた新しいサンプリングベースの軌道最適化手法を提案し、シミュレーションおよび実機実験において既存手法を上回る性能を実証しています。
この論文は、可微分制御バリア関数に基づく安全シールドや適応的衝突再生メカニズムを導入した強化学習フレームワーク「SEA-Nav」を提案し、実世界における複雑で密な障害物環境での四足歩行ロボットの安全かつ俊敏なナビゲーションを、わずか数分間のトレーニング時間で実現したことを報告しています。
既存の手術室シーングラフが抱える構造的な限界を克服するため、本論文は、手術室の複雑な多様体幾何学と高次関係を本質的に保持する新しいトポロジカルな表現「TopoOR」を提案し、多様なモダリティを統合した単一の潜在空間に落とし込むことなく、滅菌違反検出やロボット動作予測などの安全上重要な推論において従来の手法を上回る性能を実現することを示しています。
この論文は、技術環境の変化やスキル要件の進化に伴い需要が高まる専門職向けソフトウェア工学教育において、要件工学コースを効果的に統合するための基本原則と、カリキュラム開発における経験に基づいた体系的なアプローチ(コース内容のマッピングに焦点を当てた手法)を報告するものである。
本論文は、19 世紀の複雑な二言語レイアウトと劣化したポリトニック文字を特徴とする『パトロロギア・グラエカ』の未デジタル化巻を対象に、YOLO と CRNN を組み合わせた専用パイプラインにより高精度な OCR を実現し、約 600 万トークンの注釈付きコーパスをオープンリリースするとともに、ノイズの多いポリトニック・ギリシャ語の OCR における新たなベンチマークを確立したことを報告するものである。
本論文は、地球観測における視覚言語モデル(VLM)の性能を包括的に評価するための新しいベンチマーク「OmniEarth」を提案し、知覚・推論・頑健性の 3 つの次元で 28 のタスクを定義し、既存モデルが地理空間的に複雑なタスクにおいて依然として課題を抱えていることを示しています。
本論文は、視覚オブジェクトとテキストエンティティ間の関係抽出タスク(MORE)において、既存手法の限界を克服し、教師あり微調整(SFT)による高品質な段階的推論データセットの構築と、グループ相対方策最適化(GRPO)を用いた強化学習を組み合わせることで、大規模視覚言語モデル(LVLM)の推論能力を飛躍的に向上させ、最先端の性能を達成した「MORE-R1」を提案するものです。
本論文は、視覚トークンの冗長性を削減しつつ本質的な情報を保持するために、意味的クラスタリングとグループ内非最大値抑制を組み合わせたトレーニング不要の手法「PruneSID」を提案し、LLaVA シリーズなど多様な VLM において既存手法を上回る高精度と高速推論を実現したことを報告するものです。