Low-rank Orthogonal Subspace Intervention for Generalizable Face Forgery Detection
本論文は、顔偽造検出における汎化性能の向上を目指し、因果表現学習の観点から「低ランクの誤ったバイアス」を低ランク部分空間として特定し、その直交補空間を学習することで偽造痕跡に特化した検出器 SeLop を提案し、極めて少ない学習パラメータで最先端の性能を実現したことを報告しています。
6059 件の論文
本論文は、顔偽造検出における汎化性能の向上を目指し、因果表現学習の観点から「低ランクの誤ったバイアス」を低ランク部分空間として特定し、その直交補空間を学習することで偽造痕跡に特化した検出器 SeLop を提案し、極めて少ない学習パラメータで最先端の性能を実現したことを報告しています。
この論文は、GDPR に基づくプライバシー・バイ・デザイン(PbD)の実装において、組織の目標に合致する要件工学手法を評価するための「目標中心アプローチ」を提案し、プロセス特性だけでなく組織目標に基づいた評価の重要性を指摘するものである。
本論文は、無線秘匿通信の厳格な検出理論制約下での LLM 能力を評価する新たなベンチマーク「CovertComBench」を提案し、概念理解やコード生成では高い性能を示すものの、セキュリティ保証に必要な高度な数学的導出においては大幅な性能不足があることを明らかにし、信頼性の高い無線 AI システム構築には外部ツールの活用が不可欠であると結論付けています。
この論文は、背景の不均一性や標的の小ささなどの課題に直面する極地環境におけるシカ(トナカイ)の監視を目的として、ラベル付けされたデータが限られている状況でも高精度な検出と個体数推定を可能にする弱教師ありパッチレベルの事前学習フレームワーク「HerdNet」を提案し、その有効性を実証したものである。
この論文は、拡散モデルや自己回帰モデルなど多様な生成モデルが共有する最終的なアーキテクチャ成分を悪用して実画像を「汚染」し、その特徴を学習させることで、未見の生成モデルに対しても高い汎化性能(平均精度 98.83%)を実現する AI 生成画像検出手法を提案しています。
本論文は、推論過程で参照bounding boxの明示を強制し、大域・局所キャプションとの整合性を報酬として活用する強化学習フレームワーク「RegionReasoner」と、それを評価するための新しいベンチマーク「RegionDial-Bench」を提案し、検出・セグメンテーションタスクにおける多段階視覚推論の精度と空間的根拠付けを大幅に向上させることを示しています。
本論文は、Rényi 微分プライバシー(RDP)プロファイルを-微分プライバシーに変換する際、単一次数の RDP プライバシー領域の交差に基づく変換則が、すべての有効な RDP プロファイルと第 1 種誤り率に対して最適であることを証明し、RDP 保証のみから導き出せるプライバシーの限界を確立しました。
この論文は、長期動画生成におけるエラー蓄積の問題を、トレーニング不要で初期フレームを基準にサンプリング経路を補正する「Test-Time Correction(TTC)」という手法により解決し、既存のテスト時間最適化法よりも安定した高品質な 30 秒動画生成を実現することを提案しています。
この論文は、生物学的な蝶の飛行力学を模倣し、26 グラムの軽量で柔軟な構造を持つ自律制御可能なロボット「AirPulse」を開発することで、従来のドローンでは困難とされていた低周波・大振幅の羽ばたきによる振動環境下での安定した飛行を実現したことを報告しています。
この論文は、情報理論的観点からマルチモーダル学習におけるモダリティ間の競合を分析し、特徴とラベル間の総相関を最大化する新たな手法「TCMax」を提案することで、既存の手法を上回る分類性能を実現したことを示しています。
この論文は、ACL アンソロジーに掲載された LGBTQIA+ コミュニティと自然言語処理(NLP)の関係を扱った研究を体系的にレビューし、現状の偏りや課題を指摘するとともに、より公正で包括的な NLP 技術の実現に向けた将来の研究方向性と行動を呼びかける批判的調査である。
この論文は、レコード、定義、継承という 3 つの原始概念に基づき、継承を集合の和としてモデル化することで多重継承の線形化問題を構造的に解消し、 計算よりも表現力に優れた宣言的プログラミングの基礎となる「継承計算」を提唱しています。
この論文は、学習時間や対戦相手の合理性に関する仮定を排し、事前学習済みポリシーとゲーム内適応ルールを組み合わせたメタ戦略の枠組みを設計・評価することで、テスト時の制約下におけるアルゴリズム的談合の発生可能性と戦略的関係を明らかにするものです。
この論文は、異なる動作インスタンス間の時間的整合性を考慮した空間 VQ-VAE とマスク付きトランスフォーマー、および運動学的制約ブロックを導入することで、物理的に妥当で一貫性のあるテキストからモーションへの生成を実現し、HumanML3D や KIT-ML において最先端の性能を達成する TCA-T2M というフレームワークを提案しています。
本論文は、クラス共有 LoRA と画像固有 LoRA を組み合わせ、セマンティックなボスト手法とディリクレ分布に基づく混合生成を採用することで、データ不足領域において多様性と詳細さを両立した合成データを生成し、下流タスクの分類精度を向上させる「ChimeraLoRA」を提案するものである。
本論文は、文書偽造検出のゼロショットベンチマーク「DOCFORGE-BENCH」を提案し、既存手法が事前学習済み重みのままでは閾値の較正失敗により実用できないことを示し、再学習ではなく閾値の適応が実運用におけるボトルネックの解決鍵であることを明らかにしています。
本論文は、RGB と深度の両モダリティ間の分布の不一致と最適化の偏りを解消する「異種二重パッチ最適化スキーム」と「勾配レベルのモダリティバランス戦略」を備えたマルチモーダル敵対的品質ポリシー(MAQP)を提案し、人間とロボットの相互作用における安全な把持を実現するものである。
本論文は、 が約 35.31 より大きい場合の ノルムにおける格子の被覆半径問題()が、特定の近似因子で -困難であることを初めて証明し、Manurangsi による ノルムでの結果を拡張したものである。
Uber Eats は、Qwen2 ベースの双塔モデルを大規模なクエリ - ドキュメント相互作用データで微調整し、Matryoshka 表現学習や多様な損失関数を活用して、店舗・料理・小売品といった多言語・多垂直分野にまたがる統合セマンティック検索システムを構築し、複数の市場で基線モデルを上回るリコール性能を達成した。
本論文は、FPGA 上の浮動小数点演算の効率化を目指し、キャリーフリーの剰余演算と軽量な指数スケーリングを組み合わせ、厳密な誤差保証と高いスループットを実現する「ハイブリッド剰余浮動数値アーキテクチャ(HRFNA)」を提案し、その数学的基礎、FPGA 実装、および数値的安定性を検証したものである。