Catalogue Grounded Multimodal Attribution for Museum Video under Resource and Regulatory Constraints
本論文は、リソースや規制の制約下で美術館の動画アーカイブの検索性を向上させるため、既存の作品データベースに基づき、ローカルで展開可能な動画言語モデルを用いて作品の要約、カタログ記述の生成、および保守的な類似性マッチングによる作品特定を行う自動化パイプラインを提案するものである。
3612 件の論文
本論文は、リソースや規制の制約下で美術館の動画アーカイブの検索性を向上させるため、既存の作品データベースに基づき、ローカルで展開可能な動画言語モデルを用いて作品の要約、カタログ記述の生成、および保守的な類似性マッチングによる作品特定を行う自動化パイプラインを提案するものである。
この論文は、大規模言語モデルに対するジャイルブレイク攻撃を計算リソースの関数として捉えるスケーリング法則の枠組みを提案し、最適化ベースや遺伝的アルゴリズムなどの多様な攻撃手法を比較評価することで、プロンプトベースの手法が計算効率と隠蔽性の点で優位であり、脆弱性が危害のタイプに強く依存することを明らかにしています。
本論文は、無限幅トランスフォーマーが「アルゴリズム的キャプチャ(グロッキング)」を達成する能力を定義し、その推論時の計算量に上限があることを示すことで、効率的な多項式時間ヒューリスティックスキーム(EPTHS)に属する低複雑度アルゴリズムへの誘導バイアスが存在し、より高複雑度アルゴリズムの習得は困難であることを理論的に証明しています。
この論文は、単純な数式をランダムに並べ替えて生成した自己教師ありオラクル軌跡を用いてトランスフォーマーベースの方策ネットワークを訓練し、高エネルギー物理学における複雑な数式の記号的簡化において、従来の強化学習や回帰手法を大幅に上回る高い成功率を達成する新しい手法を提案するものである。
ハンチントン病の音声認識(ASR)において、高品質な臨床コーパスを用いた体系的な研究により、Parakeet-TDT アーキテクチャの優位性を示し、生体マーカーに基づく補助教師信号を用いることで誤り率を 6.99% から 4.95% まで改善する手法を提案し、コードとモデルをオープンソース化しました。
この論文は、学生モデルの習熟度(正解率)が極端な問題に対する学習効率の低下という構造的な課題を理論的に解明し、その中間領域に学習を集中させる重み付け関数を用いた「PACED」という蒸留フレームワークを提案し、標準的なベンチマークで顕著な性能向上と忘却の抑制を実現したことを示しています。
この論文は、既知の物理モデルとガウス過程を組み合わせたハイブリッドモデルを用いたベイズ最適化手法を提案し、部分既知システムの最適化において、標準的なベイズ最適化よりもはるかに少ない試行回数で高品質な解を導出できることを示しています。
本論文は、DNS クエリのシーケンスからドメイン名の埋め込みを学習する自己教師あり型トランスフォーマーモデル「DNS-GT」を提案し、ドメイン分類やボットネット検出などのタスクにおいて既存手法を上回る性能を実証したものである。
この論文は、パラメータ効率性と安定性を両立させるため、従来の重み空間ではなく表現空間での低ランク部分空間への介入を通じて継続学習を行う新たなフレームワーク「CoRe」を提案し、既存の手法を上回る性能を実証したものである。
本論文は、既存の近似学習忘却手法が抱える最適化の不安定さや汎化性能の低下という課題を解決するため、忘却データと真の未見データの分布を一致させることを目指し、保持された独立データセットを参照して蒸馏を行う「ReGUn」という新しい学習忘却フレームワークを提案し、その有効性を示しています。
この論文は、コード生成用大規模言語モデル(LLM)が脆弱性を生成する際にも内部でセキュリティ概念を認識していることを発見し、その内部表現を操作して安全かつ機能的なコード生成を誘導する軽量かつモジュール型の手法「SCS-Code」を提案し、既存の最先端手法を上回る性能を実証したものである。
この論文は、2024 年 8 月から 2026 年 2 月にかけてリリースされた 7 種類の最先端 AI モデルが、企業ネットワークや産業制御システムを対象とした多段階サイバー攻撃シナリオにおいて、推論時の計算リソースの増加とモデル世代の進化に伴い、人間専門家の約 6 時間に相当する 32 段階中の 22 段階を達成するなど、顕著な能力向上を示したことを報告しています。
本論文は、大規模言語モデルによる反復推論をマルコフ連鎖として定義し、温度パラメータや初期入力などの要因に応じて文の多様性が増加または減少する動的な収束挙動を明らかにしたものである。
この論文は、稀な事象を含む高次元データに対する予測分布の信頼性を向上させるため、ベースモデルの誤りを特定・修正する「診断輸送マップ」を提案し、ハリケーン強度の短期予測において実用的な改善効果を実証したものである。
この論文は、スマートバンドによる生体信号とモバイルアプリによる生態的瞬間評価(EMA)を組み合わせ、機械学習を用いて高齢者の日常活動中の気分状態を自動的に監視・予測するウェアラブルシステムを提案し、特に「幸福感」と「活動性」の検出において最先端の精度を達成したことを報告しています。
南アフリカとウガンダのコミュニティ医療センターで収集された結核患者の咳音データを用いた研究において、XLS-R の最初の 3 層のみを活用した事前学習済みトランスフォーマーモデルが、咳の開始・終了点の自動検出およびその後の結核分類タスクにおいて、既存のモデルやベースラインを凌駕する高い精度と計算効率を実現し、スマートフォンを用いた大規模なスクリーニングツールの実用化可能性を示しました。
この論文は、単一細胞遺伝子発現データに対する生成モデルの評価における標準化の欠如と再現性の課題を解決するため、生物学的根拠に基づいた包括的な評価指標とオープンソースフレームワーク「GGE」を提案し、公平な比較と研究の加速を可能にすることを目的としています。
本研究は、統計熱力学に基づく離散列挙とマスク付きソフトマックス集約、およびストレートスルー勾配推定器を組み合わせた「DISCOMAX」という可微分アルゴリズムを提案し、熱力学的整合性を保証しつつ液体 - 液体平衡データからニューラルネットワークによる過剰ギブズエネルギーモデルを学習可能にする新たな枠組みを示しています。
この論文は、Klinkenberg 効果を含む非線形ガス流を Hopf-Cole 変換と混合定式化、共有トランク型ニューラルネットワーク、および DeepLS ソルバーを統合した機械学習フレームワークにより線形化し、圧力・速度場の高精度予測と圧力依存性透過率などの逆問題の効率的な推定を実現する手法を提案しています。
この論文は、単一ドメインデータで訓練されたモデルが直面する「ドメイン感度の崩壊」という幾何学的な欠陥を理論的に解明し、教師モデルからクラスに抑制された残差構造を蒸留する「教師誘導型学習(TGT)」を提案することで、推論時のオーバーヘッドを増やすことなく分布外検出性能を大幅に向上させる手法を提示しています。