Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations
この論文は、大規模言語モデルにおけるプロンプト注入攻撃への防御を強化するため、入力層だけでなくネットワークの中間層にも特権情報を埋め込むことで、既存手法よりも最大 9.2 倍の攻撃成功率低下を実現する新しいアプローチを提案しています。
2396 件の論文
この論文は、大規模言語モデルにおけるプロンプト注入攻撃への防御を強化するため、入力層だけでなくネットワークの中間層にも特権情報を埋め込むことで、既存手法よりも最大 9.2 倍の攻撃成功率低下を実現する新しいアプローチを提案しています。
この論文は、高次共通近傍における冗長性と過平滑化の問題をそれぞれ直交化と正規化で解決する「直交共通近傍(OCN)」を提案し、リンク予測タスクにおいて既存の最善手法を平均 7.7% 上回る性能達成と理論的裏付けを示しています。
本論文は、原子レベルの基盤モデルから得られる中間特徴量を用いた局所タンパク質環境の新しい表現手法を提案し、これが二次構造や化学的特性を効果的に捉えるだけでなく、NMR 化学シフトの予測において最先端の精度を達成する物理情報に基づく予測器の構築を可能にしたことを示しています。
本論文は、表形式データの理解・推論・操作に関する専門家のレベルを包括的に評価するため、25 の実世界タスクと 2 万 8 千以上の質問からなる大規模ベンチマーク「MMTU」を提案し、最先端のモデルでも高い性能が求められていることを示しています。
本論文は、AMP モジュールと新規の Multi-Envelope Discriminator を導入し、長尺音声生成における時間的整合性や周期性のモデル化を強化した GAN ベースのボコーダ「BemaGANv2」を提案し、各種識別器の組み合わせ戦略を客観的・主観的指標を用いて体系的に評価したものである。
この論文は、データとモデルの両方の異質性に対処し、タスク関連性を考慮した集約戦略と次元不変モジュール「Co-LoRA」を導入することで、現実的な多モーダル環境におけるパーソナライズド連合学習の性能を大幅に向上させる手法を提案し、40 のタスクを含む新しいベンチマークでその有効性を示しています。
本論文は、LLM の常識推論と古典的計画を融合させ、3D 環境における目標の文脈に応じた段階的な緩和(ゴール・リラクゼーション)を実現する「ContextMatters」を提案し、これにより未達成になりがちなタスクの成功率を大幅に向上させ、実世界ロボットでの実行も可能にしたことを示しています。
この論文は、農業分野における密集・自己遮蔽物体のインスタンスセグメンテーション課題を解決するため、最小限の人手注釈で形状やテクスチャに焦点を当てた「GLMask」を用いた半自己教師あり学習アプローチを提案し、小麦の穂の検出で mAP@50 98.5% の最高精度を達成したことを報告しています。
本論文は、大規模言語モデルの学習状態に応じてバッチごとに訓練サンプルを動的に選択する新しいアルゴリズム「SamS」を提案し、DPO のコアアルゴリズムを変更することなく、計算コストを最小限に抑えつつモデルの汎化性能を大幅に向上させることを示しています。
この論文は、報酬関数の説明をプロンプトに組み込むことで大規模推論モデルの強化学習微調整を効率化する「MeRF(Motivation-enhanced Reinforcement Finetuning)」を提案し、その有効性を実証しています。
本論文は、サブ・ナイキストサンプリングと低ビット解像度を意図的に採用することで消費電力を 3.31 倍削減しつつ、モバイルプラットフォーム上でリアルタイムに動作する広帯域音声再構成手法「SUBARU」を提案し、ノイズ環境下での高品質な音声強調を実現する実践的なアプローチを提示しています。
本論文は、事前学習された潜在拡散モデルとマルチモーダル理解モデルを活用し、対データなしで多様な画像劣化をゼロショットで統一復元する「LD-RPS」を提案し、既存手法を上回る性能を実証したものです。
この論文は、ノイズを含むデータを用いた物理情報ニューラルネットワーク(PINN)の学習において、誤差をノイズ分散以下に抑えるためにはネットワーク規模が一定の閾値を超えて大きくする必要があることを、ハミルトン・ヤコビ・ベルマン方程式などを用いた理論的解析と実験で実証しています。
本論文は、センサー故障やプライバシー保護により生じる不完全なマルチモーダルデータの問題に対処するため、モダリティ組合せごとの共有情報と固有特徴を分離し、表現空間の分離性に基づいて動的に学習比率を調整する新しいパラメータ効率型学習フレームワーク「MCULoRA」を提案し、感情認識タスクにおいて既存手法を上回る性能を達成したことを示しています。
本論文は、マルチモーダル大規模言語モデル(MLLM)がエージェントの行動を過剰に肯定する「同意バイアス」を特定し、自己生成された事前知識に基づいて検証を行う軽量手法「SGV」を提案することで、タスク完了率や精度を大幅に向上させることを示しています。
本論文は、状態空間モデルを活用した新しいディープスネークフレームワーク「Mamba Snake」を提案し、多スケールの構造的異質性や器官間の関係性を効果的にモデル化することで、医用画像の統一セグメンテーションにおいて最先端の手法を上回る性能を達成したことを示しています。
本論文は、X 線非破壊検査の信頼性と解釈性を向上させるため、検出器と証拠に基づく反省ツールを LMM エージェントが調整する新たなフレームワーク「InsightX Agent」を提案し、GDXray+ データセットにおいて高い検出精度と信頼性の高い分析を実現したことを示しています。
本論文は、台湾宇宙機関(TASA)の緊急付加価値製品(EVAP)を支援するため、Sentinel-2 と Formosat-5 画像を用いた主成分分析と信頼度指標に基づく弱教師あり学習により、ViT(Vision Transformer)ベースのモデルで災害被災域のセグメンテーション精度と信頼性を向上させるフレームワークを提案するものである。
この論文は、生物学的配列モデリング、分子生成・設計、ペプチドおよびタンパク質生成の 3 つの主要分野におけるフローマッチングの基礎、応用、データセット、ツール、および将来の展望を網羅的に調査した初の包括的なサーベイである。
この論文は、LLM ベースのユーザーシミュレータにおける目標指向行動の一貫性欠如という課題を解決するため、会話中の目標進行を追跡する「UGST」フレームワークと評価指標を提案し、マルチターン会話での目標整合性を大幅に向上させることを示しています。