Enhancing Instruction Following of LLMs via Activation Steering with Dynamic Rejection
この論文は、過剰な誘導による品質低下を防ぐために、妥当性に基づく復号ループと軽量な層分析を用いて動的に誘導強度を調整する新しい手法「DIRECTER」を提案し、追加データなしでLLMの指示追従能力を大幅に向上させることを示しています。
7030 件の論文
この論文は、過剰な誘導による品質低下を防ぐために、妥当性に基づく復号ループと軽量な層分析を用いて動的に誘導強度を調整する新しい手法「DIRECTER」を提案し、追加データなしでLLMの指示追従能力を大幅に向上させることを示しています。
本論文は、設計可能性を損なうことなく溶解性や熱安定性などの多様な開発特性を同時に満たすよう事前学習済み逆フォールディングモデルを微調整する多目的選好アライメントフレームワーク「ProtAlign」を提案し、その実用性を示すものである。
この論文は、強非線形ダイナミクスを持つ高次元システムにおけるデータ同化の課題を解決するため、安定な線形潜空間で再構成された潜在オートエンコーダーアンサンブルカルマンフィルター(LAE-EnKF)を提案し、その理論的保証と数値実験による有効性を示したものである。
この論文は、古典的 CNN エンコーダと量子インプリシットニューラル表現(QINR)デコーダを組み合わせたハイブリッドモデルを提案し、MNIST などのデータセットを用いた画像再構成・生成タスクにおいて、従来の量子生成モデルよりも多様性と画質の両面で優れた性能を示すことを実証しています。
この論文は、不均衡なデータにおける概念ドリフト検出時に生じる「マスキング効果」を回避し、小規模な概念のドリフトを解釈可能かつロバストに検出するための、偏りのないクラスター記述子に基づく新しい手法「ICD3」を提案するものである。
この論文は、アルツハイマー病の診断・予後モデルにおけるSHAP説明の堅牢性と一貫性を検証する多段階フレームワークを提案し、認知・機能マーカーが説明の主要因であり、診断と予後の間でSHAP説明が安定して転用可能であることを示した。
本論文は、物理情報ニューラルネットワーク(PINN)の訓練効率と精度を向上させるため、残差に基づく重要性と多様性を同時に考慮し、スパースな QUBO 最適化とハイブリッドなコアセット構築を用いて適応的な配置点選択を行う新たな手法を提案し、粘性ブルガース方程式のシミュレーションにおいてその有効性を検証したものである。
本研究は、多孔質媒体内の定常流れの予測において、従来の CFD に比べて最大 1000 倍の高速化を実現し、メッシュ不変性や物理情報損失関数の導入によりトポロジー最適化に極めて適した Fourier Neural Operator (FNO) が、AE や U-Net よりも優れた精度を示すことを明らかにしています。
本論文は、メタ学習とグラフ畳み込みニューラルネットワークを組み合わせることで、道路網の閉鎖や需要変動といった未見の状況下でも迅速に適応し、交通流を高精度に予測する手法を提案し、その有効性を示しています。
この論文は、安全性が極めて重要な化学プロセス分野において、説明性と解釈性を備えつつ、実世界の故障データが不足している状況でもシミュレータデータを用いてランダムフォレストや多層パーセプトロンを上回る性能を発揮する記号機械学習による故障検知手法の可行性を、エチレン酸化プロセスの事例研究を通じて検証したものである。
この論文は、ニューラルネットワークの表現空間における線形変換によるゲージ自由度を明らかにし、これによりモデルの出力は不変ながらコサイン類似度などの一般的な類似度指標が座標系に依存して不安定になることを示し、表現分析においてはゲージ不変な量や明示的な標準座標系への焦点の必要性を提唱しています。
本論文は、ジョブショップスケジューリング問題を異種グラフとしてモデル化し、エッジの種類の違いを考慮した異種グラフトランスフォーマーを用いた強化学習フレームワーク「HGT-Scheduler」を提案し、その有効性をベンチマークインスタンスで実証したものである。
SpatialMAGIC は、グラフ拡散とトランスフォーマーに基づく空間自己注意力を統合したハイブリッド枠組みにより、空間トランスクリプトミクスデータの欠損値を高精度に補完し、細胞クラスタリングの精度向上や生物学的解釈性の維持を実現する手法として提案されています。
この論文は、時系列データにおける予測根拠の特定手法(アトリビューション手法)の評価を容易にするため、合成データ生成から評価指標の計算までを統一的に提供するオープンソースの Python パッケージ「xaitimesynth」を紹介しています。
この論文は、データ不足が課題である急速に激化する熱帯低気圧の検出のために、物理的整合性を保ちながら極端な気象事象の合成データを生成する物理情報拡散モデルを提案し、クラス不均衡を解消して気象検出アルゴリズムの性能向上を実現したことを報告しています。
本論文は、早期収縮を防ぎ探索を維持するために、歴史的に成功した軌跡を動的に保存・活用する軽量な「楽観的方則正則化(OPR)」を提案し、PPO と組み合わせたことで Atari 環境やサイバー防御タスクにおいて、既存手法よりも少ないステップ数で高い性能を達成することを示しています。
本論文は、報酬分布の尾部の特性(軽いか重いか)に応じて楽観的・悲観的アプローチを動的に調整する適応型推論時アライメント手法「Best-of-Tails」を提案し、既存の固定戦略よりも優れた性能を実現することを示しています。
本論文は、並列化、メモリ制約、ネットワークトポロジーを統合的に考慮し、構造化された動的計画法を用いて分散深層学習のデバイス配置を最適化するフレームワーク「NEST」を提案し、既存手法と比較して最大 2.43 倍のスループット向上とスケーラビリティの改善を実現することを示しています。
この論文は、エージェントの貢献が重複する現実的なシナリオをモデル化する部分モジュラ報酬を備えた協調マルチエージェント強化学習の枠組みを初めて提案し、既知および未知のダイナミクス下でそれぞれ多項式時間の近似保証と regret 保証を持つアルゴリズムを開発したものである。
本論文は、標準的な共形予測が持つ外挿領域における過信の問題と、クレダル手法の較正保証の欠如を克服するため、局所的証拠が弱い場合に幅を広げる解釈可能なクレダル包絡線を構築し、その上で分割共形較正を適用して分布フリーの保証付き予測区間を提供する「CREDO」という手法を提案するものである。