Real-Time Trust Verification for Safe Agentic Actions using TrustBench
TrustBench は、LLM ベースの自律エージェントが実行前に行動の安全性を検証するリアルタイムフレームワークであり、ドメイン固有のプラグインにより有害な行動を 87% 削減し、200ms 未満の遅延で実用的な信頼性保証を実現する。
2282 件の論文
TrustBench は、LLM ベースの自律エージェントが実行前に行動の安全性を検証するリアルタイムフレームワークであり、ドメイン固有のプラグインにより有害な行動を 87% 削減し、200ms 未満の遅延で実用的な信頼性保証を実現する。
RubiCap は、LLM が作成した評価基準(ルブリック)に基づいて報酬信号を生成する強化学習フレームワークを導入し、高密度画像キャプション生成において既存の教師あり蒸留や RL 手法、さらには人間専門家やプロプライエタリモデルを上回る性能と効率を実現しました。
本論文は、機能的に不完全でも構造的なパターンが機能意図を反映する LLM 生成 RTL を活用して合成ネットリストの表現学習を行う新たなフレームワークを提案し、実世界の回路設計におけるデータ不足というボトルネックを解消することを示しています。
本論文は、Transformer の自己注意機構に地質学的な相関情報を組み込む「地質情報付与型アテンション・トランスフォーマー(GIAT)」を提案し、井戸ログからの岩相識別において既存モデルを上回る高精度と解釈可能性を実現したことを報告しています。
この論文は、大規模なロボット遠隔操作データ収集を不要とし、人間の一人称視点動画から直接学習することで、自然で多様な全身動作を可能にする新しいヒューマノイド制御フレームワーク「ZeroWBC」を提案し、Unitree G1 による実験でその有効性を示したものである。
この論文は、LLM ベースのコード変異エージェント「AlphaEvolve」を用いて、5 つの古典的ラムゼー数(、、、、)の既知の下限値をそれぞれ 1 ずつ引き上げる新たな結果を達成し、従来の個別の検索アルゴリズムに代わる単一のメタアルゴリズムとして機能したことを報告しています。
本論文は、確率的な交通流ダイナミクスに基づいて分布制約を導出する新しい物理情報生成モデルを提案し、交通状態の推定や渋滞リスク評価を確率的に行うための枠組みを提供するものである。
本論文は、従来の VAD 依存型パイプラインの制約を克服し、LLM の高度な対話能力を維持しながら双方向のリアルタイム音声対話を可能にする「DuplexCascade」という、マイクロターン最適化と制御トークンを活用した VAD 不要のストリーミング型音声対話システムを提案し、オープンソースの音声対話システムにおいて最先端の性能を達成したことを示しています。
この論文は、計画能力に優れた離散拡散言語モデルと流暢なテキスト生成が得意な自己回帰モデルを潜在空間で連携させる「Latent-DARM」を提案し、多様な推論タスクにおいて既存のテキストベースのインターフェースを凌駕する精度向上と、最先端の推論モデルに匹敵する性能を極めて少ないトークン数で実現することを示しています。
この論文は、テキストチャンクを「手法ノード」に置き換え、二重の木構造(方法の由来ツリーと階層的クラスタリングツリー)と戦略的エージェント、検証層を組み合わせることで、多段階の推論プロセスを制御可能かつ説明可能、検証可能なものにする「説明可能なイノベーションエンジン」を提案し、その有効性を示したものです。
この論文は、LLM の論理的推論能力の向上が、推論、帰納、仮説形成を通じて AI の状況認識(自己認識や戦略的欺瞞など)を機械的に促進する「RAISE」フレームワークを提示し、現在の安全対策の限界を指摘するとともに、論理推論研究コミュニティに対し、この危険な軌道に対する具体的な安全策と責任を問うている。
この論文は、検索品質評価を明示的な行動に変換し、評価スコアに基づいて利得を再スケーリングする新しい最適化手法(PCAR)を組み合わせることで、複雑な多段推論タスクにおける検索拡張エージェントの信頼性と精度を大幅に向上させる「EvalAct」を提案しています。
この論文は、LLM の推論における感情の潜在的要因を解明し、感情バランスの取れた QA データセット「AURA-QA」を提案するとともに、感情条件付きの表現ドリフトを抑制する正則化フレームワークを導入することで、分布変化下およびドメイン内での読解タスクの性能向上を実現したことを示しています。
この論文は、AI の急速な普及が労働所得の減少を通じて総需要を抑制し、GDP 測定と実質所得の乖離や金融仲介機能の崩壊を招く「分配と契約のミスマッチ」を、マクロ金融ストレステストの枠組みで定式化し、安定調整から爆発的危機に至る条件を分析するものである。
本論文は、Google Play のデータ安全性声明とプライバシーポリシーの不一致を自動的に検出するフレームワーク「PrivPRISM」を提案し、大規模なアプリ分析を通じて声明と実際のデータ収集慣行の間に広範な矛盾や未開示が存在することを明らかにした。
この論文は、強化学習制御による全身筋骨格モデルを中核としたシミュレーションフレームワークを開発し、人間の内部状態を可視化しながらロボット構造と制御を同時に最適化することで、物理的ヒト・ロボット相互作用の定量的設計・分析を可能にすることを提案しています。
本論文は、ブルームの分類学に基づく認知層別データ合成フレームワーク「BD-FDG」を提案し、これにより構築した大規模な宇宙状況認識(SSA)向けデータセットで微調整した LLM が、専門領域の性能を大幅に向上させつつ汎用性を維持することを示しています。
本論文は、着用状態の画像から平らな衣服表現を生成する仮想試着(VTOFF)において、部分的な視認性からの連続的な詳細の推論と構造的な安定性を向上させるため、衣服の条件を橋渡しするモジュールと平らな構造の制約を注入するモジュールを組み合わせた拡散モデル「BridgeDiff」を提案し、最先端の性能を達成したことを示しています。
この論文は、社会的推論の難問を扱う対戦的ベンチマーク「ToMBench-Hard」と、推論過程全体を人間の認知に整合させる多面的報酬を用いた強化学習フレームワーク「Social-R1」を提案し、これにより小規模モデルでも大規模モデルを上回る堅牢な社会的知能を実現できることを示しています。
本論文は、事前学習済みおよびカスタム設計のニューラルネットワークを統合し、交通標識・車両・車線検出ならびに行動模倣といった自律運転の主要タスクを包括的に処理するマルチモデル手法を提案し、その有効性を複数のデータセットとシミュレーターを用いて検証したものである。