Epistemic Closure: Autonomous Mechanism Completion for Physically Consistent Simulation
この論文は、LLM の物理的仮定を見落とすという課題を解決し、数値シミュレーションにおいて支配方程式の欠落メカニズムを自律的に推論・補完して物理的に整合的な結果を導き出す「認識的閉鎖」を実現するニューロ記号的生成エージェントを提案するものである。
3477 件の論文
この論文は、LLM の物理的仮定を見落とすという課題を解決し、数値シミュレーションにおいて支配方程式の欠落メカニズムを自律的に推論・補完して物理的に整合的な結果を導き出す「認識的閉鎖」を実現するニューロ記号的生成エージェントを提案するものである。
この論文は、マルチモーダル拡散トランスフォーマーを用いて、テキストプロンプトの代わりに文字画像を入力し、注意メカニズムを制御することで追加学習なしに多言語ロゴを生成・様式化できる「LogoDiffuser」を提案し、その有効性を示しています。
本論文は、チェッカーボードパターンによる空間多重化と深層学習に基づく再構成フレームワークを活用し、単一カメラで事前接触時の外部視覚情報と接触時の触覚信号を同時に高忠実度で取得する新たな視触覚センサー「MuxGel」を提案し、既存の GelSight 型センサーへのプラグアンドプレイ統合と双モダリティフィードバックによる把持タスクの向上を実証しています。
本論文は、既存のバックドア防御がトリガーの除去に依存しているが、実際には訓練トリガーとは異なる「代替トリガー」が同じバックドアを確実に活性化し、防御を回避できることを理論的・実証的に示し、入力空間のトリガー除去ではなく表現空間におけるバックドア方向そのものを標的とした防御の必要性を提唱している。
本論文は、変厚トポロジー最適化における製造困難な低厚さ領域の抑制と、構造エッジのぼやけを密度勾配情報に基づく投影法(DGI 投影)によって実質的なコンプライアンス低下なしに解消する手法を提案しています。
この論文は、Anthropic の Clio などのプライバシー保護を謳った LLM 分析システムに対し、敵対者が悪意のあるチャットを注入することで標的ユーザーの医療履歴などの機密情報を漏洩させる「CLIOPATRA」という新たな攻撃手法を提案し、既存のヒューリスティックな保護策や LLM による監査が不十分であることを実証しています。
この論文は、高レベルタスクにおける時間依存性のミスを検出するために、弱教師あり学習とシミュレーションデータを活用した新しいビデオ異常検出アーキテクチャ「TIMID」を提案し、既存の VLM では困難な時間的推論を可能にすることを示しています。
本論文は、テスト時にエゴセントリック視点からエクセントリック視点への行動予測を可能にする新たなタスクを提案し、マルチラベルプロトタイプ成長モジュールとテキスト・視覚の二重の手がかり整合性を活用した新しいネットワーク「DCPGN」により、既存の手法を大幅に上回る性能を実現したことを報告しています。
この論文は、GQL 標準の改訂を背景に、PG-Keys 言語を既存の制約言語(GFD や GGD)と比較・評価するための統一枠組みを提案し、構造的な差異に基づいた完全かつ厳密な表現力の階層を確立することで、PG-Keys の表現能力が厳密に優越する条件を明らかにするものです。
この論文は、粗粒度のタスクから脱却し、領域を考慮した音源のセグメンテーションと詳細な記述を同時に実現する新たな細粒度タスク「RA-SSU」を定義し、対応する大規模データセットと SOTA 性能を達成するモデル「SSUFormer」を提案しています。
本論文は、2 枚の画像からの大角度視点変化に対する新規視点合成の課題に対し、投影された点雲の信頼度に基づいて拡散モデルを制御し、見えない領域の補完とカメラ軌跡の追従を両立させる「ConfCtrl」というフレームワークを提案するものです。
本論文は、従来の評価指標の限界を克服し、音声信号に基づいて感情音声キャプションの細部を原子単位で検証する新しい評価フレームワーク「EmoSURA」と、それを用いたベンチマーク「SURABench」を提案し、人間による評価との高い相関を示した研究です。
本論文は、診断に有用な脳状態の時間的変化と空間的パターンを特定し、解釈可能な動的脳ネットワークモデルを構築するために、適応的な位相分割、アテンション機構、およびスパースなグラフ構造生成を組み合わせた時空間対照学習フレームワーク「BrainSTR」を提案し、自閉症スペクトラム障害、双極性障害、うつ病のデータを用いた実験でその有効性と既存の神経画像所見との整合性を検証したものである。
この論文は、大規模視覚言語モデル(VLM)の空間推論能力を活用し、点群を鳥瞰図とシーングラフに変換して自然言語からの位置特定精度を向上させる「VLM-Loc」フレームワークと、その評価用ベンチマーク「CityLoc」を提案するものです。
この論文は、拡散モデルによる画像生成における色覚異常者へのアクセシビリティを評価する新たな指標「CVDLoss」を提案し、既存のモデルがアクセシビリティ向上を目的としたプロンプトに適切に応答できない現状を明らかにしたものである。
この論文は、Gap-ETH 下で最適であることが示された $2^{O(1/\varepsilon^{d-1})}n^{1+o(1)}d(1+\varepsilon)$-近似解法として提示するものである。
この論文は、推薦エージェントが受動的な情報処理から自律的な調査へ移行できるよう、ユーザーやアイテム、協調的な情報の不足を動的に分析・補完し、専門ツールを自律的に活用して推論を行う「RecThinker」というフレームワークを提案し、その性能を実証したものです。
この論文は、低次元ユークリッド空間における-median および-means 問題の-近似アルゴリズムの実行時間を大幅に改善し、さらに Gap Exponential Time 仮説の下でその実行時間の下限がほぼ一致することを示しています。
本論文は、現実のアプリケーションで生じるモダリティの欠損率の偏りを考慮し、感情分析タスクにおけるモデルの公平性と最適化の偏りを評価するための新たなベンチマーク「MissBench」と、その診断指標(MEI と MLI)を提案するものです。
本論文は、従来の時間ベースの権限取り消しモデルがエージェント実行環境において抱える一貫性問題を、メモリ一貫性モデル(MESI)の概念を権限管理に転用した「能力一貫性システム(CCS)」と「リリース整合性指向一貫性(RCC)戦略」によって解決し、シミュレーションにより従来手法に比べ最大 184 倍の安全性向上と権限取り消し遅延に伴う不正操作の理論的限界の突破を実証しています。