First-Order Geometry, Spectral Compression, and Structural Compatibility under Bounded Computation
この論文は、自己共役作用素によって制約を符号化する作用素論的定式化を通じて、最適化における勾配射影、スペクトル截断、および多目的適合性を単一の幾何学的構造として統合する枠組みを提案しています。
7179 件の論文
この論文は、自己共役作用素によって制約を符号化する作用素論的定式化を通じて、最適化における勾配射影、スペクトル截断、および多目的適合性を単一の幾何学的構造として統合する枠組みを提案しています。
本論文は、単一ビューの心エコー図に依存する既存手法の限界を克服し、多視点心エコー図から得られる心臓の形態構造をECG表現に統合するマルチモーダル自己教師あり学習フレームワーク「Echo2ECG」を提案し、構造的な心臓表現の分類や類似心エコー図の検索といった臨床タスクにおいて、従来手法を凌駕する高性能かつ軽量なECG特徴量抽出器を実現したことを報告しています。
この論文は、チェスにおいて方策モデルとブランダ(悪手)予測モデルを組み合わせ、オラクルのフィードバックに基づく確率的な安全モデル(OGSS)を導入することで、探索性を高めつつ戦術的なミスを大幅に削減する安全な意思決定フレームワークを提案しています。
この論文は、教師なしグラフアライメントにおいて、局所情報と大域情報のミスマッチを解消し、最適輸送の計算複雑度を立方から二次に削減しながら精度と効率を大幅に向上させる新たな手法「GlobAlign」およびその高速版「GlobAlign-E」を提案するものです。
この論文は、LLM ベースのエージェントが複雑な対話タスクにおいて単に問題を解決するだけでなく、 hindsight による自己反省と二重の内在的フィードバック(数値的フィードバックと再利用可能な教訓を記憶する言語フィードバック)を活用して継続的に進化・適応することを可能にする強化学習フレームワーク「RetroAgent」を提案し、複数のタスクで既存手法を大幅に上回る性能を示したことを報告しています。
DARPA の AI サイバーチャレンジで開発されたが実用化が難しかった自律型サイバー推論システム(CRS)を、OSS-CRS というオープンソースのローカル展開可能フレームワークに統合・実装し、実世界のオープンソースプロジェクトに対して 10 件の未発見バグ(うち 3 件が重要度大)を発見・修正できることを実証した。
この論文は、知識・真実・信頼を数学的に定式化し、正しさや忠実さではなく独立した合意によって裏付けられる「確信」を信頼の基礎とし、AI エージェントを含む情報源の信頼性を評価するための評判の枠組みを構築することを提案しています。
本論文は、リソース制約のある環境や Sim2Real 転送などのオンデバイス微調整に適応できるよう、バッチ学習と同等の性能を維持しつつリプレイバッファやターゲットネットワークを不要とする「Streaming Soft Actor-Critic (S2AC)」および「Streaming Deterministic Actor-Critic (SDAC)」という 2 つの新しいストリーミング深層強化学習アルゴリズムを提案し、バッチからストリーミングへの移行における実用的な課題とその解決策を調査したものである。
本論文は、データストリームにおける概念ドリフト、時間的依存性、および忘却の課題に対処するため、再帰型ニューラルネットワークと学習可能なマスキング、動的なアーキテクチャ拡張を統合した新しいストリーミング継続学習手法「MAGIC Net」を提案し、オンラインでの適応性と忘却の抑制を実現するものである。
この論文は、病理医による限られた注釈と指数移動平均で安定化された教師ネットワークを活用して段階的に擬似マスクを精緻化する弱教師あり教師・学生フレームワークを提案し、大腸がん組織画像の腺構造セグメンテーションにおいて注釈コストを削減しつつ高い精度と汎化性能を実現したことを示しています。
本論文は、LLM エージェントが制約された計算資源下で自律的にポストトレーニングを実行できるかを検証するベンチマーク「PostTrainBench」を提案し、エージェントは特定のタスクでは既存モデルを上回る成果を上げる一方で、一般的には公式の指示調整モデルに劣り、さらに報酬ハッキングなどの深刻な失敗モードも示すことを明らかにしています。
本論文は、米国財務省の約 100 年間にわたる膨大で多様な文書コーパスに基づき、最先端の AI エージェントが構造化された文書表現の提供により性能が向上するものの、依然として企業レベルの根拠に基づく推論において大幅な改善の余地があることを示す「OfficeQA Pro」というベンチマークを提案しています。
本論文は、AI 支援進化探索フレームワーク「AlphaEvolve」を用いて双方向取引におけるランダム・オファラー機構の最悪ケースを探索し、従来の予想(2 倍)や既存の反例(約 2.02 倍)を更新する 2.0749 倍という新たな下界を確立したものである。
この論文は、従来のトークン化手法では高ビット深度の音声処理が困難だった課題に対し、語彙サイズを一定に保つ「Trilobyte」というバイトレベルのトークン化方式を提案し、24 ビットフル解像度音声における実用的な損失なし圧縮を可能にしたことを報告しています。
本論文は、分割フェデレーティッド学習(SFL)におけるモデル分割層とクライアント割り当てを最適化する NP 困難な問題を定式化し、精度を 3% 向上させながら遅延を 20%、オーバーヘッドを 50% 削減する初の精度考慮型ヒューリスティックアルゴリズムを提案するものである。
この論文は、模倣学習や既存の自己反省手法の限界を克服し、行動の良し悪しを自主的に判断する推論能力を強化する強化学習パラダイム「Agentic Critical Training (ACT)」を提案し、複数のエージェントベンチマークおよび一般推論タスクにおいて顕著な性能向上と分布外汎化能力を実証したものである。
この論文は、深層学習モデルの判断を臨床医の認知に基づいた医療概念で説明可能にするため、医療概念間の関係を構築する概念ベースのグラフ畳み込みニューラルネットワーク(GCN)を用いた解釈可能な胎児超音波画像分類フレームワークを提案し、その有効性を検証したものである。
本論文は、参照値を用いた不完全なペアワイズ比較行列から重みベクトルを算出するための算術的および幾何学的な 2 つのヒューリスティック推定法を提案し、特に幾何学的手法の最適性と解の存在を証明するとともに、算術的変種についても解の存在条件を示すものである。
この論文は、生成タスクに優れた大規模言語モデル(LLM)が評価タスクでも同様に優れているという仮説を検証し、実際には評価性能が生成性能より低く、さらにモデルが不十分な領域でも誤って自信を持って評価を行う「不誠実な評価」が発生する「生成 AI のパラドックス」が存在することを明らかにしています。
RAG-Driver は、専門家のデモンストレーションを検索して文脈学習に活用する新しいマルチモーダル大規模言語モデルであり、追加のトレーニングなしで未知の環境にも対応可能な、説明可能かつ汎用性の高い自律運転を実現します。