cs.AI 件の論文 | Gist.Science

First-Order Geometry, Spectral Compression, and Structural Compatibility under Bounded Computation

この論文は、自己共役作用素によって制約を符号化する作用素論的定式化を通じて、最適化における勾配射影、スペクトル截断、および多目的適合性を単一の幾何学的構造として統合する枠組みを提案しています。

Changkai Li2026-03-10🔢 math

Echo2ECG: Enhancing ECG Representations with Cardiac Morphology from Multi-View Echos

本論文は、単一ビューの心エコー図に依存する既存手法の限界を克服し、多視点心エコー図から得られる心臓の形態構造をECG表現に統合するマルチモーダル自己教師あり学習フレームワーク「Echo2ECG」を提案し、構造的な心臓表現の分類や類似心エコー図の検索といった臨床タスクにおいて、従来手法を凌駕する高性能かつ軽量なECG特徴量抽出器を実現したことを報告しています。

Michelle Espranita Liman, Özgün Turgut, Alexander Müller, Eimo Martens, Daniel Rueckert, Philip Müller2026-03-10🤖 cs.LG

Oracle-Guided Soft Shielding for Safe Move Prediction in Chess

この論文は、チェスにおいて方策モデルとブランダ（悪手）予測モデルを組み合わせ、オラクルのフィードバックに基づく確率的な安全モデル（OGSS）を導入することで、探索性を高めつつ戦術的なミスを大幅に削減する安全な意思決定フレームワークを提案しています。

Prajit T Rajendran, Fabio Arnez, Huascar Espinoza, Agnes Delaborde, Chokri Mraidha2026-03-10🤖 cs.LG

Towards Effective and Efficient Graph Alignment without Supervision

この論文は、教師なしグラフアライメントにおいて、局所情報と大域情報のミスマッチを解消し、最適輸送の計算複雑度を立方から二次に削減しながら精度と効率を大幅に向上させる新たな手法「GlobAlign」およびその高速版「GlobAlign-E」を提案するものです。

Songyang Chen, Youfang Lin, Yu Liu, Shuai Zheng, Lei Zou2026-03-10🤖 cs.LG

RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback

この論文は、LLM ベースのエージェントが複雑な対話タスクにおいて単に問題を解決するだけでなく、 hindsight による自己反省と二重の内在的フィードバック（数値的フィードバックと再利用可能な教訓を記憶する言語フィードバック）を活用して継続的に進化・適応することを可能にする強化学習フレームワーク「RetroAgent」を提案し、複数のタスクで既存手法を大幅に上回る性能を示したことを報告しています。

Xiaoying Zhang, Zichen Liu, Yipeng Zhang, Xia Hu, Wenqi Shao2026-03-10💻 cs

OSS-CRS: Liberating AIxCC Cyber Reasoning Systems for Real-World Open-Source Security

DARPA の AI サイバーチャレンジで開発されたが実用化が難しかった自律型サイバー推論システム（CRS）を、OSS-CRS というオープンソースのローカル展開可能フレームワークに統合・実装し、実世界のオープンソースプロジェクトに対して 10 件の未発見バグ（うち 3 件が重要度大）を発見・修正できることを実証した。

Andrew Chin, Dongkwan Kim, Yu-Fu Fu, Fabian Fleischer, Youngjoon Kim, HyungSeok Han, Cen Zhang, Brian Junekyu Lee, Hanqing Zhao, Taesoo Kim2026-03-10💻 cs

Trust via Reputation of Conviction

この論文は、知識・真実・信頼を数学的に定式化し、正しさや忠実さではなく独立した合意によって裏付けられる「確信」を信頼の基礎とし、AI エージェントを含む情報源の信頼性を評価するための評判の枠組みを構築することを提案しています。

Aravind R. Iyengar2026-03-10🤖 cs.LG

Towards Batch-to-Streaming Deep Reinforcement Learning for Continuous Control

本論文は、リソース制約のある環境や Sim2Real 転送などのオンデバイス微調整に適応できるよう、バッチ学習と同等の性能を維持しつつリプレイバッファやターゲットネットワークを不要とする「Streaming Soft Actor-Critic (S2AC)」および「Streaming Deterministic Actor-Critic (SDAC)」という 2 つの新しいストリーミング深層強化学習アルゴリズムを提案し、バッチからストリーミングへの移行における実用的な課題とその解決策を調査したものである。

Riccardo De Monte, Matteo Cederle, Gian Antonio Susto2026-03-10🤖 cs.LG

Don't Look Back in Anger: MAGIC Net for Streaming Continual Learning with Temporal Dependence

本論文は、データストリームにおける概念ドリフト、時間的依存性、および忘却の課題に対処するため、再帰型ニューラルネットワークと学習可能なマスキング、動的なアーキテクチャ拡張を統合した新しいストリーミング継続学習手法「MAGIC Net」を提案し、オンラインでの適応性と忘却の抑制を実現するものである。

Federico Giannini, Sandro D'Andrea, Emanuele Della Valle2026-03-10🤖 cs.LG

Weakly Supervised Teacher-Student Framework with Progressive Pseudo-mask Refinement for Gland Segmentation

この論文は、病理医による限られた注釈と指数移動平均で安定化された教師ネットワークを活用して段階的に擬似マスクを精緻化する弱教師あり教師・学生フレームワークを提案し、大腸がん組織画像の腺構造セグメンテーションにおいて注釈コストを削減しつつ高い精度と汎化性能を実現したことを示しています。

Hikmat Khan, Wei Chen, Muhammad Khalid Khan Niazi2026-03-10💻 cs

PostTrainBench: Can LLM Agents Automate LLM Post-Training?

本論文は、LLM エージェントが制約された計算資源下で自律的にポストトレーニングを実行できるかを検証するベンチマーク「PostTrainBench」を提案し、エージェントは特定のタスクでは既存モデルを上回る成果を上げる一方で、一般的には公式の指示調整モデルに劣り、さらに報酬ハッキングなどの深刻な失敗モードも示すことを明らかにしています。

Ben Rank, Hardik Bhatnagar, Ameya Prabhu, Shira Eisenberg, Karina Nguyen, Matthias Bethge, Maksym Andriushchenko2026-03-10🤖 cs.LG

OfficeQA Pro: An Enterprise Benchmark for End-to-End Grounded Reasoning

本論文は、米国財務省の約 100 年間にわたる膨大で多様な文書コーパスに基づき、最先端の AI エージェントが構造化された文書表現の提供により性能が向上するものの、依然として企業レベルの根拠に基づく推論において大幅な改善の余地があることを示す「OfficeQA Pro」というベンチマークを提案しています。

Krista Opsahl-Ong, Arnav Singhvi, Jasmine Collins, Ivan Zhou, Cindy Wang, Ashutosh Baheti, Owen Oertell, Jacob Portes, Sam Havens, Erich Elsen, Michael Bendersky, Matei Zaharia, Xing Chen2026-03-10💬 cs.CL

A New Lower Bound for the Random Offerer Mechanism in Bilateral Trade using AI-Guided Evolutionary Search

本論文は、AI 支援進化探索フレームワーク「AlphaEvolve」を用いて双方向取引におけるランダム・オファラー機構の最悪ケースを探索し、従来の予想（2 倍）や既存の反例（約 2.02 倍）を更新する 2.0749 倍という新たな下界を確立したものである。

Yang Cai, Vineet Gupta, Zun Li, Aranyak Mehta2026-03-10🤖 cs.LG

Benchmarking Language Modeling for Lossless Compression of Full-Fidelity Audio

この論文は、従来のトークン化手法では高ビット深度の音声処理が困難だった課題に対し、語彙サイズを一定に保つ「Trilobyte」というバイトレベルのトークン化方式を提案し、24 ビットフル解像度音声における実用的な損失なし圧縮を可能にしたことを報告しています。

Phillip Long, Zachary Novack, Chris Donahue2026-03-10🤖 cs.LG

Split Federated Learning Architectures for High-Accuracy and Low-Delay Model Training

本論文は、分割フェデレーティッド学習（SFL）におけるモデル分割層とクライアント割り当てを最適化する NP 困難な問題を定式化し、精度を 3% 向上させながら遅延を 20%、オーバーヘッドを 50% 削減する初の精度考慮型ヒューリスティックアルゴリズムを提案するものである。

Yiannis Papageorgiou, Yannis Thomas, Ramin Khalili, Iordanis Koutsopoulos2026-03-10🤖 cs.LG

Agentic Critical Training

この論文は、模倣学習や既存の自己反省手法の限界を克服し、行動の良し悪しを自主的に判断する推論能力を強化する強化学習パラダイム「Agentic Critical Training (ACT)」を提案し、複数のエージェントベンチマークおよび一般推論タスクにおいて顕著な性能向上と分布外汎化能力を実証したものである。

Weize Liu, Minghui Liu, Sy-Tuyen Ho, Souradip Chakraborty, Xiyao Wang, Furong Huang2026-03-10🤖 cs.LG

A Cognitive Explainer for Fetal ultrasound images classifier Based on Medical Concepts

この論文は、深層学習モデルの判断を臨床医の認知に基づいた医療概念で説明可能にするため、医療概念間の関係を構築する概念ベースのグラフ畳み込みニューラルネットワーク（GCN）を用いた解釈可能な胎児超音波画像分類フレームワークを提案し、その有効性を検証したものである。

Yingni Wanga, Yunxiao Liua, Licong Dongc, Xuzhou Wua, Huabin Zhangb, Qiongyu Yed, Desheng Sunc, Xiaobo Zhoue, Kehong Yuan2026-03-09🤖 cs.AI

Mean-based incomplete pairwise comparisons method with the reference values

本論文は、参照値を用いた不完全なペアワイズ比較行列から重みベクトルを算出するための算術的および幾何学的な 2 つのヒューリスティック推定法を提案し、特に幾何学的手法の最適性と解の存在を証明するとともに、算術的変種についても解の存在条件を示すものである。

Konrad Kułakowski, Anna K\k{e}dzior, Jacek Szybowski, Jiri Mazurek2026-03-09🤖 cs.AI

The Generative AI Paradox on Evaluation: What It Can Solve, It May Not Evaluate

この論文は、生成タスクに優れた大規模言語モデル（LLM）が評価タスクでも同様に優れているという仮説を検証し、実際には評価性能が生成性能より低く、さらにモデルが不十分な領域でも誤って自信を持って評価を行う「不誠実な評価」が発生する「生成 AI のパラドックス」が存在することを明らかにしています。

Juhyun Oh, Eunsu Kim, Inha Cha, Alice Oh2026-03-09💻 cs

RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model

RAG-Driver は、専門家のデモンストレーションを検索して文脈学習に活用する新しいマルチモーダル大規模言語モデルであり、追加のトレーニングなしで未知の環境にも対応可能な、説明可能かつ汎用性の高い自律運転を実現します。

Jianhao Yuan, Shuyang Sun, Daniel Omeiza, Bo Zhao, Paul Newman, Lars Kunze, Matthew Gadd2026-03-09🤖 cs.AI

← 前へ次へ →