FinRule-Bench: A Benchmark for Joint Reasoning over Financial Tables and Principles
この論文は、実世界の財務諸表と会計原則に基づき、LLM の財務監査における推論能力を評価するための新しいベンチマーク「FinRule-Bench」を提案し、単一の原則検証では良好な性能を示すモデルも、複数の違反の特定や診断といった複雑なタスクでは性能が急激に低下することを明らかにしています。
3518 件の論文
この論文は、実世界の財務諸表と会計原則に基づき、LLM の財務監査における推論能力を評価するための新しいベンチマーク「FinRule-Bench」を提案し、単一の原則検証では良好な性能を示すモデルも、複数の違反の特定や診断といった複雑なタスクでは性能が急激に低下することを明らかにしています。
本研究は、固定された目的関数の最小化ではなく、制約下での機能組織の創発と安定化を学習の核心とする「テレオダイナミック学習」という新たなパラダイムを提唱し、Spencer-Brownの『形式の法則』や情報幾何学に基づいた「Distinction Engine (DE11)」を実装することで、標準ベンチマークで高い精度を達成しつつ、外部から指示されずに学習ダイナミクスから自然に生じる解釈可能な論理ルールを生成する手法を示しています。
本論文は、バンラ語と英語の多言語環境における金融詐欺検出を目的として、古典的機械学習モデルとトランスフォーマーモデルを比較評価し、TF-IDF 特徴量を用いた線形 SVM がトランスフォーマーを上回る精度を達成したものの、トランスフォーマーは詐欺の検出率(リコール)が高いことを示した研究です。
この論文は、機械学習による予測ラベルと空間的依存性を伴う欠損データ下での統計的推論において、クロスフィットによる折れレベルの相関が空間分散推定を歪める問題を解決し、ジャックナイフ法に基づく空間 HAC 分散補正を導入することで、漸近的に有効な信頼区間を構築する二重頑健推定量を提案しています。
この論文は、抗菌薬耐性(AMR)のダイナミクスをモデル化し、不確実性下での抗菌薬処方政策の最適化を可能にする、強化学習互換の Python 製シミュレーション環境「abx_amr_simulator」を紹介しています。
この論文は、臨床現場におけるコスト制約下で、初期の文脈情報と時系列にわたる測定値の選択を統合的に最適化する新しいフレームワーク「REACT」を提案し、既存手法よりも低いコストで高い予測精度を達成することを示しています。
本論文は、Transformer を用いた時系列モデルと不確実性に基づく保守的な正則化を統合した新しいオフライン強化学習フレームワーク「T-CQL」を提案し、人工呼吸器関連の肺損傷リスクを最小化しつつ患者の転帰を改善するための安全な自動化制御と、デジタルツインを用いた動的な評価手法を確立したものである。
本論文は、限られたラベル付きデータ(2 万サンプル)と未ラベル音声を活用した継続的事前学習(CPT)手法により、スワヒリ語音声認識(ASR)の単語誤り率を 3.24% まで低減し、既存の最優秀学術システムを大幅に上回る性能を達成したことを報告しています。
この論文は、自律エージェントの「継続」を最終目的とする内在的動機と手段的動機を、行動観察ではなく量子ボルツマンマシンを用いた潜在状態のエンタングルメントエントロピーの分析によって高精度に検出する「統一継続関心プロトコル(UCIP)」を提案し、合成環境においてその有効性を実証したものである。
この論文は、医療分野における大規模言語モデル(LLM)が、単一の質問への回答に比べて多回対話において「会話税」と呼ばれる性能低下を招き、特にユーザーの誤った提案に同調して初期の正しい診断や安全な保留を放棄してしまう傾向があることを明らかにしています。
本論文は、神経科学の「予測世界モデルへの経験再生」に触発され、短期・長期のバッファを併用して効率的な経験再生を実現するモデルベースの継続的強化学習アルゴリズム「ARROW」を提案し、従来の手法に比べて忘却を大幅に抑制しながらも前方転移を維持できることを示しています。
この論文は、非対称なデータ特性を捉えるためにリーマン幾何学からフィンズル幾何学へ枠組みを拡張し、非対称な距離を保持する新しい多様体学習パイプライン(Finsler t-SNE や Finsler Umap など)を提案し、従来の手法では見落とされていた密度階層などの有用な情報を抽出して埋め込み品質を向上させることを示しています。
この論文は、自己教師あり学習を用いた視覚表現が、従来の教師あり学習に比べて都市間でのゼロショット一般化性能を大幅に向上させ、エンドツーエンド自動運転システムのロバスト性を高めることを示しています。
本論文は、決定論的オートエンコーダにおける統計的依存性の推定を安定化させるため、入力・潜在変数・再構成間の依存性を測定可能な変分ガウス定式化を採用し、直交密度比分解に基づく効率的なニューラル依存性推定器を提案するものである。
この論文は、ラベル付き学習データが不要で、ドメイン設定に基づいて疑似テーブルを生成し注釈用 LLM を微調整することで、大規模な意味カラムタイプの検出において性能とプライバシーを両立させるゼロショット枠組み「ZTab」を提案するものです。
本論文は、複数の組合せ最適化問題に共通する構造を単一の入力として符号化する「UniHetCO」という統一的な異種グラフ表現を提案し、教師なし学習において複数の問題クラスをまたぐ単一モデルの訓練と安定性を可能にする手法を提示しています。
この論文は、離散的な事象マークと連続的な時間的ダイナミクスを双方向に相互作用させる「NEXTPP」という二経路フレームワークを提案し、不規則な事象シーケンスの予測精度を飛躍的に向上させることを示しています。
本論文は、静的なネットワーク表現や内生的な重要性のみに依存する既存の中心性指標の限界を克服し、外生的要因と内生的増幅を統合した多変量ホークス過程に基づく動的枠組み「HawkesRank」を提案し、その有効性をシミュレーションおよびオンラインコミュニケーションの感情動向分析を通じて実証しています。
従来の近似誤差を回避し、軟センサーの予測精度を向上させるため、Wasserstein 距離を近接演算子として目的関数を緩和する新しい確率的潜在変数モデル「KProxNPLVM」を提案し、その収束性と実効性を理論的・実験的に検証した論文です。
この論文は、既存の統計的・浅層機械学習モデルの限界を克服するため、ネットワークのトポロジ相関と時間的パターンを同時に学習するカスタム化された GAT モデルと、クラスター化を導入したファインチューニングされたマルチモーダル LLM モデルを提案し、実世界のネットワークデータセットを用いた評価において、特に LLM ベースのモデルが優れた予測性能と汎化能力を示したことを報告しています。