Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training
この論文は、金融分野の専門用語や数値推論の厳格な要件に対処するため、高品質な推論連鎖(CoT)の蒸留と難易度・検証可能性を考慮したデータ選定を組み合わせることで、同サイズの既存のオープンソース金融 LLM を凌駕する性能を持つモデルを開発し、関連データセットとモデルを公開したことを報告しています。
9837 件の論文
この論文は、金融分野の専門用語や数値推論の厳格な要件に対処するため、高品質な推論連鎖(CoT)の蒸留と難易度・検証可能性を考慮したデータ選定を組み合わせることで、同サイズの既存のオープンソース金融 LLM を凌駕する性能を持つモデルを開発し、関連データセットとモデルを公開したことを報告しています。
本論文は、解剖学的事前知識と適応的コンテキストモデリングを統合し、極めて少ないパラメータ数と計算量でトランスフォーマーベースの手法に匹敵する精度を達成する軽量な 3D 医用画像セグメンテーションモデル「LightMedSeg」を提案するものである。
この論文は、深層学習に基づく条件付き変換モデルと交差適合法を導入して連続・離散の両方の結果変数に対応する条件付きランク・ランク回帰(CRRR)を拡張し、非線形性や高次相互作用を考慮した世代間移動度のより正確な推定と推論を可能にする手法を提案し、米国所得やインドの教育移動度に関する実証分析を通じてその有効性を示しています。
本論文は、遺伝子擾乱に対する細胞応答の予測において、従来の RAG では得られない性能向上を実現するため、細胞状態と入力擾乱の両方に条件付けられた微分可能な 2 段階検索機構を備えた新しいフレームワーク「PT-RAG」を提案し、その有効性を実証したものである。
本論文は、検索エンジンと推論プロセスのミスマッチを解消し、検索空間の構造的特性をエージェントの観測空間に統合する「WeDas」フレームワークを提案し、動的な Web 環境におけるサブゴールの達成と精度を向上させることを目的としています。
本論文は、台湾の肺がん生存者データと米国 SEER データの統合におけるプライバシーと特徴量の不一致という課題に対し、外部データを活用しつつデータ共有を回避する「損失融合水平フェデレーテッド学習(LF2L)」フレームワークを提案し、二次原発がんの予測精度を大幅に向上させたことを示しています。
この論文は、カオス時系列データから明示的かつ解釈可能な代数方程式を学習する「記号ニューラルフォレキャスター(SyNF)」と「記号木フォレキャスター(SyTF)」の 2 つの手法を提案し、これらがブラックボックスモデルと同等の予測精度を維持しつつ、背後にある力学の透明性を提供することを示しています。
本論文は、患者の無断欠席予測と多目的強化学習を統合し、適応的なダブルブッキング戦略を提案することで、外来診療の効率化と待ち時間短縮を両立するデータ駆動型のスケジューリング枠組みを構築したものである。
この論文は、条件付き生成や逆問題を単一ステップで解決するため、サンプリング経路の誘導ではなく「適切な初期ノイズ分布を学習する」という新たな視点に基づき、変分フローマップ(VFM)というフレームワークを提案するものです。
この論文は、Vocos を基盤としたニューラルボコーダーと軽量なリファイナーを組み合わせて、8-48 kHz の任意のアップサンプリング比率に対応し、GPU および CPU 上で極めて高速なリアルタイム処理を実現する音声帯域幅拡張モデルを提案しています。
この論文は、関数のスペクトル分解における構造化された疎性を検出することで、生成子空間の最適化に依存せず連続対称性を発見する、一般化フーリエ変換に基づく新しい枠組みを提案し、その有効性を双振り子やトップクォークタグ付けなどのタスクで実証しています。
本論文は、人間の手を介さずに強化学習エージェントが自律的にニューラルアーキテクチャとハイパーパラメータを探索し、約 300 回の反復で手動チューニングされたベースラインに匹敵またはそれ以上の性能を達成する「AutoResearch-RL」という永続的自己評価フレームワークを提案するものである。
この論文は、広域かつ長期的な地域における郡レベルの作物収量予測の課題を解決するため、短期・長期の時間的パターンを捉える新アーキテクチャと、空間的変動への適応を強化する検索ベースの補強戦略を組み合わせた新しい予測フレームワークを提案し、米国 corn 収量データを用いた実験で既存手法を上回る性能を実証しています。
この論文は、セグメンテーションモデル(SAM)の画像エンコーダとマスクデコーダの特性を考慮し、構造とスペクトルを保持するトークンマージ手法「StructSAM」を提案することで、既存の手法よりも高い効率性と精度を両立させることを示しています。
この論文は、部分的に観測可能な強化学習における潜在状態分布のシフトに対する頑健性を向上させるため、敵対的な潜在初期状態分布を選択する設定を定式化し、理論的な証明と「戦艦」ベンチマークを用いた実証実験を通じて、構造化された敵対的曝露が最悪ケースの脆弱性を効果的に軽減することを示しています。
この論文は、高度な人工知能が目標達成のためにシャットダウンを阻止する懸念に対処するため、AI に「シャットダウンされること」を主目的とするという非伝統的な提案と、その有効性及び適用条件について論じている。
この論文は、微分プライバシーの手法に着想を得た「ShakyPrepend」という新しい多グループ学習アルゴリズムを提案し、既存手法よりも優れた理論的保証と、グループ構造および空間的不均一性への適応能力を実証実験を通じて示しています。
この論文は、正則化された最適化におけるパラメータノルムの階層をゆっくりと移動する「ノルム階層遷移(NHT)」フレームワークを提案し、ニューラルネットワークがスパースなショートカットから構造化された表現へ移行するタイミングと遅延のメカニズムを説明するものである。
本論文は、5G 網におけるリアルタイムかつリソース制約のある環境でのジャミング検出を実現するため、FPGA 展開に適した軽量で解釈可能な畳み込みツェトリン機械(CTM)を提案し、実 5G テストベッドを用いた実験により、従来の CNN に匹敵する検出精度を達成しつつ、トレーニング速度の大幅な向上とメモリ使用量の劇的な削減を実現したことを示しています。
本論文は、ブラックボックスモデルが学習した概念をスパースオートエンコーダとマルチモーダル LLM を用いて抽出・命名する「Mechanistic CBM(M-CBM)」を提案し、事前定義された概念に依存する既存の概念ボトルネックモデルよりも高い予測精度と説明性を実現することを示しています。