OpenSanctions Pairs: Large-Scale Entity Matching with LLMs
この論文は、実世界の国際制裁データから構築された大規模なエンティティマッチングベンチマーク「OpenSanctions Pairs」を公開し、既存のルールベース手法を大幅に上回る精度で LLM が機能することを実証するとともに、今後の研究の焦点をペアマッチングからブロッキングやクラスタリングなどのパイプライン構成要素へシフトさせる必要性を提言しています。
3672 件の論文
この論文は、実世界の国際制裁データから構築された大規模なエンティティマッチングベンチマーク「OpenSanctions Pairs」を公開し、既存のルールベース手法を大幅に上回る精度で LLM が機能することを実証するとともに、今後の研究の焦点をペアマッチングからブロッキングやクラスタリングなどのパイプライン構成要素へシフトさせる必要性を提言しています。
本論文は、ニューラルオペレータのモジュール構造(リフティング・伝播・復元)を活用し、リフティング段階にのみ確率的摂動を注入することで、計算効率と空間的忠実性を両立した構造化エピステミック不確実性推定手法を提案し、複雑な偏微分方程式の surrogate モデルにおける信頼性の高い不確実性評価を実現することを示しています。
この論文は、推論スループットの最適化を従来の実験的アプローチに頼らず、事前学習済み大規模言語モデルのハイパーパラメータと推論効率を理論的に結びつけることで、推論システムの構成要素を事前学習前に最適化可能にする「Speculative Decoding Scaling Laws (SDSL)」を提案しています。
本論文は、ESP32 マイコン上で 30ms の推論遅延を実現し、外部計算リソースに依存せずリアルタイム自律航行を可能にする、2 万 3 千パラメータの量子化 2D CNN を用いたエンドツーエンドの TinyML システム「TinyNav」を提案するものである。
本論文は、時間系列の因果推論における基礎モデルの構築を可能にするため、介入データを含む合成時系列構造因果モデルを生成するフレームワーク「CausalTimePrior」を提案し、これにより事前適合ネットワーク(PFN)が未知のモデルに対して文脈内因果効果推論を遂行できることを実証しています。
この論文は、データストリームにおける概念ドリフトの検出精度を向上させるため、多数のメタ情報特徴量からなる一意な「指紋」を動的に重み付けして概念を表現する汎用フレームワーク「FiCSUM」を提案し、実世界および合成データセットにおける既存手法を上回る性能を実証したものである。
この論文は、可逆的なグラフ直列化と BPE を組み合わせてグラフをシーケンス表現に変換する新しいトークナイザを提案し、アーキテクチャの変更なしに Transformer をグラフデータに適用可能にし、14 のベンチマークで最先端の性能を達成したことを示しています。
本論文は、スパースな混合専門家(MoE)トランスフォーマーにおいて、異なるタスクが層を超えた専門家の活性化パターンを要約する「ルーティング署名」として明確に区別可能であることを実証し、ルーティングメカニズムが単なる負荷分散ではなくタスクに敏感な計算の構成要素であることを示しています。
この論文は、一般の非再生到着過程の重ね合わせを解析的に扱う難しさを克服するため、合成データで訓練された深層学習モデルを用いて、複数の到着ストリームの低次モーメントと自己相関を高精度に推定するスケーラブルな学習ベースの重ね合わせ演算子を提案し、これにより複雑な待ち行列ネットワークの分布性能解析を可能にするものである。
本論文は、被験者間の個人差に起因する課題を解決するため、個々の脳波ダイナミクスと学習可能なグループプロトタイプおよび多被験者共鳴モデルを統合した「グループ共鳴ネットワーク(GRN)」を提案し、感情認識タスクにおいて既存手法を上回る性能を達成したことを報告しています。
本研究は、複数の地域に共通する短期の気象・エネルギー需要パターンを捉える高解像度の気象情報に基づく代理モデルを提案し、単一の地点での学習のみで異なる気候帯の建物エネルギー需要を高精度に予測可能にするデータ効率性の高い手法を開発した。
本論文は、冷たいスタートやドメインシフトといった課題に対処し、未見の分子スキャフォールドやタンパク質ファミリーに対する汎化性能を飛躍的に向上させるため、アフィニティを考慮した潜在拡散モデル「Co-Diffusion」を提案し、その有効性を示しています。
この論文は、 sawtooth 関数の効率的な表現を可能にする 3 次元のネットワークアーキテクチャを導入することで、解析関数および関数に対する指数関数的かつ非漸近的な高精度近似を実現し、パラメータ効率の向上に寄与する理論的基盤を確立したものである。
本論文は、局所コスト関数とハードウェア効率的なテンソルネットワーク初期化戦略を用いてバレーン・プレートーを解決し、MNIST 画像分類で 98.7% の高精度を達成するとともに、同等の古典的 CNN よりも遥かに少ないパラメータで収束するスケーラブルな量子畳み込みニューラルネットワークを提案するものである。
この論文は、タンパク質配列におけるペアワイズ相互作用だけでなく、より複雑な三項相互作用を明示的に統合した「Higher-Order Modular Attention(HOMA)」を提案し、タンパク質の二次構造や安定性などの予測タスクにおいて、標準的な自己注意機構や既存の効率的な変種を上回る性能を達成したことを報告しています。
この論文は、観測された共変量とラベルの間に交絡が存在する状況、および観測データが独立同一分布(IID)である場合とある程度の依存性が許容される場合の両方において、コンフォーマル e-予測を拡張する手法を提案しています。
本論文は、教師モデルからの報酬を柔軟に活用する「REOPOLD」というフレームワークを提案し、オンポリシー蒸留の不安定さを解消するとともに、数学や視覚、エージェントタスクにおいて従来の強化学習手法を凌駕するサンプル効率と推論時のスケーリング性能を実現することを示しています。
本論文は、最小誤差エントロピー原理に基づく非ペナルティ化およびスパースペナルティ化深層ニューラルネットワークを用いて、強混合条件下の非パラメトリック回帰問題における期待過剰リスクの上限を導出し、ガウス誤差モデルにおいてSchmidtらによって確立された下限と一致する(対数因子を除く)最小最大収束率を達成することを示しています。
本論文は、組み込みシステム分野の専門知識に特化した継続的事前学習パイプライン「H2LooP Spark Preview」を導入し、70 億パラメータのオープンモデルを低レベルコード生成において 300 億パラメータ級の大規模モデルや最先端モデルと同等以上の性能を発揮させることに成功したことを報告しています。
この論文は、機械学習モデルの予測に至るプロセスの公平性を確保するため、異なる保護グループ間での説明の一貫性を強制する正則化フレームワーク「GCIG」を提案し、予測性能を維持しつつ説明の格差を大幅に削減できることを実証しています。