A Causal Graph Approach to Oppositional Narrative Analysis
この論文は、事前定義されたオントロジーやブラックボックスモデルに依存せず、ナラティブをエンティティ相互作用グラフとして表現し、ノードレベルの因果推論を用いて最小因果部分グラフを導出することで、対立的ナラティブの検出・分析・分類を従来手法を上回る精度で行う新しいフレームワークを提案しています。
1077 件の論文
この論文は、事前定義されたオントロジーやブラックボックスモデルに依存せず、ナラティブをエンティティ相互作用グラフとして表現し、ノードレベルの因果推論を用いて最小因果部分グラフを導出することで、対立的ナラティブの検出・分析・分類を従来手法を上回る精度で行う新しいフレームワークを提案しています。
本論文は、大規模なモデルに依存せず、マルチリンガルな HuBERT の事前学習が音声ディープフェイク検出のドメイン間頑健性と較正安定性を決定づける主要因であることを、RAPTOR による統制実験を通じて実証しています。
この論文は、人工文字体系の教師あり学習で得られた識別特徴を、歴史的に実証された文字体系への教師あり学習なしの知識蒸留に転用する二段階フレームワークを提案し、明確な境界と潜在的な歴史的関連性の両方を捉えた文字類似性学習を実現するものである。
本論文は、胸部 X 線レポート生成の評価において、診断の正確性や患者の安全性を重視し、臨床的コンテキストやガイドラインに基づいてエラーの重大度を重み付けする新しいメトリクス「CRIMSON」を提案し、複数のベンチマークで専門医の判断と高い一致を示したことを報告しています。
MAPO は、密なプロセスフィードバックと混合アドバンテージ推定器を活用して、主観的な多ターン対話における長期の相互作用品質を安定して最適化し、既存の手法を上回る性能と汎用性を達成する強化学習アルゴリズムである。
この論文は、大規模なコンテンツ分析における人間による正解ラベル作成の限界を克服するため、複数の大規模言語モデルの集合知を活用して正解の近似値を導き出す「AI-CROWD」プロトコルを提案し、その検証手法を提示するものである。
本論文は、RAG における生成モデルの能力を統合的に評価するための新たなベンチマーク「LIT-RAGBench」を提案し、統合、推論、論理、表処理、棄権の 5 つのカテゴリで構成されたデータセットを用いて、既存のモデルが 90% 以下の精度しか達成できない現状を明らかにするとともに、実用的な RAG 導入や専用モデル構築に向けた指標を提供しています。
本論文は、動的なアテンションパターンの瞬時発見と閾値処理を活用し、ソートや累積のオーバーヘッドを回避することで、長文脈から短文脈まで広範なシーケンス長において極めて高速なプレフィル処理を実現する「FlashPrefill」というフレームワークを提案しています。
この論文は、推論コストを削減しつつ解釈性を維持するために、推論セグメント全体の意味を柔軟に圧縮する「スパンレベルのセマンティックアライメント」と、事前学習済みモデルのヘッドで直接復号可能な「凍結ヘッド制約」を導入した、効率的かつ解釈可能な潜在推論フレームワーク「SPOT」を提案するものです。
この論文は、大規模言語モデルが英語中心のデータに依存しているため、特に宗教分野においてアジアの多様な世論やマイノリティの視点と乖離し、ネガティブなステレオタイプを増幅する傾向があることを、インド・東アジア・東南アジアを対象とした多言語監査を通じて実証し、軽微な介入ではこの文化的ギャップを解消できないことを示しています。
この論文は、ユーザーデータの断片化と非構造化ベクトル検索の限界を克服するため、多様なデータを意味トリプルに変換し、グラフ検索と深視覚的再照合を統合した神経記号アーキテクチャ「EpisTwin」を提案し、信頼性の高いパーソナル AI の実現に向けた新たな方向性を示すものです。
本論文は、データ不足と忘却の課題に直面する太平洋先住民言語の音声認識において、低ランク適応(LoRA)などの手法を評価し、逐次学習における内部表現の漂移と安定性・可塑性のジレンマを明らかにするとともに、これらの言語に特化した堅牢な適応戦略の必要性を強調する実証研究である。
この論文は、ルーマニアや英国などからの 12 名の現代美術家が参加した調査を通じて、ChatGPT による作品のパロディ生成が色彩やテクスチャの類似性は示しつつも、構図や概念、意図といった本質的な側面において欠如しており、単なる「言い換え」に留まることを明らかにし、AI 生成芸術の評価には単一の指標ではなく多角的なメトリクスを用いた「スタイル転換ダッシュボード」の導入を提唱しています。
本論文は、再帰的自己改善におけるアライメントのドリフトを防止し、コード生成や推論タスクでの性能向上を可能にするため、目標ドリフト指数、制約保持チェック、回帰リスク定量化の 3 つのセーフガードを組み合わせた実用的なフレームワーク「SAHOO」を提案するものである。
この論文は、数式テキストからオペランドと演算子の関係を抽出するタスクにトランスフォーマーベースのモデル(特に BERT)を適用し、SHAP による説明可能性を統合することで、99.39% の高精度を達成しつつ透明性を高めた数学的エンティティ関係抽出の解釈可能なフレームワークを提案しています。
この論文は、新しい義務的モダリティを明示的に符号化したワソン選択課題データセットを用いて大規模言語モデルを評価した結果、人間と同様に義務的ルールにおいて推論能力が高く、一致バイアスに似た誤りパターンを示すことを明らかにしました。
この論文は、IELTS 英作文の自動採点において、エンコーダー微調整、プロンプティング、指示微調整、RAG、DPO などの主要な LLM ベースのアプローチを包括的に比較し、k-SFT と RAG を統合した構成が 93% の F1 スコアを達成して最も優れた性能を示すことを実証しています。
本論文は、大規模言語モデル(LLM)が演繹だけでなく帰納的推論(アブダクション)においても人間と同様のバイアスを示すかどうかを、三段論法形式のデータセットを変換して検証し、文脈に即した推論の重要性を明らかにするものである。
この論文は、ユーザーの専門性や目標に応じた信頼性の高い説明を生成するために、LLM のハルシネーションを防ぎつつフィードバックループで個人化を実現する XAI 枠組み「PONTE」を提案し、医療・金融分野での評価でその有効性を示したものである。
本論文では、事前学習から適用可能な新しいアーキテクチャ拡張「NOBLE」を提案し、非線形低ランク分岐をトランスフォーマーの線形層に追加することで、最小限のパラメータ増加と計算コストでトレーニング効率を大幅に向上させることを示しています。