Improving Fairness with Ensemble Combination: Margin-Dependent Bounds
この論文は、グループ公平性と個人公平性の両方を表現する新たな指標「discriminative risk」を提案し、マージン依存の理論的保証に基づいてアンサンブル組み合わせによる公平性の向上と、精度と公平性の両立を実現するアンサンブル剪定手法を導出するものである。
3461 件の論文
この論文は、グループ公平性と個人公平性の両方を表現する新たな指標「discriminative risk」を提案し、マージン依存の理論的保証に基づいてアンサンブル組み合わせによる公平性の向上と、精度と公平性の両立を実現するアンサンブル剪定手法を導出するものである。
この論文は、Google Brain の深層強化学習を用いたマクロ配置手法(Circuit Training)について、より強力なシミュレーテッド・アニーリング手法や商用ツールを用いた真の報酬評価、および新しいナノメートル級ベンチマークを通じて再評価を行い、再現性やスケーラビリティに関する未解決の課題を浮き彫りにしています。
本論文は、大規模言語モデルや他のニューラルネットワークを自然言語で対話させる「マインドストーム」を通じて単一モデルの限界を克服する「自然言語ベースの社会の心(NLSOM)」の概念を提唱し、その実証実験と、将来的な大規模異種エージェント社会の構造や経済原理に関する新たな研究課題を議論しています。
この論文は、ゼロショットプロンプティングと LLM 生成テキスト埋め込みの 2 つの枠組みを用いて大規模言語モデル(LLM)を交通行動予測に応用し、従来の統計モデルや機械学習モデルと同等かそれ以上の性能を達成できることを実証しています。
この論文は、分散環境で個別に学習されたミクスチャ・オブ・エキスパート(MoE)モデルを、標準的な平均化ではなく最適輸送に基づく枠組みで効率的に集約し、通信コストを最小化しながら中央集権的な訓練と同等の性能を実現する手法を提案しています。
この論文は、認知的関与や勤勉性が低い学習者向けにAI駆動のヒント説明を個人化することで、その説明への関与度、理解度、学習効果を向上させることを実証研究により示し、教育分野におけるパーソナライズされた説明可能AI(PXAI)の価値を裏付けています。
本論文は、大規模言語モデルの構造化プルーニングにおいて、微細粒度と粗粒度の重み重要度評価を適応的に融合する「HyWIA」手法を提案し、既存手法を上回る性能を達成することを示しています。
この論文は、言語を認知的な能力だけでなく社会的な実体としても捉えるべきだと主張し、大規模言語モデルを公共言語の科学的モデルとして位置づけることで、それらが言語学的洞察をもたらすことを論理的に擁護しています。
この研究は、28 年間の監視データを用いた説明可能な機械学習(ランダムフォレスト)により、アドリア海(トリエステ湾)におけるムラサキガイの DSP 中毒発生を予測し、Dinophysis 属の種や塩分・河川流量・降水量などの主要な予測因子を特定することで、早期警戒システムの改善と持続可能な養殖の実現に貢献しました。
この論文は、大規模言語モデル(LLM)を活用して探索を行い、標準的なプログラミング言語で記述された解釈可能な制御方策を自動生成する手法を提案し、振り子の振り上げやボールとカップなどのタスクにおける複雑な振る舞いの制御を実現することを示しています。
この論文は、LLM の圧縮による精度低下を微調整なしで補正し、精度と計算コストのバランスを柔軟に調整可能にする新規手法「EoRA」を提案し、3 ビット圧縮された LLaMA3-8B において大幅な精度向上と推論速度の改善を実現したことを報告しています。
この論文は、LLM の教師あり微調整(SFT)において、サンプル全体のフィルタリングではなく、タスクに寄与しないトークンを特定して除去する「トークンクリーニング」パイプラインを提案し、下流タスクの性能向上を実証しています。
この論文は、拡散モデルに基づく組み合わせ最適化ソルバーが追加学習なしで問題規模や問題種類(TSP から PCTSP や OP など)にわたる汎化性能を向上させるため、推論時の適応フレームワーク「DIFU-Ada」を提案し、その理論的基盤と有効性を示したものである。
この論文は、DEXPI データモデルをラベル付きプロパティグラフに変換し、グラフベースの検索拡張生成(Graph-RAG)を介して大規模言語モデル(LLM)と統合することで、パイプラインおよび計器図(P&ID)を自然言語で対話可能にする手法を提案しています。
本論文は、マルチモーダル基盤モデルのタイポグラフィ攻撃に対する脆弱性を評価するための大規模で多様な実世界データセット「SCAM」を構築・公開し、モデルのアーキテクチャや学習データが攻撃への耐性に与える影響を実証的に分析したものです。
この論文は、需要の欠測(センサリング)と依存性を伴うオフラインデータを用いて、在庫管理と価格設定の最適方針を学習する新たなデータ駆動型アルゴリズムを提案し、その有効性を理論的および数値的に検証するものである。
この論文は、タスク間干渉を抑制し、固定されたスイッチング間隔に依存しない適応的なタスクスイッチング方策を採用することで、リソース制約のある自律エージェントの効率的かつスケーラブルな多タスク学習を実現する新しい手法「SwitchMT」を提案し、その有効性をアタリゲームでの実験結果を通じて実証しています。
この論文は、LLM の評価・検証・強化に心理測定学の理論と手法を応用する新たな学際分野「LLM 心理測定学」を体系化し、人間中心の AI 開発に向けた包括的な枠組みと実用的な示唆を提供するシステマティックレビューである。
この論文は、高齢者や子供など非専門家からの曖昧な指示がロボットタスク計画に与える悪影響を初めて体系的に評価したベンチマーク「REI-Bench」を提案し、文脈認識に基づく指示の明確化により、その課題を効果的に解決する手法を提示しています。
この論文は、自然言語の指示に疑似コード表現を付加してファインチューニングを行うことで、LLM の指示追従能力を大幅に向上させつつ、数学的および常識推論の性能も維持・改善できる手法を提案し、12 のベンチマークでその有効性を実証したものである。