Large Language Models for Travel Behavior Prediction
この論文は、ゼロショットプロンプティングと LLM 生成テキスト埋め込みの 2 つの枠組みを用いて大規模言語モデル(LLM)を交通行動予測に応用し、従来の統計モデルや機械学習モデルと同等かそれ以上の性能を達成できることを実証しています。
4099 件の論文
この論文は、ゼロショットプロンプティングと LLM 生成テキスト埋め込みの 2 つの枠組みを用いて大規模言語モデル(LLM)を交通行動予測に応用し、従来の統計モデルや機械学習モデルと同等かそれ以上の性能を達成できることを実証しています。
この論文は、分散環境で個別に学習されたミクスチャ・オブ・エキスパート(MoE)モデルを、標準的な平均化ではなく最適輸送に基づく枠組みで効率的に集約し、通信コストを最小化しながら中央集権的な訓練と同等の性能を実現する手法を提案しています。
この論文は、認知的関与や勤勉性が低い学習者向けにAI駆動のヒント説明を個人化することで、その説明への関与度、理解度、学習効果を向上させることを実証研究により示し、教育分野におけるパーソナライズされた説明可能AI(PXAI)の価値を裏付けています。
本論文は、大規模言語モデルの構造化プルーニングにおいて、微細粒度と粗粒度の重み重要度評価を適応的に融合する「HyWIA」手法を提案し、既存手法を上回る性能を達成することを示しています。
この論文は、言語を認知的な能力だけでなく社会的な実体としても捉えるべきだと主張し、大規模言語モデルを公共言語の科学的モデルとして位置づけることで、それらが言語学的洞察をもたらすことを論理的に擁護しています。
この研究は、28 年間の監視データを用いた説明可能な機械学習(ランダムフォレスト)により、アドリア海(トリエステ湾)におけるムラサキガイの DSP 中毒発生を予測し、Dinophysis 属の種や塩分・河川流量・降水量などの主要な予測因子を特定することで、早期警戒システムの改善と持続可能な養殖の実現に貢献しました。
この論文は、大規模言語モデル(LLM)を活用して探索を行い、標準的なプログラミング言語で記述された解釈可能な制御方策を自動生成する手法を提案し、振り子の振り上げやボールとカップなどのタスクにおける複雑な振る舞いの制御を実現することを示しています。
この論文は、LLM の圧縮による精度低下を微調整なしで補正し、精度と計算コストのバランスを柔軟に調整可能にする新規手法「EoRA」を提案し、3 ビット圧縮された LLaMA3-8B において大幅な精度向上と推論速度の改善を実現したことを報告しています。
この論文は、LLM の教師あり微調整(SFT)において、サンプル全体のフィルタリングではなく、タスクに寄与しないトークンを特定して除去する「トークンクリーニング」パイプラインを提案し、下流タスクの性能向上を実証しています。
この論文は、拡散モデルに基づく組み合わせ最適化ソルバーが追加学習なしで問題規模や問題種類(TSP から PCTSP や OP など)にわたる汎化性能を向上させるため、推論時の適応フレームワーク「DIFU-Ada」を提案し、その理論的基盤と有効性を示したものである。
この論文は、DEXPI データモデルをラベル付きプロパティグラフに変換し、グラフベースの検索拡張生成(Graph-RAG)を介して大規模言語モデル(LLM)と統合することで、パイプラインおよび計器図(P&ID)を自然言語で対話可能にする手法を提案しています。
本論文は、マルチモーダル基盤モデルのタイポグラフィ攻撃に対する脆弱性を評価するための大規模で多様な実世界データセット「SCAM」を構築・公開し、モデルのアーキテクチャや学習データが攻撃への耐性に与える影響を実証的に分析したものです。
この論文は、需要の欠測(センサリング)と依存性を伴うオフラインデータを用いて、在庫管理と価格設定の最適方針を学習する新たなデータ駆動型アルゴリズムを提案し、その有効性を理論的および数値的に検証するものである。
この論文は、タスク間干渉を抑制し、固定されたスイッチング間隔に依存しない適応的なタスクスイッチング方策を採用することで、リソース制約のある自律エージェントの効率的かつスケーラブルな多タスク学習を実現する新しい手法「SwitchMT」を提案し、その有効性をアタリゲームでの実験結果を通じて実証しています。
この論文は、LLM の評価・検証・強化に心理測定学の理論と手法を応用する新たな学際分野「LLM 心理測定学」を体系化し、人間中心の AI 開発に向けた包括的な枠組みと実用的な示唆を提供するシステマティックレビューである。
この論文は、高齢者や子供など非専門家からの曖昧な指示がロボットタスク計画に与える悪影響を初めて体系的に評価したベンチマーク「REI-Bench」を提案し、文脈認識に基づく指示の明確化により、その課題を効果的に解決する手法を提示しています。
この論文は、自然言語の指示に疑似コード表現を付加してファインチューニングを行うことで、LLM の指示追従能力を大幅に向上させつつ、数学的および常識推論の性能も維持・改善できる手法を提案し、12 のベンチマークでその有効性を実証したものである。
この論文は、2022 年から 2025 年にかけての ACL および arXiv 論文 25 万件を分析し、大規模言語モデル(LLM)の限界に関する研究(LLLMs)が急速に拡大し、推論、一般化、幻覚、バイアス、セキュリティが主要な研究トピックであることをデータ駆動型で包括的に調査したものです。
この論文は、新規環境における複数の事前学習済み知覚モデルの予測矛盾を、整合性に基づく帰納推論(アブダクション)として定式化し、論理的整合性を保ちつつ予測カバレッジを最大化する新しい枠組みを提案することで、単一モデルや標準的なアンサンブル手法を上回る頑健な性能を実現することを示しています。
小売販売予測に関する本研究は、欠損値や不規則な需要といった実務的な制約下では、複雑な深層学習モデルよりもXGBoost などの局所的な木ベースのアンサンブル手法が RMSE 4.833 で最高性能を示し、問題特性に合わせたモデル選択が重要であることを示しています。