UniSkill: A Dataset for Matching University Curricula to Professional Competencies
本論文は、欧州の ESCO タキソノミーと大学のカリキュラムを対応付ける大規模なデータセット「UniSkill」を公開し、BERT モデルを用いて講義とスキル間のマッチング精度 87% を達成したことを報告するものである。
2026 件の論文
本論文は、欧州の ESCO タキソノミーと大学のカリキュラムを対応付ける大規模なデータセット「UniSkill」を公開し、BERT モデルを用いて講義とスキル間のマッチング精度 87% を達成したことを報告するものである。
この論文は、LLM を活用して査読基準に基づき論文を自動修正するシステム「APRES」を提案し、引用数の予測精度向上と専門家による評価の改善を実証するとともに、科学の核心内容を変更せず人間の査読を補完するツールとしての可能性を示しています。
本論文は、大規模言語モデルによる自然言語からソルバ実行可能な産業最適化モデルへの自動変換において、構造化された知識グラフに基づくタイプ認識型検索拡張生成と最小依存閉包の導入により、既存手法では解決できなかった構造的誤りやコンパイル失敗を克服し、実用的な産業ケースで高い実行可能性と一般化性能を実証したことを示しています。
本論文は、オムニマルチモーダル大規模言語モデルにおけるクロスモーダルの幻覚を軽減するため、無関係なモダリティのノイズへの不変性と関連モダリティの変化への感応性を強制し、テキスト依存を抑制する「モダリティ分離型直接選好最適化(MoD-DPO)」を提案し、複数のベンチマークで既存手法を上回る性能を実証したものである。
既存のコードエージェント評価が単一リポジトリのバグ修正に偏っている現状を踏まえ、本論文はより現実的な課題を網羅する新しいベンチマーク「BeyondSWE」と検索機能統合フレームワーク「SearchSWE」を提案し、最先端モデルでさえ複雑なタスクにおいて性能が頭打ちになることや、検索による性能向上が一貫しないという課題を明らかにしている。
本論文は、自律走行、ロボティクス、ドローンなど多様な物理的実体における汎用性を可能にする共通基盤として「空間知能」に着目し、共有基盤の構築、専門化、そしてモデル統合を行う SSR パラダイムと GRPO を採用した汎用型基盤脳「ACE-Brain-0」を提案し、24 のベンチマークで最先端の性能を達成したことを報告しています。
本論文は、マルチステップのツール使用における安全な意思決定を可能にするため、明示的な安全性推論と拒否を第一級の行動として組み込み、ペアワイズな軌道比較に基づく強化学習を用いてエージェントを安全に整列させる新しいポストトレーニングフレームワーク「MOSAIC」を提案し、その有効性を複数のモデルと多様なベンチマークで実証したものである。
本論文は、LLM の推論時制御手法である対比型ステアリングがデータ汚染に対してある程度頑健である一方、悪意のあるデータ改ざんによる副作用を防止するため、高次元平均推定を頑健な平均推定子に置き換えることで効果的に緩和できることを示しています。
この論文は、明示的な評価ラベルを必要とせず、コミュニティがコンテンツに対して示す受容行動(エンゲージメントや維持)から誘発される表現空間の幾何学的構造(高密度領域)を「密度誘導型応答最適化(DGRO)」として活用し、多様なオンラインコミュニティの規範に言語モデルを自動的に適合させる手法を提案しています。
この研究は、化学の学習課題に対する生成 AI のフィードバックにおいて、学習の進展(LP)に基づいて自動的に作成された評価基準を用いたパイプラインが、専門家による手動作成の評価基準を用いた場合と同等の品質を達成できることを示しています。
本論文は、大規模言語モデルがもたらす「幻覚」や悪用リスクといった事実性の課題を分析し、事実確認者、報道機関、研究・政策コミュニティが直面する脅威と、それに対処するための技術的・規制的・リテラシー向上の解決策を探求するものである。
この論文は、OpenAI のデータ分析プラグインを定量的な共乗員として活用し、データ探索、可視化、および教師あり・教師なしモデリングタスクにおけるチャット GPT の可能性と限界を評価するものである。
本論文は、金融取引における大規模言語モデル(LLM)エージェントのアーキテクチャ、入力データ、バックテスト結果、および課題を包括的にレビューし、今後の研究方向性を示す調査研究である。
この論文は、大規模言語モデルに依存せず小規模モデルで高品質なドキュメントレベルの知識グラフを構築する合成データ生成・蒸留手法「Distill-SynthKG」を提案し、その品質向上が検索や質問応答タスクの性能向上にも寄与することを示しています。
この論文は、直交基底に基づく多項式・三角関数・熱帯化活性化関数を提案し、適切な初期化により大規模モデルの安定した学習を可能にするだけでなく、古典的活性化関数への近似性を通じてファインチューニングへの応用価値を示すものである。
本論文は、計算コストの高い探索や大規模な事後学習を不要とし、事前学習済みモデルに「思考カード」と呼ばれる軽量な推論パターンを動的に適用することで、マルチモーダル推論の精度と効率を大幅に向上させるトレーニング不要のフレームワーク「AStar」を提案するものである。
この論文は、大規模言語モデルの幻覚検出精度を向上させるため、モデルの不確実性をベイズ的に捉える単純なノイズ注入アプローチを提案し、標準的なサンプリング手法よりも優れた性能を実証したものです。
本論文は、2011 年から 2024 年の ICPC ワールドファイナル問題 166 問を用いた新規評価手法「LLM-ProS」により、最先端の LLM 5 種類の推論能力や効率性をベンチマークし、学習手法やデータ汚染の影響を含めたモデルの強みと限界を明らかにしたものである。
この論文は、大規模マルチモーダルモデルの憎悪的ミーム検出における性能と汎化能力を向上させ、敵対的攻撃への耐性や解釈性を高めるための堅牢な適応フレームワークを提案し、複数のデータセットで最先端の成果を達成したことを示しています。
この論文は、アラビア語の扇動的ミームと英語のヘイトミームの検出および説明生成を同時に改善するために、新しい大規模データセット「MemeXplain」と多段階最適化アプローチを提案し、既存の最先端手法を上回る性能を達成したことを報告しています。