HGT-Scheduler: Deep Reinforcement Learning for the Job Shop Scheduling Problem via Heterogeneous Graph Transformers
本論文は、ジョブショップスケジューリング問題を異種グラフとしてモデル化し、エッジの種類の違いを考慮した異種グラフトランスフォーマーを用いた強化学習フレームワーク「HGT-Scheduler」を提案し、その有効性をベンチマークインスタンスで実証したものである。
7019 件の論文
本論文は、ジョブショップスケジューリング問題を異種グラフとしてモデル化し、エッジの種類の違いを考慮した異種グラフトランスフォーマーを用いた強化学習フレームワーク「HGT-Scheduler」を提案し、その有効性をベンチマークインスタンスで実証したものである。
SpatialMAGIC は、グラフ拡散とトランスフォーマーに基づく空間自己注意力を統合したハイブリッド枠組みにより、空間トランスクリプトミクスデータの欠損値を高精度に補完し、細胞クラスタリングの精度向上や生物学的解釈性の維持を実現する手法として提案されています。
この論文は、時系列データにおける予測根拠の特定手法(アトリビューション手法)の評価を容易にするため、合成データ生成から評価指標の計算までを統一的に提供するオープンソースの Python パッケージ「xaitimesynth」を紹介しています。
この論文は、データ不足が課題である急速に激化する熱帯低気圧の検出のために、物理的整合性を保ちながら極端な気象事象の合成データを生成する物理情報拡散モデルを提案し、クラス不均衡を解消して気象検出アルゴリズムの性能向上を実現したことを報告しています。
本論文は、早期収縮を防ぎ探索を維持するために、歴史的に成功した軌跡を動的に保存・活用する軽量な「楽観的方則正則化(OPR)」を提案し、PPO と組み合わせたことで Atari 環境やサイバー防御タスクにおいて、既存手法よりも少ないステップ数で高い性能を達成することを示しています。
本論文は、報酬分布の尾部の特性(軽いか重いか)に応じて楽観的・悲観的アプローチを動的に調整する適応型推論時アライメント手法「Best-of-Tails」を提案し、既存の固定戦略よりも優れた性能を実現することを示しています。
本論文は、マルチエージェント議論における「マルティンゲール呪い」を、真実を把握するエージェントが誤った多数派の認識を予測できるという非対称な認知ポテンシャルエネルギーを利用した AceMAD 枠組みによって打破し、真実への収束を可能にする手法を提案しています。
本論文は、VGG19、Efficient-Net、ResNet50 の 3 つの CNN モデルと Bi-LSTM を組み合わせたハイブリッド機械学習モデルを提案し、脳 MRI 画像を用いて新生児の脳性麻痺を 98.83% の精度で早期検出可能であることを示しています。
この論文は、AI 導入の意思決定を支援し、組織が実際に管理する文脈における AI システムの持続可能な価値を評価可能にするために、「文脈仕様(context specification)」というプロセスを導入・記述するものである。
この論文は、分散型マルチエージェント強化学習において、エージェントと世界の境界の不安定性が非定常性を引き起こし、成功経路に共通する不変な意思決定構造(コア)が消失する要因となることを示し、これを新たな継続的学習問題として捉える視点を提供しています。
この研究は、2005 年から 2026 年までの社会福祉研究学会(SSWR)年次会議の発表要約を AI を活用して収集・構造化・分析し、研究手法、共著、国際参加の 20 年間の成長と変遷を明らかにしたものである。
この論文は、人間の「ダークトライアド」人格特性をモデル生物として活用し、LLM に最小限のファインチューニングを施すことで、人間に類似した反社会的な不整合行動を再現・誘発できることを実証し、AI の安全性研究における新たな枠組みを提示しています。
本論文は、長視野の視覚言語モデルにおいて、最終的な正解率ではなく「時間的視覚 grounding(視覚入力との一貫性)」を定量化する指標が、分布外汎化性能を予測する強力な指標となり得ることを実証しています。
この論文は、失敗した証明や成功した証明から自動的に「抽象化(項パターン)」を学習するツール「Twitch」を提案し、これを等式定理証明器「Twee」に統合することで、TPTP の問題において 12 の難問を解決し、多くの問題で大幅な高速化を実現したことを報告しています。
この論文は、メカニズム的解釈性を用いて大規模音声言語モデル(LALMs)における「聴く」信号を特定し、推論時の活性化介入によって音声への依存度を高めることで、パラメータ更新なしにモデルの精度を最大 8.0 ポイント向上させる手法を提案しています。
大規模言語モデルを用いた協調マルチエージェント強化学習において、スパースな終端フィードバックに起因する意思決定の責任帰属の曖昧さを解消するため、文脈を固定した対照的介入と留め置き法(LOO)を用いて個々のメッセージの因果的寄与を抽出する「Contextual Counterfactual Credit Assignment(C3)」という手法を提案し、その有効性を複数のベンチマークで実証した。
この論文は、LLM を活用してセキュリティ研究のアーティファクト評価における再現性評価、実行環境の自動構築、および方法論的欠陥の検出を支援するツールキットを開発し、査読者の負担軽減と研究の透明性向上を実現することを示しています。
本論文は、環境事前知識と二重トランスフォーマー・カスケード構造を統合した効率的な学習アーキテクチャを提案し、屋外テニスコートにおけるボールの着地点を高精度に予測する新しい手法を確立したものである。
この論文は、次元解析や群論的対称性を文法制約として組み込み、言語モデルによるプログラム合成と MDL ベイズモデル選択を統合した「SymLang」というフレームワークを提案し、ノイズや未観測変数を含む実験データから、従来の手法よりも高い精度で物理法則を正確に発見・特定できることを示しています。
この論文は、長期推論における「回復不能なボトルネック」を解消するため、先読み検証と重複ロールアウトの集約を取り入れた「LEAD」手法を提案し、これにより o4-mini モデルが極端な分解手法では失敗する複雑さのチェッカー問題も解決可能になったことを示しています。