cs.AI 件の論文 | Gist.Science

GraphSkill: Documentation-Guided Hierarchical Retrieval-Augmented Coding for Complex Graph Reasoning

この論文は、技術文書の階層構造を活用した階層的検索と自動テストケース生成による自己デバッグを組み合わせたエージェント型フレームワーク「GraphSkill」を提案し、複雑なグラフ推論タスクにおけるコード生成の精度向上と推論コストの削減を実現するものです。

Fali Wang, Chenglin Weng, Xianren Zhang, Siyuan Hong, Hui Liu, Suhang Wang2026-03-10🤖 cs.LG

From ARIMA to Attention: Power Load Forecasting Using Temporal Deep Learning

本論文は、PJM の電力消費データを用いた短期負荷予測の比較検討を通じて、ARIMA、LSTM、BiLSTM、Transformer 各モデルの性能を評価し、自己注意機構に基づく Transformer モデルが MAPE 3.8% の最高精度と堅牢性を示したことを報告しています。

Suhasnadh Reddy Veluru, Sai Teja Erukude, Viswa Chaitanya Marella2026-03-10🤖 cs.LG

Exploration Space Theory: Formal Foundations for Prerequisite-Aware Location-Based Recommendation

この論文は、知識空間理論を位置情報推薦に応用し、訪問地点間の前提依存関係を格子論的に定式化した「探索空間理論（EST）」を提案し、その数学的構造に基づいて構造的妥当性が保証された推薦システム（ESRS）を構築することを目的としています。

Madjid Sadallah2026-03-10🤖 cs.LG

Pavement Missing Condition Data Imputation through Collective Learning-Based Graph Neural Networks

本論文は、センサー誤差や非定期的な点検により生じる舗装状態データの欠損を、隣接区間の特性と観測区間間の依存関係の両方を学習する集団学習ベースのグラフ畳み込みネットワークを用いて高精度に補完する手法を提案し、テキサス州交通省のデータを用いた実証実験でその有効性を示したものである。

Ke Yu, Lu Gao2026-03-10🤖 cs.LG

Grouter: Decoupling Routing from Representation for Accelerated MoE Training

この論文は、MoE（Mixture-of-Experts）モデルの構造最適化と重みの更新を分離する「Grouter」という事前ルーティング手法を提案し、高品質な構造を固定ルーターとして活用することで、トレーニングの収束速度と品質を大幅に向上させ、スケーラブルな MoE 訓練のパラダイムを確立したことを示しています。

Yuqi Xu, Rizhen Hu, Zihan Liu, Mou Sun, Kun Yuan2026-03-10🤖 cs.LG

Photons = Tokens: The Physics of AI and the Economics of Knowledge

この論文は、ランドウアーの原理やシャノンの情報理論などの物理的・経済的枠組みを用いて AI 計算（トークン）の限界を定量化し、単なる計算量の拡大ではなく「どの問いが価値あるか」という方向性の問題こそが AI 発展の決定的な制約であることを示唆しています。

Alec Litowitz, Nick Polson, Vadim Sokolov2026-03-10🔬 physics

SmartBench: Evaluating LLMs in Smart Homes with Anomalous Device States and Behavioral Contexts

この論文は、スマートホームにおける異常なデバイス状態や行動文脈を検知・対応する能力を評価するための初のデータセット「SmartBench」を提案し、13 の主要な大規模言語モデル（LLM）のテスト結果から、現状の最先端モデルでも異常検知の精度が十分でなく、次世代のスマートホームアシスタントの実用化にはまだ課題が多いことを明らかにしています。

Qingsong Zou, Zhi Yan, Zhiyao Xu, Kuofeng Gao, Jingyu Xiao, Yong Jiang2026-03-10🤖 cs.LG

HEARTS: Benchmarking LLM Reasoning on Health Time Series

この論文は、大規模言語モデル（LLM）の健康時系列データに対する推論能力を包括的に評価し、その限界を明らかにするための新しいベンチマーク「HEARTS」を提案するものです。

Sirui Li, Shuhan Xiao, Mihir Joshi, Ahmed Metwally, Daniel McDuff, Wei Wang, Yuzhe Yang2026-03-10🤖 cs.LG

RECAP: Local Hebbian Prototype Learning as a Self-Organizing Readout for Reservoir Dynamics

本論文は、誤差逆伝播を用いずに、学習済みのリザーバの動的応答とヘッビアン学習に基づく自己組織化プロトタイプ読み出しを組み合わせた「RECAP」という画像分類手法を提案し、汚染データに曝されなくても MNIST-C における多様なノイズに対して高い頑健性を示すことを実証しています。

Heng Zhang2026-03-10🤖 cs.LG

SR-TTT: Surprisal-Aware Residual Test-Time Training

この論文は、テスト時トレーニング（TTT）モデルが持つ文脈圧縮による「針の干し草」タスクでの失敗を解決するため、驚異的なトークンのみを従来の注意機構に動的にルーティングする「SR-TTT」という新しいアーキテクチャを提案し、O(1) メモリ効率を維持しながら完全な文脈記憶を実現することを示しています。

Swamynathan V P2026-03-10🤖 cs.LG

Trust Aware Federated Learning for Secure Bone Healing Stage Interpretation in e-Health

本論文は、分散医療センシング環境における信頼性の低いまたは敵対的な参加者の影響を軽減し、骨治癒段階の解釈精度と訓練の安定性を向上させるために、適応型信頼スコア管理メカニズムを組み込んだ信頼性感知連合学習フレームワークを提案するものである。

Paul Shepherd, Tasos Dagiuklas, Bugra Alkan, Joaquim Bastos, Jonathan Rodriguez2026-03-10🤖 cs.LG

Performance Comparison of IBN orchestration using LLM and SLMs

本論文は、5G/6G 向け意図ベースネットワーク（IBN）オーケストレーションにおいて、大規模言語モデル（LLM）と小規模言語モデル（SLM）を階層的マルチエージェント構造で活用する新枠組みを提案し、両者の翻訳精度が同等である一方で、SLM を用いることで IBN ライフサイクルの完了速度を 20% 向上できることを示しています。

Wai Lwin Phone, Brahim El Boudani, Tasos Dagiuklas, Saptarshi Ghosh2026-03-10💻 cs

ObjChangeVR: Object State Change Reasoning from Continuous Egocentric Views in VR Environments

この論文は、VR 環境におけるユーザーの直接操作を伴わない背景での物体状態変化を検出する新たな課題に対応するため、評価用データセット「ObjChangeVR-Dataset」と、視点認識・時系列検索・クロス視点推論を組み合わせたフレームワーク「ObjChangeVR」を提案し、その有効性を示したものです。

Shiyi Ding, Shaoen Wu, Ying Chen2026-03-10💻 cs

HURRI-GAN: A Novel Approach for Hurricane Bias-Correction Beyond Gauge Stations using Generative Adversarial Networks

本論文は、物理シミュレーションモデルの計算時間を短縮しつつ精度を維持するために、時間系列生成敵対的ネットワーク（TimeGAN）を用いて観測地点を超えた地域におけるハリケーンによる高潮のバイアス補正を行う新しい手法「HURRI-GAN」を提案し、その有効性を示したものです。

Noujoud Nadera, Hadi Majed, Stefanos Giaremis, Rola El Osta, Clint Dawson, Carola Kaiser, Hartmut Kaiser2026-03-10🤖 cs.LG

Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds

本論文は、目的関数によって誘起される多様体の幾何構造を n 次元球で局所的に近似し、学習率を不要とする測地線勾配降下法（GGD）を提案し、全結合ネットワークおよび畳み込みニューラルネットワークにおいて Adam などの既存手法を上回る性能向上を実証しています。

Liwei Hu, Guangyao Li, Wenyong Wang, Xiaoming Zhang, Yu Xiang2026-03-10🤖 cs.LG

PaLMR: Towards Faithful Visual Reasoning via Multimodal Process Alignment

この論文は、視覚的証拠の誤った認識を伴う推論プロセスの幻覚を解消し、最終的な正解だけでなく推論プロセス自体を視覚的事実と整合させるためのフレームワーク「PaLMR」を提案し、Qwen2.5-VL-7B における HallusionBench などで SOTA 性能を達成したことを報告しています。

Yantao Li, Qiang Hui, Chenyang Yan, Kanzhi Cheng, Fang Zhao, Chao Tan, Huanling Gao, Jianbing Zhang, Kai Wang, Xinyu Dai, Shiguo Lian2026-03-10💻 cs

A Parameter-efficient Convolutional Approach for Weed Detection in Multispectral Aerial Imagery

本論文では、ConvNeXt のバックボーンを凍結し、効率的な畳み込みを用いた特徴補正ブロック（FCB）と軽量デコーダを組み合わせた FCBNet を提案し、多スペクトル航空画像における雑草検出において、高精度かつ計算効率の面で既存モデルを上回る性能を実証しています。

Leo Thomas Ramos, Angel D. Sappa2026-03-10💻 cs

GameVerse: Can Vision-Language Models Learn from Video-based Reflection?

本論文は、人間のゲームプレイにおける「行動・反省・再挑戦」のループを模倣し、失敗事例と専門家のチュートリアル動画を組み合わせることで視覚言語モデル（VLM）の戦略を学習・改善させることを可能にする新しいベンチマーク「GameVerse」を提案し、その有効性を示しています。

Kuan Zhang, Dongchen Liu, Qiyue Zhao, Jinkun Hou, Xinran Zhang, Qinlei Xie, Miao Liu, Yiming Li2026-03-10💻 cs

Science Literacy: Generative AI as Enabler of Coherence in the Teaching, Learning, and Assessment of Scientific Knowledge and Reasoning

この論文は、生成 AI が科学リテラシーの定義や教育課題を再考させ、科学知識と推論の教授・学習・評価の一貫性を高めるためのアーキテクチャの構築とその実装、さらには今後の研究開発の方向性を論じています。

Xiaoming Zhai, James W. Pellegrino, Matias Rojas, Jongchan Park, Matthew Nyaaba, Clayton Cohn, Gautam Biswas2026-03-10💻 cs

Graph-of-Mark: Promote Spatial Reasoning in Multimodal Language Models with Graph-Based Visual Prompting

本論文は、画像内の物体間の関係性を捉えるためにシーングラフを視覚的プロンプトとして重ね合わせる「Graph-of-Mark」を提案し、マルチモーダル言語モデルのゼロショット空間推論能力を最大 11 ポイント向上させることを実証しています。

Giacomo Frisoni, Lorenzo Molfetta, Mattia Buzzoni, Gianluca Moro2026-03-10💻 cs

← 前へ次へ →