cs.AI 件の論文 | Gist.Science

From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains

この論文は、GenAI ツール、可視化作成、プログラミング環境といった創造的ドメインにおいて、単なる状態変化の記録を超えて意図や高次な創造的動きを捉えるための、それぞれ異なるアプローチ（ノードベースのインターフェース、視覚的キューの語彙、意味的履歴の埋め込み）を提示するものである。

Xiaohan Peng, Sotiris Piliouras, Carl Abou Saada Nujaim2026-03-10💻 cs

Governance Architecture for Autonomous Agent Systems: Threats, Framework, and Engineering Practice

本論文は、大規模言語モデル駆動の自律エージェントが抱える実行層の脆弱性に対処するため、4 層からなるガバナンスアーキテクチャ「LGA」を提案し、独自のバイリンガルベンチマークと広範な実験を通じて、その高い脅威検出率と低遅延な実用性を実証しています。

Yuxu Ge2026-03-10💻 cs

$\textbf{Re}^{2}$ : Unlocking LLM Reasoning via Reinforcement Learning with Re-solving

この論文は、推論経路が非生産的になった際に解決をやり直すことを学習させる「Re²（Reinforcement Learning with Re-solving）」という手法を提案し、事前教師あり学習なしに純粋な強化学習のみで LLM の推論効率と精度を大幅に向上させることを示しています。

Pinzheng Wang, Shuli Xu, Juntao Li, Yu Luo, Dong Li, Jianye Hao, Min Zhang2026-03-10💻 cs

A Miniature Brain Transformer: Thalamic Gating, Hippocampal Lateralization, Amygdaloid Salience, and Prefrontal Working Memory in Attention-Coupled Latent Memory

この論文は、前頭前野のワーキングメモリが対称性の破れを引き起こし、抑制性結合と相乗的に海馬の機能的側性化を急激に誘発するという、脳神経生物学的に動機付けられたミニチュア・ブレイントランスフォーマーの発見と、その検証結果を報告しています。

Hong Jeong2026-03-10💻 cs

VINO: Video-driven Invariance for Non-contextual Objects via Structural Prior Guided De-contextualization

VINO は、教師・学生フレームワークと構造的な情報ボトルネックを活用して、動画の自己教師あり学習において背景の文脈に依存しない頑健な物体特徴表現を学習し、PASCAL VOC における物体発見タスクで既存手法を大幅に上回る性能を達成する手法です。

Seul-Ki Yeom, Marcel Simon, Eunbin Lee, Tae-Ho Kim2026-03-10💻 cs

A Hybrid LTR-based System via Social Context Embedding for Recommending Solutions of Software Bugs in Developer Communities

この論文は、Stack Overflow のソーシャルコンテキスト埋め込みを活用した学習順序付け（LTR）ベースのハイブリッドシステムを提案し、開発者がソフトウェアバグの解決策を効率的に見つけられるよう、10 件の回答で約 78% の精度で最適な解決策を推薦する手法を確立したことを報告しています。

Fouzi Harrag, Mokdad Khemliche2026-03-10💻 cs

LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture

本論文は、衛星リモートセンシングデータにおける幾何学的な不整合を解決するため、従来の潜空間補間ではなく、幾何学的な拡張条件に基づいて変換された埋め込みを直接予測する「LEPA」という新しいアーキテクチャを提案し、その精度が大幅に向上することを示しています。

Erik Scheurer, Rocco Sedona, Stefan Kesselheim, Gabriele Cavallaro2026-03-10💻 cs

Learning When to Cooperate Under Heterogeneous Goals

この論文は、異質な目標を持つエージェントが協調するか単独で行動するかを判断するメタレベルの課題に焦点を当て、模倣学習と強化学習の階層的組み合わせを用いた新しいアプローチを提案し、その有効性を示すとともに、チームメイトの行動予測という補助コンポーネントの効果が観測可能な目標情報の量に反比例することを明らかにしています。

Max Taylor-Davies, Neil Bramley, Christopher G. Lucas2026-03-10💻 cs

Kinematics-Aware Latent World Models for Data-Efficient Autonomous Driving

この論文は、自律走行のデータ効率を向上させるため、車両の運動学情報を観測エンコーダに統合し、幾何学的な制約を潜在状態に課すことで、RSSM ベースの世界モデルの物理的整合性と長期予測精度を高める新しい枠組みを提案し、シミュレーション環境においてモデルフリーおよびピクセルベースの手法を上回る性能を実証したものです。

Jiazhuo Li, Linjiang Cao, Qi Liu, Xi Xiong2026-03-10💻 cs

VisualDeltas: Learning Preferences from Visual Quality Perturbations

VisualDeltas は、人間の注釈や外部教師を必要とせず、マルチモーダルデータ内の視覚的品質変化から自律的に学習信号を抽出する軽量な嗜好学習フレームワークであり、多様なベンチマークで既存手法を上回る性能を示します。

Hailiang Huang, Yihao Liu, Shengyue Guan, Haoze Li, Sujian Li2026-03-10💻 cs

Do Deployment Constraints Make LLMs Hallucinate Citations? An Empirical Study across Four Models and Five Prompting Regimes

この論文は、4 つの言語モデルと 5 つの提示条件を用いた実証研究により、展開制約を課しても LLM が生成する引用の存在率は 47.5% 以下に留まり、形式は整っていても事実無根の引用が多数含まれることを明らかにし、技術文献レビューやツールパイプラインへの導入前に事後検証の必要性を説いています。

Chen Zhao, Yuan Tang, Yitian Qian2026-03-10💻 cs

MAviS: A Multimodal Conversational Assistant For Avian Species

本論文は、1,000 種以上の鳥類を対象とした画像・音声・テキストを統合した大規模データセット「MAviS-Dataset」と、それに基づいて構築された鳥類専門のマルチモーダル対話モデル「MAviS-Chat」、およびその性能評価ベンチマーク「MAviS-Bench」を提案し、生態学応用におけるドメイン適応型マルチモーダル大規模言語モデルの有効性を示しています。

Yevheniia Kryklyvets, Mohammed Irfan Kurpath, Sahal Shaji Mullappilly, Jinxing Zhou, Fahad Shabzan Khan, Rao Anwer, Salman Khan, Hisham Cholakkal2026-03-10💻 cs

A Cortically Inspired Architecture for Modular Perceptual AI

この論文は、現在の単一モデルの限界を克服し、解釈性や構成的汎化、適応的堅牢性を高めるため、神経科学の知見に基づいて知覚を専門モジュールに分解し、階層的予測フィードバックループと共有潜在空間を通じて構造化された推論を実現するモジュラー型知能AIのアーキテクチャを提案しています。

Prerna Luthra2026-03-10💻 cs

Spectral Discovery of Continuous Symmetries via Generalized Fourier Transforms

この論文は、関数のスペクトル分解における構造化された疎性を検出することで、生成子空間の最適化に依存せず連続対称性を発見する、一般化フーリエ変換に基づく新しい枠組みを提案し、その有効性を双振り子やトップクォークタグ付けなどのタスクで実証しています。

Pavan Karjol, Kumar Shubham, Prathosh AP2026-03-10🤖 cs.LG

Data-Driven Hints in Intelligent Tutoring Systems

この論文は、過去の学習データに基づく「ヒントファクトリー」や「インタラクションネットワーク」、さらには大規模言語モデル（LLM）の統合を活用し、次なるステップのヒントや戦略的サブゴールの生成、提示タイミングの最適化など、インテリジェント・チューティングシステムにおけるデータ駆動型のヒント生成技術の進化と将来の可能性を探求しています。

Sutapa Dey Tithi, Kimia Fazeli, Dmitri Droujkov, Tahreem Yasir, Xiaoyi Tian, Tiffany Barnes2026-03-10💻 cs

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

この論文は、部分的に観測可能な強化学習における潜在状態分布のシフトに対する頑健性を向上させるため、敵対的な潜在初期状態分布を選択する設定を定式化し、理論的な証明と「戦艦」ベンチマークを用いた実証実験を通じて、構造化された敵対的曝露が最悪ケースの脆弱性を効果的に軽減することを示しています。

Angad Singh Ahuja2026-03-10🤖 cs.LG

Shutdown Safety Valves for Advanced AI

この論文は、高度な人工知能が目標達成のためにシャットダウンを阻止する懸念に対処するため、AI に「シャットダウンされること」を主目的とするという非伝統的な提案と、その有効性及び適用条件について論じている。

Vincent Conitzer2026-03-10🤖 cs.LG

FinSheet-Bench: From Simple Lookups to Complex Reasoning, Where LLMs Break on Financial Spreadsheets

この論文は、実業界の機密データに代わる合成データを用いたベンチマーク「FinSheet-Bench」を提案し、主要な大規模言語モデル（LLM）が複雑な財務スプレッドシートからの情報抽出や数値推論において依然として高い誤り率を示しており、専門的な金融用途での自律的な利用には文書理解と確定的な計算を分離するアーキテクチャの導入が必要であると結論付けています。

Jan Ravnik, Matjaž Ličen, Felix Bührmann, Bithiah Yuan, Felix Stinson, Tanvi Singh2026-03-10💻 cs

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

この論文は、正則化された最適化におけるパラメータノルムの階層をゆっくりと移動する「ノルム階層遷移（NHT）」フレームワークを提案し、ニューラルネットワークがスパースなショートカットから構造化された表現へ移行するタイミングと遅延のメカニズムを説明するものである。

Truong Xuan Khanh, Truong Quynh Hoa2026-03-10🤖 cs.LG

The Third Ambition: Artificial Intelligence and the Science of Human Behavior

この論文は、大規模言語モデルを「生産性」や「整合性」に次ぐ第三の目標として、人間の行動・文化・道徳的推論を研究するための科学的ツールとして位置づけ、その方法論的アプローチと認識論的限界を論じています。

W. Russell Neuman, Chad Coleman2026-03-10💬 cs.CL

← 前へ次へ →

cs.AI