cs.AI 件の論文 | Gist.Science

VB: Visibility Benchmark for Visibility and Perspective Reasoning in Images

本論文は、画像内の視認性と視点推論を評価し、モデルが「見える/見えない」を判断するだけでなく、人間にも判断できない場合に棄権できる能力を検証する新しいベンチマーク「VB」を提案し、主要な大規模言語モデルの性能を比較評価したものである。

Neil Tripathi2026-03-10💻 cs

Narrative Weaver: Towards Controllable Long-Range Visual Consistency with Multi-Modal Conditioning

本論文は、マルチモーダル大規模言語モデルによる物語計画と動的メモリバンクを備えた制御モジュールを統合し、長期的な視覚的一貫性と物語の整合性を維持する「Narrative Weaver」を提案するとともに、関連タスクの初となる大規模データセット「EAVSD」を公開し、生成 AI による長編コンテンツ制作の可能性を拓いたことを述べています。

Zhengjian Yao, Yongzhi Li, Xinyuan Gao, Quan Chen, Peng Jiang, Yanye Lu2026-03-10💻 cs

Thinking with Gaze: Sequential Eye-Tracking as Visual Reasoning Supervision for Medical VLMs

この論文は、放射線科医の視覚的検索プロセスを捉えた時間順の視線追跡データを「視線トークン」として VLM に導入し、医療画像の視覚的推論を人間のように順序立てて行うことで、MIMIC-EYE などのベンチマークにおいて最先端の性能とドメイン外での頑健性を達成した手法を提案しています。

Yiwei Li, Zihao Wu, Yanjun Lv, Hanqi Jiang, Weihang You, Zhengliang Liu, Dajiang Zhu, Xiang Li, Quanzheng Li, Tianming Liu, Lin Zhao2026-03-10💻 cs

Mining Beyond the Bools: Learning Data Transformations and Temporal Specifications

本論文は、Syntax Guided Synthesis 技術と TSL $_f$ （Temporal Stream Logic の有限接頭辞解釈）を組み合わせることで、ブール値抽象化の限界を超え、データ変換と時制仕様を同時に学習し、より頑健かつ効率的にリアクティブプログラムを合成する手法を提案しています。

Sam Nicholas Kouteili, William Fishell, Christian Scaff, Mark Santolucito, Ruzica Piskac2026-03-10💻 cs

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

本論文は、大規模なツール環境において小規模言語モデル（SLM）がコンテキストの制御と実行構造を学習し、ルブリックに基づく強化学微細調整を通じて、パラメータやコンテキスト制約が厳しい条件下でも最先端のエージェントに匹敵する性能を発揮できるようにする「ATLAS」というフレームワークを提案するものである。

Karan Gupta, Pranav Vajreshwari, Yash Pandya, Raghav Magazine, Akshay Nambi, Ahmed Awadallah2026-03-10🤖 cs.LG

Dynamic Targeting of Satellite Observations Using Supplemental Geostationary Satellite Data and Hierarchical Planning

本論文は、静止衛星からの補足データを用いて長期計画を策定し、搭載センサーのデータで短期計画を微調整する階層的計画手法を提案することで、従来の動的目標指定システムが直面する制約を克服し、特に標的が疎に分布する動的なシナリオにおいて観測効率を最大 41% 向上させることを示しています。

Akseli Kangaslahti, Itai Zilberstein, Alberto Candela, Steve Chien2026-03-10💻 cs

ProtAlign: Contrastive learning paradigm for Sequence and structure alignment

本論文は、タンパク質の配列と構造の情報を対照学習を用いて統合し、両者の埋め込み空間を一致させることで、クロスモーダル検索や機能予測などの下流タスクの性能向上とタンパク質の理解・設計への新たな洞察を提供する「ProtAlign」というフレームワークを提案しています。

Aditya Ranganath, Hasin Us Sami, Kowshik Thopalli, Bhavya Kailkhura, Wesam Sakla2026-03-10🤖 cs.LG

UWPD: A General Paradigm for Invisible Watermark Detection Agnostic to Embedding Algorithms

この論文は、埋め込みアルゴリズムに依存せず画像の透かし有無を検出する新しいタスク「UWPD」を提案し、大規模データセット「UniFreq-100K」と、周波数帯域を動的に制御して透かし信号を抽出する「FSNet」モデルを開発することで、未知の透かしに対するゼロショット検出性能を大幅に向上させたことを示しています。

Xiang Ao, Yiling Du, Zidan Wang, Mengru Chen2026-03-10💻 cs

Bi Directional Feedback Fusion for Activity Aware Forecasting of Indoor CO2 and PM2.5

この論文は、人間の行動と環境要因の双方向フィードバック融合を活用して、室内の二酸化炭素と PM2.5 濃度を高精度かつ解釈可能に予測する新しいフレームワークを提案し、既存の手法を上回る性能を実証したものである。

Harshala Gammulle, Lidia Morawska, Sridha Sridharan, Clinton Fookes2026-03-10🤖 cs.LG

Regression Models Meet Foundation Models: A Hybrid-AI Approach to Practical Electricity Price Forecasting

本論文は、時系列基盤モデルが捉えた過去のパターンを予測特徴量として回帰モデルに注入する「FutureBoosting」という新しいハイブリッド AI 手法を提案し、電力価格予測の精度を大幅に向上させることを実証しています。

Yunzhong Qiu, Binzhu Li, Hao Wei, Shenglin Weng, Chen Wang, Zhongyi Pei, Mingsheng Long, Jianmin Wang2026-03-10🤖 cs.LG

Safe Transformer: An Explicit Safety Bit For Interpretable And Controllable Alignment

この論文は、事前学習済み言語モデルの層間に明示的な「安全ビット」を挿入するモジュール型アプローチ「Safe Transformer」を提案し、安全性判断の解釈性と手動制御を両立させながら、軽量な微調整のみで高い攻撃耐性を実現することを示しています。

Jingyuan Feng, Andrew Gambardella, Gouki Minegishi, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo2026-03-10🤖 cs.LG

Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds

この論文は、密度不変な観測エンコーディングと密度ランダム化トレーニング、および物理情報に基づく報酬設計を導入した強化学習アプローチを提案し、訓練時よりも高密度な混雑環境においても「凍結」や「衝突」を回避しつつ目標地点へ到達する汎用的なナビゲーションを実現するものです。

Jiefu Zhang, Yang Xu, Vaneet Aggarwal2026-03-10🤖 cs.LG

Calibrated Credit Intelligence: Shift-Robust and Fair Risk Scoring with Bayesian Uncertainty and Gradient Boosting

この論文は、ベイズ的不確実性の把握、公平性制約付き勾配ブースティング、シフト認識型融合戦略を統合した「Calibrated Credit Intelligence（CCI）」フレームワークを提案し、Home Credit のベンチマークにおいて、時間的分布のシフト下でも高い識別力、較正精度、公平性を同時に達成するcredit スコアリング手法を示しています。

Srikumar Nayak2026-03-10🤖 cs.LG

Agent Hunt: Bounty Based Collaborative Autoformalization With LLM Agents

この論文は、複数の LLM ベースのコーディングエージェントが、証明タスクに対して動的に提案や報酬（バウンティ）を設定し、証明アシスタントと直接対話しながら分散的に協力して代数トポロジーの大規模な自動形式化を実現する、市場原理に基づく新しいアプローチを提案するものである。

Chad E. Brown, Cezary Kaliszyk, Josef Urban2026-03-10💻 cs

Rank-Factorized Implicit Neural Bias: Scaling Super-Resolution Transformer with FlashAttention

この論文は、位置バイアスを低ランクの暗黙的ニューラル表現で近似する「ランク分解型暗黙的ニューラルバイアス（RIB）」を提案し、FlashAttention の利用を可能にすることで超解像トランスフォーマーの計算効率とスケーラビリティを飛躍的に向上させ、Urban100×2 で 35.63 dB の PSNR を達成しながらトレーニングおよび推論時間を大幅に短縮することを示しています。

Dongheon Lee, Seokju Yun, Jaegyun Im, Youngmin Ro2026-03-10🤖 cs.LG

ResearchEnvBench: Benchmarking Agents on Environment Synthesis for Research Code Execution

本研究は、研究用コードの実行に必要な複雑な環境構築を評価する新たなベンチマーク「ResearchEnvBench」を提案し、現状の最先端エージェントが依存関係の解決やバージョン管理において大きな課題を抱えていることを明らかにしました。

Yubang Wang, Chenxi Zhang, Bowen Chen, Zezheng Huai, Zihao Dai, Xinchi Chen, Yuxin Wang, Yining Zheng, Jingjing Gong, Xipeng Qiu2026-03-10💻 cs

ViroGym: Realistic Large-Scale Benchmarks for Evaluating Viral Proteins

本論文は、ウイルスタンパク質における変異効果の予測やワクチン候補の選定を支援するため、79 の深層変異スキャンアッセイと実世界のタスクを含む大規模なベンチマーク「ViroGym」を構築し、実験データを用いて選定されたタンパク質言語モデルが実世界の優勢な変異を予測する上で優れていることを示した。

Yichen Zhou, Jonathan Golob, Amir Karimi, Stefan Bauer, Patrick Schwab2026-03-10💻 cs

Heterogeneous Decentralized Diffusion Models

この論文は、異なる学習目的（DDPM と Flow Matching）を混在させて分散学習を可能にする効率的なフレームワークを提案し、従来の分散拡散モデルに比べて計算リソースとデータを大幅に削減しながら、より優れた生成品質と多様性を達成する手法を提示しています。

Zhiying Jiang, Raihan Seraj, Marcos Villagra, Bidhan Roy2026-03-10🤖 cs.LG

Improved Constrained Generation by Bridging Pretrained Generative Models

この論文は、物理法則や安全制約などの複雑な領域内で現実的なサンプルを生成するために、事前学習済み生成モデルを微調整して制約条件を遵守させる新しいフレームワークを提案し、既存手法とは異なる制約満足度とサンプリング品質の新たなトレードオフを示すものである。

Xiaoxuan Liang, Saeid Naderiparizi, Yunpeng Liu, Berend Zwartsenberg, Frank Wood2026-03-10🤖 cs.LG

Stabilizing Reinforcement Learning for Diffusion Language Models

この論文は、拡散言語モデルへの GRPO の直接適用で発生する報酬崩壊を、確率比推定に伴うノイズによる不安定性を解消する「StableDRL」という新しい手法と階段型アテンション機構によって解決し、拡散モデルの安定した強化学習を可能にすることを提案しています。

Jianyuan Zhong, Kaibo Wang, Ding Ding, Zijin Feng, Haoli Bai, Yang Xiang, Jiacheng Sun, Qiang Xu2026-03-10🤖 cs.LG

← 前へ次へ →