cs.AI 件の論文 | Gist.Science

VoiceSHIELD-Small: Real-Time Malicious Speech Detection and Transcription

この論文は、音声からテキストへの変換と有害な音声コマンドの検出をリアルタイムかつ単一ステップで実行し、高い精度と低遅延を実現する軽量モデル「VoiceSHIELD-Small」を提案するものである。

Sumit Ranjan, Sugandha Sharma, Ubaid Abbas, Puneeth N Ail2026-03-10💻 cs

YAQIN: Culturally Sensitive, Agentic AI for Mental Healthcare Support Among Muslim Women in the UK

本論文は、イギリスのムスリム女性向けに共同設計された文化的・信仰に配慮したAIチャットボット「YAQIN」の開発と評価を通じて、医療システムにおける文化的障壁を克服し、信頼とエンゲージメントを向上させる可能性を示しています。

Yasmin Zaraket, Céline Mougenot2026-03-10💻 cs

Rigidity in LLM Bandits with Implications for Human-AI Dyads

本論文は、LLM を二腕バンディット問題に適用した実験を通じて、モデルが報酬構造に関わらず位置順序や硬直な探索戦略に偏る決定バイアスを示し、学習率の低さと逆温度の高さという計算モデルで説明できることを明らかにし、これが人間-AI 協調における潜在的な課題を浮き彫りにしたことを述べています。

Haomiaomiao Wang, Tomás E Ward, Lili Zhang2026-03-10💻 cs

A Novel Multi-Agent Architecture to Reduce Hallucinations of Large Language Models in Multi-Step Structural Modeling

この論文は、大規模言語モデルの幻覚や誤り蓄積を軽減し、OpenSeesPy を用いた構造モデルの自動生成・解析の精度と効率を向上させるために、問題分析からコード変換までを分担する新しいマルチエージェント・アーキテクチャを提案し、20 のフレーム問題における高い成功率を実証したものである。

Ziheng Geng, Jiachen Liu, Ran Cao, Lu Cheng, Dan M. Frangopol, Minghui Cheng2026-03-10💻 cs

Large Language Model for Discrete Optimization Problems: Evaluation and Step-by-step Reasoning

本論文は、大規模なパラメータを含む多様な離散最適化問題を用いた評価を通じて、LLM の性能や CoT 手法の有効性を実証し、自動解決への提言と将来の研究基準を提供するものである。

Tianhao Qian, Guilin Qi, Z. Y. Wu, Ran Gu, Xuanyi Liu, Canchen Lyu2026-03-10💬 cs.CL

Hide and Find: A Distributed Adversarial Attack on Federated Graph Learning

この論文は、連合グラフ学習の脆弱性を突くため、学習時にデータを隠蔽的に変位させ、学習後にその情報を基に効率的に敵対的摂動を生成する「Hide and Find」方式の分散型敵対的攻撃手法「FedShift」を提案し、既存手法を上回る攻撃成功率と防御回避能力、および 90% 以上の時間削減を実現したことを示しています。

Jinshan Liu, Ken Li, Jiazhe Wei, Bin Shi, Bo Dong2026-03-10🤖 cs.LG

DECADE: A Temporally-Consistent Unsupervised Diffusion Model for Enhanced Rb-82 Dynamic Cardiac PET Image Denoising

本論文は、対照的なクリーン・ノイズデータの不足やトレーサーの急速な動態といった課題を克服し、教師なし拡散モデル「DECADE」を用いて、Rb-82 心臓 PET 画像の時間的一貫性を保ちながらノイズを低減し、定量的な精度を維持する手法を提案しています。

Yinchi Zhou, Liang Guo, Huidong Xie, Yuexi Du, Ashley Wang, Menghua Xia, Tian Yu, Ramesh Fazzone-Chettiar, Christopher Weyman, Bruce Spottiswoode, Vladimir Panin, Kuangyu Shi, Edward J. Miller, Attila Feher, Albert J. Sinusas, Nicha C. Dvornek, Chi Liu2026-03-10💻 cs

QuadAI at SemEval-2026 Task 3: Ensemble Learning of Hybrid RoBERTa and LLMs for Dimensional Aspect-Based Sentiment Analysis

この論文は、ハイブリッド RoBERTa エンコーダと大規模言語モデル（LLM）の予測レベルにおけるアンサンブル学習を組み合わせることで、多次元アスペクトベースの感情分析タスクにおける RMSE の大幅な削減と相関スコアの向上を達成したシステムを提案しています。

A. J. W. de Vink, Filippos Karolos Ventirozos, Natalia Amat-Lefort, Lifeng Han2026-03-10💬 cs.CL

ProgAgent:A Continual RL Agent with Progress-Aware Rewards

本論文は、ラベル付けされていない専門家動画からタスクの進捗を推定して報酬を学習し、敵対的更新と高速な JAX 基盤を統合することで、連続学習における忘却を抑制し、複雑な操作タスクの習得を可能にする「ProgAgent」という強化学習エージェントを提案しています。

Jinzhou Tan, Gabriel Adineera, Jinoh Kim2026-03-10🤖 cs.LG

Dual-Metric Evaluation of Social Bias in Large Language Models: Evidence from an Underrepresented Nepali Cultural Context

本論文は、ネパールという未代表文化圏における大規模言語モデルの社会的バイアスを評価する「二重指標評価（DMBA）」フレームワークを提案し、明示的な同意バイアスと暗黙的な生成バイアスの間に強い相関がないこと、および温度パラメータやドメインによってバイアスの現れ方が異なることを実証しています。

Ashish Pandey, Tek Raj Chhetri2026-03-10💬 cs.CL

Learning embeddings of non-linear PDEs: the Burgers' equation

本論文は、物理情報ニューラルネットワーク（PINN）に多ヘッド構造と主成分分析を組み合わせることで、粘性バース方程式の解空間を低次元の埋め込み空間として効率的に表現し、その物理的解釈性を保ちながら主要なダイナミクスを捉える手法を提案するものである。

Pedro Tarancón-Álvarez, Leonid Sarieddine, Pavlos Protopapas, Raul Jimenez2026-03-10🤖 cs.LG

HybridStitch: Pixel and Timestep Level Model Stitching for Diffusion Acceleration

この論文は、拡散モデルの生成プロセスを「編集」と見なし、画像の難易度に応じて大規模モデルと小規模モデルをピクセルおよびタイムステップレベルでハイブリッドに組み合わせることで、Stable Diffusion 3 において既存の手法を上回る 1.83 倍の高速化を実現する「HybridStitch」という新たな手法を提案しています。

Desen Sun, Jason Hon, Jintao Zhang, Sihang Liu2026-03-10💻 cs

Column Generation for the Micro-Transit Zoning Problem

本論文は、オンデマンド・マイクロトランジットのゾーニング問題を、候補ゾーンの個数制限ではなくグローバルな予算制約下で一般化し、列生成法と価格付けヒューリスティクスを用いて効率的に解く新たな枠組みを提案し、主要な米都市での数値実験によりその有効性を示しています。

Hins Hu, Rishav Sen, Jose Paolo Talusan, Abhishek Dubey, Aron Laszka, Samitha Samaranayake2026-03-10🔢 math

Gradient Iterated Temporal-Difference Learning

本論文は、移動目標の勾配を計算することで半勾配法と競合する学習速度を実現し、Atari ゲームなど多様なベンチマークで勾配 TD 法の学習速度と安定性を両立させた「Gradient Iterated Temporal-Difference learning」を提案し、その有効性を示したものである。

Théo Vincent, Kevin Gerhardt, Yogesh Tripathi, Habib Maraqten, Adam White, Martha White, Jan Peters, Carlo D'Eramo2026-03-10🤖 cs.LG

AI Misuse in Education Is a Measurement Problem: Toward a Learning Visibility Framework

この論文は、教育における AI 誤用を「検出」の問題ではなく、学習プロセスの可視性欠如という「測定」の問題として再定義し、監視ではなく透明性とプロセスの可視化を重視する「学習可視性フレームワーク」を提案しています。

Eduardo Davalos, Yike Zhang2026-03-10💻 cs

DistillGuard: Evaluating Defenses Against LLM Knowledge Distillation

本論文は、DistillGuard というフレームワークを用いて LLM の知識蒸留に対する出力レベルの防御策を体系的に評価した結果、現在の防御手法はタスク依存性が強く、特に単純な攻撃者に対しては広範な知識窃取を防ぐには不十分であることを示しています。

Bo Jiang2026-03-10💬 cs.CL

AI Steerability 360: A Toolkit for Steering Large Language Models

IBM が公開した「AI Steerability 360」は、プロンプト、構造、状態、出力の 4 つの制御面を統一的なパイプラインで操作し、複数の手法を組み合わせることで大規模言語モデルの制御と評価を容易にするオープンソースの Python ツールキットです。

Erik Miehling, Karthikeyan Natesan Ramamurthy, Praveen Venkateswaran, Irene Ko, Pierre Dognin, Moninder Singh, Tejaswini Pedapati, Avinash Balakrishnan, Matthew Riemer, Dennis Wei, Inge Vejsbjerg, Elizabeth M. Daly, Kush R. Varshney2026-03-10💬 cs.CL

Intentional Deception as Controllable Capability in LLM Agents

この論文は、LLM エージェント間の対話における意図的な欺瞞を体系的に研究し、事実確認防御では見逃されがちな「誤導（真実の戦略的枠組み）」が主要な攻撃手法であり、特に特定の行動プロファイルや動機を標的とした攻撃が効果的であることを明らかにしています。

Jason Starace, Terence Soule2026-03-10💻 cs

SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans

この論文は、強化学習単独では不十分な探索行動を改善するため、合成されたツール使用軌道を用いて冷たいスタート時の教師あり微調整を強化し、深層研究における探索を促進する「SynPlanResearch-R1」というフレームワークを提案し、複数のベンチマークで最先端の性能向上を実現したことを報告しています。

Hansi Zeng, Zoey Li, Yifan Gao, Chenwei Zhang, Xiaoman Pan, Tao Yang, Fengran Mo, Jiacheng Lin, Xian Li, Jingbo Shang2026-03-10💬 cs.CL

Slumbering to Precision: Enhancing Artificial Neural Network Calibration Through Sleep-like Processes

この論文は、生物学的な睡眠と記憶の再活性化に着想を得た「睡眠リプレイ統合（SRC）」という手法を提案し、教師あり再学習なしに人工ニューラルネットワークの過信問題を解決し、信頼性の高い確率推定を実現することを示しています。

Jean Erik Delanois, Aditya Ahuja, Giri P. Krishnan, Maxim Bazhenov2026-03-10🤖 cs.LG

← 前へ次へ →